说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210934559.6 (22)申请日 2022.08.04 (71)申请人 上海普茅数据科技有限公司 地址 201306 上海市浦东 新区临港新片区 环湖西二路8 88号 (72)发明人 金丽伟  (51)Int.Cl. G06F 30/27(2020.01) G06F 16/215(2019.01) G06N 5/00(2006.01) G06N 20/00(2019.01) (54)发明名称 一种高级建模的数据分析方法 (57)摘要 本发明公开了一种高级建模的数据分析方 法, 具体步骤如下: 确定目标变量及建模目的; 确 定影响因子, 收集历史数据, 并进行数据清洗; 确 定建模目的, 如果建模目标为筛选因子, 通过高 级建模中的随机森林方法可以做到广泛筛选; 如 果建模目的为预测响应目标值, 利用传统方法可 能会受因子相互作用的影 响, 同样可以利用高级 建模中的随机森 林方法; 通过响应刻画器得到显 著因子的最佳组合参数, 确保按照最佳条件进行 生产能获得预期效果; 将得到的因子范围内进行 试生产, 得到 数值, 并进行记录。 本方法用于 预测 分析以及发现变量之间的线性 或非线性关系, 可 根据输入、 输出的类型不同而有选择型建模, 同 时对建模结果给出 更加精准 解释。 权利要求书1页 说明书3页 附图1页 CN 115422825 A 2022.12.02 CN 115422825 A 1.一种高级建模的数据分析 方法, 其特 征在于: 具体步骤如下: 步骤一、 确定目标变量及建模目的; 步骤二、 确定影响因子, 收集历史数据, 并进行 数据清洗; 步骤三、 确定建模目的, 如果建模目标为筛选因子, 通过高级建模中的随机森林方法可 以做到广泛筛 选; 步骤四、 如果建模目的为预测响应目标值, 利用 传统方法可能会受因子相互作用的影 响, 同样可以利用高级建模中的随机森林 方法; 步骤五、 通过响应刻画器得到显著因子的最佳组合参数, 确保按照最佳条件进行生产 能获得预期效果; 步骤六、 在步骤五得到的因子范围内进行 试生产, 得到数值, 并进行记录 。 2.根据权利要求1所述的一种高级建模的数据分析方法, 其特征在于: 所述步骤三中的 随机森林方法是随机森林集成决策树, 利用交叉验证法随机抽取一部 分样本放入随机森林 模型中进行建模、 学习, 剩下的样本进行验证。 3.根据权利要求1所述的一种高级建模的数据分析方法, 其特征在于: 所述步骤四中利 用随机森林方法集成决策树, 每一棵决策树以信息熵为度量构造一颗熵值下降最快的方 式, 如集成5 000棵树, 则对5 000次建模结果进行简单平均, 从而得到对自然宽展的预测值。 4.根据权利要求1所述的一种高级建模的数据分析方法, 其特征在于: 所述步骤五中在 最佳因子组合的基础上, 设定因子的参数的波动范围, 利用模拟 器进行范围模拟, 查看响应 的变化区间; 根据区间的可接受程度, 修改因子的波动范围。权 利 要 求 书 1/1 页 2 CN 115422825 A 2一种高级建模的数据分析方 法 技术领域 [0001]本发明涉及高级建模技 术领域, 具体为 一种高级建模的数据分析 方法。 背景技术 [0002]高级建模, 也称高阶建模、 机器学习建模、 深度学习建模, 可以解决问题、 揭示可能 性并在不确定的环境中做出科学 的决定。 通过高级建模可以有效地应用统计结果, 深入了 解具体信息、 制 定长远计划并获得持续学习和改进的方法。 高级建模有助于挖掘内在协同 关系, 无论目标 是描述, 预测, 还是说明。 [0003]高级建模为回归分析提供了一系列更完善 的方法; 为探索方法、 减少 数据维度和 建模、 时间序列和分类数据的分析提供了更有效的多 元工具。 此外, 高级建模还 具有一系列 处理前期常见数据问题的建模工具, 纳入了大量高级算法, 用于对杂乱的数据进行更好地 建模。 [0004]高级建模, 不仅可以快速、 正确地完成建模, 还可以轻松比较和对比使用不同方法 构建的模 型, 通过可视化和交互式的报表, 可以直观展示数据分析结果。 现有的高级建模方 法存在很多缺陷, 具体为: 1、 功能单一, 运用领域片面; 2、 在 多个因子具有多重共线性时, 建 模结果不准确; 3、 当因子与响应之 间的关系为 非线性时, 模型结果无法解释; 4、 响应为分类 型变量时, 传统建模方法无法进行预测; 5、 模型精准度不高, 评价指标单一; 为此提供了一 种高级建模的数据分析 方法。 发明内容 [0005]本发明的目的是针对现有技术的缺陷, 提供一种高级建模的数据分析方法, 以解 决上述背景技 术提出的问题。 [0006]为实现上述目的, 本 发明提供如下技术方案: 一种高级 建模的数据分析方法, 具体 步骤如下: [0007]步骤一、 确定目标变量及建模目的; [0008]步骤二、 确定影响因子, 收集历史数据, 并进行 数据清洗; [0009]步骤三、 确定建模目的, 如果建模目标为筛选因子, 通过高级建模中的随机森林方 法可以做到广泛筛 选; [0010]步骤四、 如果建模 目的为预测 响应目标值, 利用传统方法可能会受因子相互作用 的影响, 同样可以利用高级建模中的随机森林 方法; [0011]步骤五、 通过响应刻画器得到显著因子 的最佳组合参数, 确保按照最佳条件进行 生产能获得 预期效果; [0012]步骤六、 在步骤五得到的因子范围内进行 试生产, 得到数值, 并进行记录 。 [0013]作为本发明的一种优选技术方案, 所述步骤三中的随机森林方法是随机森林集成 决策树, 利用交叉验证法随机抽取一部 分样本放入随机森林模 型中进行建模、 学习, 剩下的 样本进行验证。说 明 书 1/3 页 3 CN 115422825 A 3

.PDF文档 专利 一种高级建模的数据分析方法

文档预览
中文文档 6 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种高级建模的数据分析方法 第 1 页 专利 一种高级建模的数据分析方法 第 2 页 专利 一种高级建模的数据分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:04:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。