向导式建模

DTEmpower是由天洑软件自主研发的一款通用的智能数据建模软件,致力于帮助工程师及工科专业学生,利用工业领域中的仿真、试验、测量等各类数据进行挖掘分析,建立高质量的数据模型,实现快速设计评估、实时仿真预测、系统参数预警、设备状态监测等工程应用。软件内置有图形化、零编码的数据分析建模环境,围绕数据清理、特征生成、敏感性分析和模型训练等环节提供丰富的AI算法,提供从模型搭建到模型管理应用的一站式解决方案,学习门槛低、模型质量高,零基础用户也能快速挖掘得到优秀的数据模型。

一、案例描述 

图形化的建模方法需要通过节点拖拽的方式搭建建模流程,并且通常需要对单个建模节点的参数进行多次调试,重复运行。与图形化建模方式不同的是,向导式建模默认配置一套完整的建模流程供用户使用,并且支持对流程中多个节点参数一键式的组合调试,非常便于用户开展数据分析和建模工作。

本案例中的数据集为某风机制造厂商提供的结构应力评估数据集,目标是快速评估测点的结构应力。数据集中包含15维输入(V1~V15)和27维输出(EQV1~EQV27),以其中两个输出为例通过向导式建模建立输入输出之间的回归映射模型。

二、操作流程 

1)新建项目

双击打开DTEmpower软件,即可进入到如图1所示的界面。单击新建项目,即可创建一个临时项目文件,需要注意的是,临时创建的项目文件不会自动保存。如果想要保存项目文件,用户可以进入到项目中选择“文件-保存”,就可以保存工程文件到自己想要的指定位置。

图片 1.png

图1 新建项目

2)添加数据集 

新建项目之后,即会进入到DTEmpower的工程主页面,如图2所示。

图片 2.png

图2 工程主页

 进入工程主页之后,点击“导入数据”,即跳出数据集文件上传窗口。点击窗口中的“选择文件”按钮,即可选择本地磁盘中的数据文件加载至当前项目中,如图3所示。

图片 3.png

图3 上传原始数据

数据集添加完成后即出现在左侧的资源菜单中,如图4所示。

图片 4.png

图4 数据集上传结果

3)搭建向导式建模流程

通过数据视图右上方的“数据建模”按钮,进入向导式建模的入口,如图5所示。

1696755074342.jpg

图5 向导式建模入口

弹出数据建模窗口后,在向导模式中选择风力机强度数据集,目标变量设置为EQV1,并用回归训练的方式拟合目标变量和输入变量的映射关系,如图6所示。

图片 6.png

图6 向导式建模入口配置

配置好向导模式后点击确定按钮就完成了向导式建模的流程搭建,如图7所示。

图片 7.png

图7 向导式建模流程搭建完成

4)建模流程配置

在开始模型训练之前用户可以自由配置建模流程中的各个环节,如图8所示,点击配置按钮,即可进入向导式建模的流程配置。

图片 8.png

图8 向导式建模流程配置入口

如图9所示为向导式建模的配置面板,包括基础配置、特征工程和模型配置三部分内容。

图片 9.png

图9 向导式建模流程配置面板

5)基础配置

基础配置包括建模模板、目标变量和训练等级三部分。其中建模模板为向导式建模入口配置时所设定,在设置目标变量时可以添加新的变量或删除已设置的变量。并且向导式建模提供了两个训练等级,为方便起见,本案例中选择快速的模型训练方式。

图片 10.png

图10 向导式中的两个训练等级

6)特征工程配置

特征工程配置包括特征处理、异常点清理、敏感性分析、数据降维和数据变换。本案例中通过特征处理将模型的输入变量设置为V1~V15,输出变量设置为EQV1,如图11所示。

图片 11.png

图11 特征处理示意图

如图12所示,本案例中异常点清理比例配置为5%,并设置快速粗筛的异常点识别等级。

图片12.png

图12 异常点清理配置

敏感性分析可使用户选择对目标变量重要性最大的若干个特征进行后续的建模,如图13所示,本案例中选择了重要性最大的5个、8个和12个特征。

图片 13.png

图13 敏感性分析配置

数据降维是特征选择后对输入数据的进一步压缩提纯,如图14所示,本案例开启数据降维后选择线性降维的方法,并指定累计贡献率作为降维的标准,对输入特征进行压缩。

图片 14.png

图14 数据降维配置

数据降维后可进行数据变换的配置,如图15所示,本案例分别对输入变量和输出变量进行Z-score和Robust变换。

图片 15.png

图15 数据变换配置

7)模型配置

模型配置包括训练测试集划分、算法选择、精度指标和优化配置4部分内容。本案例中的训练测试集来自同一份数据集,因此数据集来源选择基于同一数据集拆分,测试集占比配置为默认的25%。

图片 16.png

图16 训练/测试集配置

训练算法选择默认的基础线性回归和梯度提升决策树两种算法,精度指标和优化配置都选用默认配置。配置完成之后点击保存按钮。

8)模型训练和结果查看

建模流程配置完成之后点击训练按钮,如图17,即可开始模型的训练。

图片 17.png

图17 开启模型训练

模型训练完成之后,向导式建模会以图表的形式向用户展示模型的评价指标。如图18展示了EQV1目标变量的建模评价结果,线性回归模型的R2指标在0.2左右,而GBDT模型的R2指标在0.4左右,说明适合用非线性模型建立EQV1目标变量和输入变量之间的映射关系。

图片 18.png

图18 查看建模结果

至此,已经完成了向导式建模的流程搭建和模型训练,后续可通过优化配置等选项进一步提高模型精度。


XML 地图 | Sitemap 地图

糖果派对6163银河