Skip to main content
Version: 2.17.1

离散值特征分析

算子简介

离散值特征分析统计离散特征的分布情况。

指标包括gini,entropy,gini gain,information gain,information gain ratio等。

计算每个离散值对应的gini,entropy,计算单列对应的gini gain,information gain,information gain ratio。

仅支持通过可视化方式,配置读取该组件参数。

可视化参数

参数详情如下表所示:

页签参数参数名称是否必选参数描述默认值
数据源表名inputTable数据表
参数标签列labelColName标签字段。
参数特征列featureColNames用来表现训练样本数据特征的列。

可视化展示

  1. 添加该算子节点,填写相关参数。

    【选择标签列】: 点击【编辑列】,选择目标的标签列。 【选择相关特征列】: 点击【编辑列】,选择需要与目标列相计算的特征列,可以选择多个变量。

    离散值特征分析1

  2. 点击【运行】,执行该算子节点。

    离散值特征分析2

运行结果展示

点击右侧【运行结果】,查看结果数据。

离散值特征分析3