离散值特征分析
算子简介
离散值特征分析统计离散特征的分布情况。
指标包括gini,entropy,gini gain,information gain,information gain ratio等。
计算每个离散值对应的gini,entropy,计算单列对应的gini gain,information gain,information gain ratio。
仅支持通过可视化方式,配置读取该组件参数。
可视化参数
参数详情如下表所示:
页签 | 参数 | 参数名称 | 是否必选 | 参数描述 | 默认值 |
---|---|---|---|---|---|
数据源 | 表名 | inputTable | 是 | 数据表 | 无 |
参数 | 标签列 | labelColName | 是 | 标签字段。 | 无 |
参数 | 特征列 | featureColNames | 是 | 用来表现训练样本数据特征的列。 | 无 |
可视化展示
添加该算子节点,填写相关参数。
【选择标签列】: 点击【编辑列】,选择目标的标签列。 【选择相关特征列】: 点击【编辑列】,选择需要与目标列相计算的特征列,可以选择多个变量。
点击【运行】,执行该算子节点。
运行结果展示
点击右侧【运行结果】,查看结果数据。