缺失值填充
算子简介
通过给定一个缺失值的配置列表,来实现将输入表的缺失值用指定的值来填充。
仅支持通过可视化方式,配置读取该组件参数。
可视化参数
参数详情如下表所示:
页签 | 参数 | 参数名称 | 是否必选 | 参数描述 | 默认值 |
---|---|---|---|---|---|
数据源 | 表名 | inputTable | 是 | 数据表 | 无 |
参数 | 选择特征列 | selectedColNames | 是 | 输入表选择列名类型 | 无 |
参数 | 替换函数 | replace_type | 否 | 替换函数,可选max/min/mean | 如果为自定义值则无需填写该字段。 |
参数 | 替换自定义值 | replace_value | 否 | 自定义值,可以为数值或字符串 | 无 |
可视化展示
1.首先,进行缺失值填充时,先检测数据是否存在数据缺失的状态。添加【统计分析】模块的【缺失值检测】算子,无需添加任何参数,对上游节点输出的矩阵数据进行缺失值检测。
2.然后点击【运行】按钮。
3.点击该节点的【运行结果】,查看缺失值情况。
4.基于检测到缺失值的基础上,进行缺失值补充。
5.添加【缺失值填充】算子节点。
6.填写相关参数。
- 选择目标特征列:点击【编辑列】,选择需要进行缺失值填充的参数key;
- 选择缺失值:若为数值型,可以选择max/min/mean/自定义参数;若为字符型,仅支持自定义参数填充。
7.点击【运行】按钮,执行当前该节点。
运行结果展示
点击【运行结果】,进行运行结果查看。