Skip to main content
Version: 2.17.1

缺失值填充

算子简介

通过给定一个缺失值的配置列表,来实现将输入表的缺失值用指定的值来填充。

仅支持通过可视化方式,配置读取该组件参数。

可视化参数

参数详情如下表所示:

页签参数参数名称是否必选参数描述默认值
数据源表名inputTable数据表
参数选择特征列selectedColNames输入表选择列名类型
参数替换函数replace_type替换函数,可选max/min/mean如果为自定义值则无需填写该字段。
参数替换自定义值replace_value自定义值,可以为数值或字符串

可视化展示

1.首先,进行缺失值填充时,先检测数据是否存在数据缺失的状态。添加【统计分析】模块的【缺失值检测】算子,无需添加任何参数,对上游节点输出的矩阵数据进行缺失值检测。

2.然后点击【运行】按钮。

缺失值填充1

3.点击该节点的【运行结果】,查看缺失值情况。

4.基于检测到缺失值的基础上,进行缺失值补充。

5.添加【缺失值填充】算子节点。

缺失值填充3

6.填写相关参数。

  • 选择目标特征列:点击【编辑列】,选择需要进行缺失值填充的参数key;
  • 选择缺失值:若为数值型,可以选择max/min/mean/自定义参数;若为字符型,仅支持自定义参数填充。

缺失值填充4

7.点击【运行】按钮,执行当前该节点。

缺失值填充5

运行结果展示

点击【运行结果】,进行运行结果查看。

缺失值填充6