Skip to main content
Version: 2.17.1

编码-onehot

算子简介

one-hot编码,也称独热编码,对于每一个特征,如果它有m个可能值,那么经过独热编码后,就变成了m个二元特征。

此外,这些特征互斥,每次只有一个激活。因此,经过独热编码后数据会变成稀疏的,输出结果也是KV的稀疏结构。

仅支持通过可视化方式,配置读取该组件参数。

可视化参数

参数详情如下表所示:

页签参数参数名称是否必选参数描述默认值
数据源表名inputTable数据表
参数选择特征列selectedColNames输入表选择列名类型

可视化展示

  1. 添加该算子节点。

  2. 点击【编辑列】,选择需要进行编码的目标列。

    编码-onehot1

  3. 点击【确定】,执行【运行】按钮,运行该节点。

    编码-onehot2

运行结果展示

点击右侧【运行结果】,查看结果数据。

编码-onehot3

输出结果仅为该目标属性的参数,若需要使用,则后边需要利用【矩阵合并】节点进行参数矩阵合并。