编码-onehot
算子简介
one-hot编码,也称独热编码,对于每一个特征,如果它有m个可能值,那么经过独热编码后,就变成了m个二元特征。
此外,这些特征互斥,每次只有一个激活。因此,经过独热编码后数据会变成稀疏的,输出结果也是KV的稀疏结构。
仅支持通过可视化方式,配置读取该组件参数。
可视化参数
参数详情如下表所示:
页签 | 参数 | 参数名称 | 是否必选 | 参数描述 | 默认值 |
---|---|---|---|---|---|
数据源 | 表名 | inputTable | 是 | 数据表 | 无 |
参数 | 选择特征列 | selectedColNames | 是 | 输入表选择列名类型 | 无 |
可视化展示
添加该算子节点。
点击【编辑列】,选择需要进行编码的目标列。
点击【确定】,执行【运行】按钮,运行该节点。
运行结果展示
点击右侧【运行结果】,查看结果数据。
输出结果仅为该目标属性的参数,若需要使用,则后边需要利用【矩阵合并】节点进行参数矩阵合并。