Version: 2.17.1

K均值聚类

页签	参数	参数名称	是否必选	参数描述	默认值
数据源	表名	inputTable	是	数据表	无
默认参数	选择特征列	selectedColNames	是	输入表中选择特征列名类型。	无
模型参数	聚类数	n_clusters	是	生成的聚类数。	2
模型参数	最大迭代数	max_iter	是	执行一次k-means算法所进行的最大迭代数。	300
调优参数	初始化次数	n_init	是	用不同的聚类中心初始化值运行算法的次数，最终解是在inertia意义下选出的最优结果。	10
调优参数	初始化方法	init	是	指定初始化方法包含k-means++和random。有三个可选值：k-means++，random或者ndarray向量。k-means++用一种特殊的方法选定初始聚类中发，可加速迭代过程的收敛。random随机从训练数据中选取初始质心。如果传递的是一个ndarray，则应该形如 (n_clusters, n_features) 并给出初始质心。	k-means++
调优参数	收敛误差	tol	是	与inertia结合来确定收敛条件。	0.0001
调优参数	初始化质心	random_state	是	可选用于初始化质心的生成器。如果值为一个整数，则确定一个seed。此参数默认值为numpy的随机数生成器。	1
调优参数	是否不改变原数据	copy_x	是	设为True，则原始数据不会被改变。设为False，则会直接在原始数据上做修改并在函数返回值时将其还原。	True