K-nn(RapidMiner Studio Core)
概要
该操作员生成了一个k-neartind邻居模型,该模型用于分类或回归。描述
k-nearest邻居算法基于将未知示例与k训练示例是未知示例的最近邻居。
在新示例中应用k-neartiment算法应用的第一步是找到最接近的训练示例。“紧密度”是根据n维空间中的距离定义的,这是由训练示例中的n个属性定义的。
不同的度量标准,例如欧几里得距离,可用于计算未知示例和训练示例之间的距离。由于距离通常取决于绝对值,因此建议在训练和应用K-Nearest邻居算法之前对数据进行标准化。使用的度量及其确切配置由操作员的参数定义。
在第二步中,k-near最邻居算法通过发现的邻居的多数投票对未知示例进行了分类。在回归的情况下,预测值是发现邻居的值的平均值。
加重邻居的贡献可能是有用的,因此,邻居对平均水平的贡献要比较远的贡献更大。