
上QQ阅读APP看书,第一时间看更新
5.4 代码介绍
本节给出K-Means算法的核心函数,主要包括K-Means的训练函数及其中用于度量两点距离的函数。
5.4.1 K-Means训练的函数代码
训练函数是算法核心思想的体现。除了数据以外,最主要的核心参数是需要事先指定聚类的类别数,下面先给出K-Means训练函数的代码。


5.4.2 计算距离矩阵的函数代码
在K-Means算法中需要反复计算每两个点之间的距离,虽然度量距离的方法不止一种,但欧氏距离是最常用的一种,DistMatrix是两个样本点的欧氏距离计算函数,下面给出具体代码。


5.4.3 分析模型的代码
本节以鸢尾花数据为例,运用K-Means算法尝试做一次案例研究。鸢尾花数据有3个类别4个属性,运用K-Means聚类以后,简单对数据集的前两个属性可视化,来观察聚类效果,以下是调用K-Means算法和可视化的主函数代码。
