Kmeans算法的应用实例，Matlab版本 - KK4SBB

2024-04-26 02:42•移动端•阅读 2481

Kmeans算法的应用实例（Matlab版本）

K-means是一种经典的聚类算法，是十大经典数据挖掘算法之一。K-means算法的基本思想是：以空间中k个点为中心进行聚类，对最靠近他们的对象归类。通过迭代的方法，逐次更新各聚类中心的值，直至得到最好的聚类结果。

假设要把样本集分为c个类别，算法描述如下：

　　（1）适当选择c个类的初始中心；

　　（2）在第k次迭代中，对任意一个样本，求其到c个中心的距离，将该样本归到距离最短的中心所在的类；

　　（3）利用均值等方法更新该类的中心值；

　　（4）对于所有的c个聚类中心，如果利用（2）（3）的迭代法更新后，值保持不变，则迭代结束，否则继续迭代。

　　该算法的最大优势在于简洁和快速。算法的关键在于初始中心的选择和距离公式。

K-means算法的应用之一就是图像的压缩。假设有一张1600*2400大小的RGB图，那么需要1600*2400*3字节的空间来存放每个像素的三个通道值。如果这是一张颜色单调的图片，我们就可以把颜色相近的像素点归类，用同一组RGB值来表示他们，把这组RGB值放入调色板的x位置，原图片中属于这一聚类的像素点只需要保存x值，然后根据x值到调色板查找RGB值。如果把一张图片的所有颜色聚成256个类，那么只需要1600*2400*1个字节来保存每个像素的调色板索引值，和256*3个字节保存调色板。尽管这一过程会使照片的色彩略有失真，但是它可以大大节省存储空间。

下面是k-means算法的Matlab代码。图片的像素按照RGB值被归为10个聚类，分别是原图像和聚类后的图像。如果增加聚类的个数，图像的效果会有所改善。