DIY图像压缩——机器学习实战之K-means 聚类图像压缩:色彩量化
更多深度文章,请关注:https://yq.aliyun.com/cloud 作者: ML bot2 这篇文章是K均值聚类算法(K-means clustering)的一个简单应用:压缩图像。 在彩色图像中,每个像素的大小为3字节(RGB),可以表示的颜色总数为256 * 256 * 256。下图为1280 x 720像素的图像,采用PNG格式(一种无损压缩技术),大小为1.71 MB。 我们的目标是使用颜色量化进一步压缩图像,尽管压缩过程会有损失。 K均值聚类 这是一种在给定的数据点集合中找到“K”个簇的优化算法。最初,它随机分配K个簇中心,然后基于一些距离度量(例如,欧几里得距离),使来自簇中心的数据点的距离之和最小化。K均值聚类算法有两个步骤: a)分配 - 将每个数据点分配给离中心距离最近的簇。 b)更新 - 从指定给新簇的数据点计算新的均值(质心)。 为了描述K均值聚类算法前后的区别,请看下面这个例子(K=3)。 在图像压缩问题中,K均值聚类算法会把类似的颜色分别放在K个簇中——也就是说,每个簇的颜色都变成了一种。因此,我们只需要保留每个像素的标签(表明该像素在哪个簇中),以...

