音讯 什么是k均值聚类? -技术百科的定义

什么是k均值聚类? -技术百科的定义

目录:

Anonim

定义-K-均值聚类是什么意思?

K-均值聚类是一种简单的无监督学习算法,用于解决聚类问题。 它遵循一个简单的过程,将给定数据集分类为多个簇,簇由字母“ k”定义,该簇预先固定。 然后将聚类定位为点,然后将所有观测值或数据点与最近的聚类相关联,进行计算,调整,然后使用新的调整过程重新开始,直到获得所需的结果。

K-均值聚类在搜索引擎,市场细分,统计甚至天文学中都有使用。

Techopedia解释了K-Means聚类

K均值聚类是一种用于聚类分析的方法,尤其是在数据挖掘和统计中。 它旨在将一组观测值划分为多个聚类(k),从而将数据划分为Voronoi单元。 可以将其视为找出某个对象真正属于哪个组的方法。

它主要用于统计,几乎可以应用于任何研究领域。 例如,在营销中,它可以用于将不同的人口统计信息分组为简单的组,从而使营销人员更容易定位。 天文学家用它来筛选大量的天文数据。 由于他们无法一一分析每个对象,因此他们需要一种统计地找到兴趣点进行观察和调查的方法。

算法:

  1. 将K点放置在代表初始质心组的对象数据空间中。
  2. 每个对象或数据点都分配给最接近的k。
  3. 分配所有对象后,将重新计算k个质心的位置。
  4. 重复步骤2和3,直到质心的位置不再移动。
什么是k均值聚类? -技术百科的定义