インテル® DAAL プログラミング・ガイド

K 平均法

K 平均法は、最もポピュラーで最も単純なクラスタリング手法の 1 つです。クラスター内の特徴ベクトルが別のクラスターの特徴ベクトルよりも互いに類似性が高い少数のクラスターにデータセットを分割するように意図されています。各クラスターは、セントロイド (中心) と呼ばれる代表点とクラスターの半径により特徴付けられます。

つまり、このクラスタリング手法は、データセット全体の解析をクラスターの解析にします。

類似性とセントロイドの基準を定義する方法はいくつかあります。K 平均法では、セントロイドはクラスター内の特徴ベクトルの平均値として定義されます。