インテル® DAAL プログラミング・ガイド

詳細

次元 pn 特徴ベクトルのセット Xx1= (x11,…,x1p), ..., xn= (xn1,…,xnp) で、データが不完全か、欠測値があるときに、根本的な分散のパラメーターの最尤推定を見つけます。

一般的な形式の期待値最大化 (EM) アルゴリズム

X をパラメーター θ に応じて対数尤度 l(θ; X) になる観測値とします。Xm を潜在値または欠測値とすると、T=(X, Xm) は対数尤度 l0 (θ; X) の完全なデータです。一般的な形式の問題を解くアルゴリズムは、次の EM アルゴリズム ([Dempster77]、[Hastie2009]) です。

  1. パラメーター θ(0) の初期値を選択します。

  2. 期待値ステップ: j 番目のステップで、Q (θ', θ(j)) = E (l0 (θ'; T)|X, θ(j)) を仮引数 θ' の関数として計算します。

  3. 最大化ステップ: j 番目のステップで、θ' に対する Q(θ', θ(j)) を最大化して、新しい推定 θ(j+1) を計算します。

  4. 収束するまでステップ 23 を繰り返します。

ガウス混合モデル用 EM アルゴリズム

ガウス混合モデル (GMM) は、以下のように表現される kd 次元多変量ガウス分布の混合モデルです。

ここで、Σki = 1αi = 1 および αi ≥ 0。

p( x|θi ) は、パラメーター θi = (mi , Σi) の確率密度関数です。ここで、mi は平均値ベクトル、Σi は分散共分散行列です。d 次元多変量ガウス分布の確率密度関数は、次のように定義されます。


zij = I{xi belongs to j mixture component} を指示関数、θ=(α1, ..., αk ; θ1, ..., θk) とします。

次のように重みを定義します。

i=1, ..., nj=1, …, k

GMM の EM アルゴリズムには以下のステップが含まれます。

  1. パラメーターの初期値を選択します。


  2. 期待値ステップ: j 番目のステップで、行列 W = (wij)nxk を重み wij で計算します。

  3. 最大化ステップ: j 番目のステップで、r=1, ..., k について以下の項目を計算します。

    1. 混合重み

      ここで、

      は、r 番目の混合コンポーネントに割り当てられる特徴ベクトルの量 (amount)。

    2. 平均値推定


    3. 共分散推定


      サイズ d x d


  4. 以下のいずれかの条件が満たされるまでステップ 23 を繰り返します。
    • ここで、尤度関数は次のようになります。


    • 反復数が事前に定義されたレベルを超えた。