インテル® DAAL プログラミング・ガイド

詳細

次元 pn 特徴ベクトルのセット Xx1= (x11,…,x1p), ..., xn= (xn1,…,xnp) で、根本的な分散に属しないベクトルを識別します (外れ値の定義は [Ben05] を参照)。

単変量外れ値検出のアルゴリズムは、それぞれの特徴を個別に考慮します。単変量外れ値検出法はパラメトリックで、データセットの既知の根本的な分散配置を仮定し、観測が領域に属している場合に外れ値としてマークする外れ値領域を定義します。外れ値領域の定義は、仮定された根本的なデータ分散に結合されます。単変量外れ値検出の外れ値領域の例を次に示します。

ここで、mn および σn は指定されたデータセットについて計算された平均値および標準偏差の (ロバスト) 推定、αn は信頼度係数です。g (n, αn) は領域の範囲を定義し、観測数に調整します。