パフォーマンスに関する考察

PCA アルゴリズムで最高のパフォーマンスを得るには、以下の操作を行います。

入力データが同次の場合、入力データを提供して、algorithmFPType クラス・テンプレート・パラメーターで指定した型と同じ型の同次数値テーブルに結果を格納します。
入力データが同次でない場合、SOA レイアウトではなく AOS レイアウトを使用します。

バッチ処理

バッチ処理モードの PCA は入力 ID として渡された data の正規化を行うため、最高のパフォーマンスを得るには、入力データセットを正規化します。データが正規化されていることをアルゴリズムに知らせるには、NumericTableIface クラスの setNormalizationFlag() メソッドを呼び出して、データセットを表す入力数値テーブルに正規化フラグをセットします。

バッチ処理モードの PCA 相関メソッド (defaultDense) は相関行列の計算に基づくため、最高のパフォーマンスを得るには、相関行列を事前に計算します。事前に計算された相関行列をアルゴリズムに渡すには、入力 ID として correlation を使用します。

オンライン処理

オンライン処理モードの PCA SVD メソッド (svdDense) は、少なくともバッチ処理モードと同程度に計算が複雑であり、compute() メソッドの呼び出し間で補助データを格納するためにメモリー要件が高くなります。その一方で、PCA SVD メソッドのオンラインバージョンは、遅いデータソースからのデータ読み取りのレイテンシーを隠蔽できます。このためには、現在のブロックの compute() メソッドと並列に次のデータブロックのロード・プリフェッチを行います。

分散処理

分散処理モードで PCA SVD メソッド (svdDense) を使用するには、マスターノードでローカルノードの p x p 数値テーブルを集約する必要があります。ローカルノードの作業量が少ない場合 (つまり、ローカルノードのデータセットが小さい場合)、ネットワーク・データ転送がボトルネックになります。この状況を回避するには、ローカルノードに十分な作業量があることを確認します。例えば、入力データセットを少数のノードに分散します。

最適化に関する注意事項
インテル® コンパイラーは、互換マイクロプロセッサー向けには、インテル製マイクロプロセッサー向けと同等レベルの最適化が行われない可能性があります。これには、インテル® ストリーミング SIMD 拡張命令 2 (インテル® SSE2)、インテル® ストリーミング SIMD 拡張命令 3 (インテル® SSE3)、ストリーミング SIMD 拡張命令 3 補足命令 (SSSE3) 命令セットに関連する最適化およびその他の最適化が含まれます。インテルでは、インテル製ではないマイクロプロセッサーに対して、最適化の提供、機能、効果を保証していません。本製品のマイクロプロセッサー固有の最適化は、インテル製マイクロプロセッサーでの使用を目的としています。インテル® マイクロアーキテクチャーに非固有の特定の最適化は、インテル製マイクロプロセッサー向けに予約されています。この注意事項の適用対象である特定の命令セットの詳細は、該当する製品のユーザー・リファレンス・ガイドを参照してください。改訂 #20110804

最適化に関する注意事項

インテル® コンパイラーは、互換マイクロプロセッサー向けには、インテル製マイクロプロセッサー向けと同等レベルの最適化が行われない可能性があります。これには、インテル® ストリーミング SIMD 拡張命令 2 (インテル® SSE2)、インテル® ストリーミング SIMD 拡張命令 3 (インテル® SSE3)、ストリーミング SIMD 拡張命令 3 補足命令 (SSSE3) 命令セットに関連する最適化およびその他の最適化が含まれます。インテルでは、インテル製ではないマイクロプロセッサーに対して、最適化の提供、機能、効果を保証していません。本製品のマイクロプロセッサー固有の最適化は、インテル製マイクロプロセッサーでの使用を目的としています。インテル® マイクロアーキテクチャーに非固有の特定の最適化は、インテル製マイクロプロセッサー向けに予約されています。この注意事項の適用対象である特定の命令セットの詳細は、該当する製品のユーザー・リファレンス・ガイドを参照してください。

改訂 #20110804