ハイブリッド・オフロード・バイナリーの実行

インテル® マス・カーネル・ライブラリー 11.2 ユーザーズガイド

Intel® Optimized MP LINPACK Benchmark のハイブリッド・オフロード・バイナリーは、実行中に検出されたインテル® Xeon Phi™ コプロセッサーの数を知らせます。出力の最初に、次のような行が含まれます。

Number of Intel Xeon Phi coprocessors (インテル® Xeon Phi™ コプロセッサーの数): 1

注

この場合、MPI プロセスあたり 1 つのインテル® Xeon Phi™ コプロセッサーが検出されています。

インテル® Xeon Phi™ コプロセッサーがクラスターで利用可能で、オフロードするように設定しているのに 0 が出力される場合、正しいコンパイラー環境がオフロードされていない可能性があります。特に、LD_LIBRARY_PATH 環境変数に、インテル® メニーコア・プラットフォーム・ソフトウェア・スタック (インテル® MPSS) でインストールされる共有ライブラリー libcoi_host.so.0 および libscif.so.0 が含まれているかどうかを確認してください。

ハイブリッド・オフロード・バイナリー固有の環境変数を使用して実行の動作を調整することができます。サポートしている環境変数のリストは、「ハイブリッド・オフロードの環境変数」を参照してください。また、ハイブリッド・オフロード・バイナリーは、インテル® Xeon Phi™ コプロセッサーの自動オフロード用の MKL_MIC_ENABLE および OFFLOAD_DEVICES 環境変数にも影響を受けます。

スクリプト runme_offload_intel64 と runme_offload_intel64_dynamic は、MPI ランクがコプロセッサーを最適に共有するように、指定されたノードあたりの MPI ランク数とノードあたりのインテル® Xeon Phi™ コプロセッサーの数について HPL 環境変数 (HPL_MIC_DEVICE や HPL_MIC_SHAREMODE など) を設定します。クラスター構成に応じて、これらのスクリプトの一番上に次の変数を設定します。

`MPI_PROC_NUM`	MPI プロセスの総数。
`MPI_PER_NODE`	各クラスターノードあたりの MPI プロセスの数。ヒント最高の HPL パフォーマンスを得るには、不均等メモリーアクセス (NUMA) を有効にして、`MPI_PER_NODE` を NUMA ソケットの数と等しくなるように設定します。
`NUMMIC`	各クラスターノードあたりのインテル® Xeon Phi™ コプロセッサーの数。

スクリプトは、指定された MPI プロセス数でハイブリッド・オフロード HPL バイナリーを起動し、結果を出力ファイルに書き込みます。

最適化に関する注意事項
インテル® コンパイラーは、互換マイクロプロセッサー向けには、インテル製マイクロプロセッサー向けと同等レベルの最適化が行われない可能性があります。これには、インテル® ストリーミング SIMD 拡張命令 2 (インテル® SSE2)、インテル® ストリーミング SIMD 拡張命令 3 (インテル® SSE3)、ストリーミング SIMD 拡張命令 3 補足命令 (SSSE3) 命令セットに関連する最適化およびその他の最適化が含まれます。インテルでは、インテル製ではないマイクロプロセッサーに対して、最適化の提供、機能、効果を保証していません。本製品のマイクロプロセッサー固有の最適化は、インテル製マイクロプロセッサーでの使用を目的としています。インテル® マイクロアーキテクチャーに非固有の特定の最適化は、インテル製マイクロプロセッサー向けに予約されています。この注意事項の適用対象である特定の命令セットの詳細は、該当する製品のユーザー・リファレンス・ガイドを参照してください。改訂 #20110804

最適化に関する注意事項

インテル® コンパイラーは、互換マイクロプロセッサー向けには、インテル製マイクロプロセッサー向けと同等レベルの最適化が行われない可能性があります。これには、インテル® ストリーミング SIMD 拡張命令 2 (インテル® SSE2)、インテル® ストリーミング SIMD 拡張命令 3 (インテル® SSE3)、ストリーミング SIMD 拡張命令 3 補足命令 (SSSE3) 命令セットに関連する最適化およびその他の最適化が含まれます。インテルでは、インテル製ではないマイクロプロセッサーに対して、最適化の提供、機能、効果を保証していません。本製品のマイクロプロセッサー固有の最適化は、インテル製マイクロプロセッサーでの使用を目的としています。インテル® マイクロアーキテクチャーに非固有の特定の最適化は、インテル製マイクロプロセッサー向けに予約されています。この注意事項の適用対象である特定の命令セットの詳細は、該当する製品のユーザー・リファレンス・ガイドを参照してください。

改訂 #20110804

ハイブリッド・オフロード・バイナリーの実行

注

ヒント

関連情報