インテル® マス・カーネル・ライブラリー 11.2 ユーザーズガイド
OpenMP* ソフトウェアは、OMP_NUM_THREADS 環境変数を使用します。 インテル® マス・カーネル・ライブラリー (インテル® MKL) には、MKL_NUM_THREADS や MKL_DOMAIN_NUM_THREADS 環境変数のような、スレッド数を設定するほかの方法も用意されています (「新しいスレッド化コントロールの使用」を参照)。
関連する環境変数がすべてのノードにおいて同じで正しい値になっていることを確認してください。インテル® MKL では、デフォルトのスレッド数は 1 に設定されません。コンパイラーと一緒に使用している OpenMP* ライブラリーに応じて、デフォルトのスレッド数が設定されます。インテル® コンパイラー・ベースのスレッド・ライブラリー (libmkl_intel_thread.a) では、この値は OS の CPU の数です。
例えば、ノードあたりの MPI ランクの数とノードあたりのスレッド数の両方が 1 よりも大きい場合、スレッド数が過剰に指定されないようにします。ノードあたりの MPI ランクの数とノードあたりのスレッド数の積が、ノードあたりのハードウェア・スレッド数を超えないようにしてください。
ログイン環境で OMP_NUM_THREADS のような環境変数を設定する場合は、mpirun はすべてのノードでデフォルトシェルを開始するため、共有メモリー (SMP) システムのヘッドノードでこの値を変更してから実行しても、すべてのノードの変数は変更されないことに注意してください。 すべてのノードのスレッド数を変更するには、.bashrc で、以下のように先頭に行を追加します。
OMP_NUM_THREADS=1; export OMP_NUM_THREADS
MPICH を使用してノードごとに複数の CPU を実行できます。そのためには、ノードごとに複数の CPU を利用できるように MPICH をビルドする必要があります。特定の MPICH アプリケーションはスレッド化環境では正常に動作しない場合があることに注意してください (リリースノートの「既知の制限事項」セクションを参照)。 MPICH で 1 よりも大きなスレッド数を設定したときに問題が発生した場合は、まずスレッド数を 1 に設定して問題が解消するかどうか確認してください。
クラスター・スパース・ソルバーでは、ソルバーの実装がマルチスレッド・アルゴリズムのみサポートしているため、スレッド数を 2 以上に設定します。