本資料は、インテルのウェブサイトで公開されている「Intel® HPC Toolkit Release Notes」および「Intel® HPC Toolkit System Requirements」の日本語参考訳です。原文は更新される可能性があります。原文と翻訳文の内容が異なる場合は原文を優先してください。
インテル® HPC ツールキット (HPC キット) は、ベクトル化、スレッド化、マルチノード並列化、メモリー最適化の最新技術により、HPC アプリケーションの開発、解析、最適化、および拡張に必要なものを開発者に提供します。
「インテル® oneAPI ベース・ツールキット 2025 リリースノートおよび動作環境」も参照してください。
次の表は、インテル® HPC ツールキット 2025.0 の主要コンポーネントのバージョンです。
インテル® oneAPI DPC++/C++ コンパイラー
2025.0
インテル® Fortran コンパイラー
2025.0
インテル® MPI ライブラリー
2021.14.0
P-cores 搭載インテル® Xeon® 6 プロセッサー (開発コード名 Granite Rapids) およびインテル® Core™ Ultra プロセッサー (シリーズ 2) (開発コード名 Lunar Lake) のサポートにより最新のハードウェアの性能を最大限に引き出します。
インテル® HPC ツールキット (HPC キット) では、特定の開発者ユースケース向けに、ダウンロード・サイズの小さな 2 つのサブセットが提供されるようになりました。インテル® C++ エッセンシャルズは、インテルの CPU と GPU で最も広く利用されているベースキットのパフォーマンス・ライブラリーのコンパイル、デバッグ、利用に重点を置いた C++ 開発者向けのサブセットです。インテル® Fortran エッセンシャルズは、インテルの CPU と GPU で最も広く利用されている HPC キットのパフォーマンス・ライブラリーのコンパイル、デバッグ、利用に重点を置いた Fortran 開発者向けのサブセットです。
インテル® Fortran コンパイラーに、クリーンな出力のための AT 編集記述子、SPLIT および TOKENIZE 関数による文字列解析の強化、アップグレードされた IEEE_ARITHMETIC 機能による数値精度の向上など、コーディングの効率とアプリケーション・パフォーマンスを最適化するように設計された新しい F2023 標準の機能が追加されました。
新しい IF 節による条件付き TEAMS 構文実行、DEVICE_TYPE 節による柔軟な TARGET 構文、OpenMP* 5.1 アップデートによるデバイスターゲットとタスク・アフィニティー制御の強化など、OpenMP* 6.0 の機能強化により、最新のインテル® Fortran コンパイラーを使用して、Fortran アプリケーションの並列処理機能を最大限に活用できます。これらはすべて、開発者がハイパフォーマンス・コンピューティング環境で優れた制御と効率を得られるように設計されています。
インテル® Fortran コンパイラーの最新の機能強化により、Fortran アプリケーションで高度な並列処理を実現します。Co-Array の配列サポートの強化と Co-Array のコンポーネントを使用して割付け配列を作成する機能により、開発者に高度な Co-Array プログラミングのための動的でハイパフォーマンスなデータ構造を提供します。
インテル® MPI ライブラリーにより、非対称 CPU トポロジーの最適化されたバランス調整のための P-core ピニングを含む、インテル® Xeon® 6 プロセッサーで高いスケールアウトおよびスケールアップ・パフォーマンスを実現します。
インテル® MPI ライブラリーは、分割通信、改善されたエラー処理、Fortran 2008 サポートを含む完全な MPI 4.0 実装を提供します。
インテル® MPI ライブラリーの MPI_Allreduce の新しい最適化により、インテルの GPU のスケールアップおよびスケールアウト・パフォーマンスが向上します。
ISO C++ 並列 STL コードは CPU 上で実行され、インテル® oneAPI DPC++/C++ コンパイラーを使用して GPU にオフロードされます。
インテル® oneAPI DPC++/C++ コンパイラーの SYCL* バインドレス・テクスチャー・サポートを使用すると、動的で柔軟な GPU プログラミングが可能になります。コンパイル時の知識なしに実行時にテクスチャーを利用して、C++ with SYCL* アプリケーションのパフォーマンスとスケーラビリティーを向上できます。強力な新しい LLVM サニタイザーは、開発を効率化し、デバイスコードの信頼性を高めます。
インテル® Xeon® 6 プロセッサーやインテル® Core™ Ultra プロセッサー (シリーズ 2) を含む最新のインテルのプラットフォームに合わせてカスタマイズされたインテル® oneAPI DPC++/C++ コンパイラーのパフォーマンス最適化機能を利用して、アプリケーションの効率を最大化し、ピーク・パフォーマンスと最先端のコンピューティング・エクスペリエンスを実現します。
効率と柔軟性を高める OpenMP* 5.x および OpenMP* 6.0 の機能を含む、強化された OpenMP* 標準への準拠とインテル® oneAPI DPC++/C++ コンパイラーのパフォーマンスの機能強化を活用します。アップグレードされたコンパイラーの最適化レポート機能は、詳細なパフォーマンス・データと最適化のフィードバックを提供します。
インテル® oneDPL により GPU カーネルの実行速度が速くなり、reduce、scan、その他の多くの関数を含むアルゴリズムのパフォーマンスが最大 4 倍向上しました。
20 を超える新しい C++20 標準の範囲とビューを使用したインテル® oneDPL の範囲ベースのアルゴリズムを使用して、マルチアーキテクチャー・デバイスで高速化します。
インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) の SYCL* 離散フーリエ変換 API に型の安全性のコンパイルメッセージが追加され、使いやすくデバッグしやすくなりました。インテルの GPU 向けのアプリケーション開発時間が短縮されます。
インテル® oneMKL の単精度 3D 実数インプレース FFT を使用する HPC ワークロードは、インテル® データセンター GPU マックス・シリーズで高速に実行できます。
インテル® oneAPI スレッディング・ビルディング・ブロック (インテル® oneTBB) の task_group、flow_graph、parallel_for_each のスケーラビリティーの向上により、マルチスレッド・アプリケーションを高速に実行します。
インテル® oneTBB のフローグラフを使用して共有グラフの重複メッセージを処理し、新しい try_put_and_wait 実験的 API を使用して特定のメッセージを待機することにより、迅速に結果を取得します。
インテル® インテグレーテッド・パフォーマンス・プリミティブ (インテル® IPP) は、CET 対応の保護により、制御フロー攻撃からソフトウェアを保護して、悪用リスクを軽減します。最先端のハードウェア強制セキュリティー対策によりソフトウェアを保護します。
インテル® クリプトグラフィー・プリミティブ・ライブラリーを使用した RSA 暗号化 (2K、3K、4K) の高速化により、OpenSSL* の最大 4 倍の速度を実現します。
インテル® クリプトグラフィー・プリミティブ・ライブラリーを使用して、強化された SM3 アルゴリズムでハッシュの未来を体験しましょう。SM3_NI 命令により 5 倍の高速化を実現します。
インテル® VTune™ プロファイラーは、GPU 依存のボトルネックを特定し、レンダリング・パイプラインを最適化して、インテル® Core™ Ultra 200V シリーズ (開発コード名 Lunar Lake) 上でのメディアおよびコンテンツ作成アプリケーションの全体的な応答性を向上させます。
インテル® VTune™ プロファイラーは、DirectX* API のデバイス側の非効率性を特定して最適化します。
インテル® Advisor に、適応性のあるカーネル・マッチング・メカニズムが導入されます。開発者は特定の最適化目標に関連するコード領域を識別して解析することが可能です。XCG アプリの統合により、GPU へ計算をオフロードするプロセスが効率化され、インテルの最新のハードウェアでのパフォーマンスが向上します。
インテル® oneAPI ディープ・ニューラル・ネットワーク・ライブラリー (インテル® oneDNN) は、大規模言語モデルとスケーリングされたドット積サブグラフのパフォーマンスを大幅に向上します。
インテル® oneAPI コレクティブ・コミュニケーション・ライブラリー (インテル® oneCCL) に、ワークロードのスケーリングとパフォーマンス向上を可能にする最適化が追加されました。集合操作の機能が強化され、シングルノード CPU 構成で多くの最適化が利用できるようになりました。
インテル® DPC++ 互換性ツールを使用すると、CUDA* コードと CMake* ビルドスクリプトを SYCL* へ容易に移行して、時間を節約できます。一般的な AI、HPC、レンダリング・アプリケーションで使用される 100 を超える API を自動的に移行します。移行したコードは、SYCLcompat で簡単に理解でき、CodePin を使用して簡単にデバッグでき、NVIDIA* GPU で実行できます。
インテル® DPC++ 互換性ツールを使用して、バインドレス・テクスチャー API を SYCL* 画像拡張機能へ移行することにより、画像処理アプリケーションをベンダー依存から解放できます。
インテル® ディストリビューションの GDB は、Windows* でインテル® Core™ Ultra プロセッサー (シリーズ 2) のサポートを追加しました。開発者は、これらの新しい CPU と GPU でアプリケーション・コードを効率良くデバッグできます。
インテル® ディストリビューションの GDB は、最新の状態を維持し、効果的なアプリケーションのデバッグをサポートする最新の機能拡張に合わせて、GDB 15 をベースとするように変更されました。
インテル® ディストリビューションの GDB は、デバッガー・パフォーマンスの向上とユーザー・インターフェイスの改良により、コマンドラインと Microsoft* Visual Studio* および Visual Studio* Code 使用時の両方で開発者のエクスペリエンスが向上します。
OpenMP* 6.0、Fortran 2023、SYCL* 2020 などの標準サポートのための新しい機能を追加しました。
Sapphire Rapids (SPR)✝、Emerald Rapids (EMR)✝、Granite Rapids (GNR)✝、Battlemage (BMG)✝、Lunar Lake (LNL)✝ などの新しいハードウェア (キャッシュヒントや AI アプリケーション向けの新しいデータ型) に対応しました。
AI フレームワークと HPC アプリケーション向けにパフォーマンスをチューニングしました。
opt-report の強化などによりユーザー・エクスペリエンスを向上しました。
インテル® Arc™ GPU 向けバインドレス・テクスチャー・サポートを実装しました。
デバイスコードで問題の検出を支援するサニタイザーをサポートしました。
--offload-new-driver を使用した新しい SYCL* オフロードモデルを導入しました。
パフォーマンスの機能を強化し、OpenMP* 6.0 機能の早期サポートを導入しました。
OpenMP* ループ・ローテーションの問題を修正しました。
新しい OpenMP* 6.0 の DEVICE_TYPE 節を TARGET 構造で指定できるようになりました。
mandatory OpenMP* オフロードのサポートを有効にしました。
OpenMP* オフロードに関する追加の最適化レポート情報の提供によりユーザー・エクスペリエンスを向上しました。
SYCL* は、インテルのクライアント GPU で CUDA* テクスチャーに匹敵する機能を提供します。
Ahead-Of-Time (AOT) コンパイルモードでのオプションのカーネル機能のサポートを強化しました。
SYCL* ABI に重大な変更を加えました。
出力前に末尾の空白をトリミングする AT Edit 記述子、文字列解析のための SPLIT and TOKENIZE 組込み関数など、ランタイム・ライブラリーに新しい F2023 標準機能が追加されました。IEEE_ARITHMETIC が F2023 IEEE_MAX、IEEE_MAX_MAG、IEEE_MIN、IEEE_MIN_MAG で強化されました。また、IEEE_MAX_NUM_MAG、IEEE_MIN_NUM、IEEE_MIN_NUM_MAG の F2023 動作が変更されました。
このリリースの新しい OpenMP* の機能
OpenMP* 6.0: IF 節を TEAMS 構造で指定できるようになりました。
OpenMP* 6.0: DEVICE_TYPE 節を TARGET 構造で指定できるようになりました。
OpenMP* 5.1: DEVICE_TYPE 節を DECLARE TARGET ディレクティブで指定できるようになりました。
OpenMP* 5.1: AFFINITY 節が TASK ディレクティブで許可されるようになりました。
Co-Array の配列を含む Co-Array に関する新しい変更により、Co-Array コンポーネントを含むデータ・オブジェクトが配列になり、割り当て可能になります。
standard-semantics オプションは、stand オプションで設定された標準準拠レベルの影響を受けます。stand オプションが指定されていない場合、standard-semantics は Fortran 2018 標準の動作に準拠するオプションを設定します。
『インテル® Fortran コンパイラー・デベロッパー・ガイドおよびリファレンス』 (英語) を大幅に更新しました。古い資料を削除し、既存の例を更新して、サポートされている Fortran 2018 および Fortran 2023 の言語機能を追加しました。
Granite Rapids (GNR)✝/Sierra Forest (SRF)✝のスケールアウトとスケールアップの両方のチューニングと最適化をサポートしました。
Granite Rapids (GNR)✝- 非対称 CPU トポロジーの最適化されたバランス調整のための CPU ピニング・ライブラリーのパフォーマンスを向上しました。
MPI 4.0 準拠 - 分割通信をサポートし、エラー処理を改善し、Fortran 2008 をサポートしました。
インテルの GPU 向けに MPI_Allreduce のスケールアップとスケールアウトを最適化しました。
インテルの GPU 向けに reduce を最適化しました。
Windows* ifx で MPI をサポートしました。
OFI プロバイダーが最新のオープンソース・バージョンに更新されました。
Linux* マシンでインテル® oneAPI DPC++/C++ コンパイラーを使用する場合、検出された GNU* gcc の最新バージョンと同等の g++ パッケージがインストールされていない場合、問題が発生することがあります。エラーと回避策の詳細は、こちら (英語) を参照してください。
「DPC++ または OpenMP* オフロードを使用したヘテロジニアス・プログラムをデバッグする際の課題、ヒント、および既知の問題」 (英語) を参照してください。
仮想マシンでの GPU コードの実行は、現在サポートされていません。
オフラインの導入ガイドをダウンロードした場合、Chrome* ではウィンドウサイズを変更するとテキストが消えることがあります。この問題を解決するには、ブラウザーウィンドウのサイズを再度変更するか、別のブラウザーを使用してください。
Eclipse* 4.12 では、makefile から IDE プラグインによって作成されるサンプル・プロジェクトがビルドできません。これは、Eclipse* 4.12 の既知の問題です。Eclipse* 4.9、4.10、または 4.11 を使用してください。
環境起動スクリプトは POSIX* 準拠のスクリプトに移行しました。csh などの非 POSIX* シェルでは、次のコマンドラインを使用した回避方法があります。
コンポーネント・ディレクトリー・レイアウトの場合:
% bash -c 'source /opt/intel/oneapi/setvars.sh ; exec csh'
統合ディレクトリー・レイアウトの場合:
% bash -c 'source <install-dir>/<toolkit-version>/oneapi-vars.sh ; exec csh'
インテル® Fortran コンパイラー・クラシック (ifort) は oneAPI 2025 リリースで削除されました。Windows* および Linux* の継続的なサポート、新しい言語のサポート、新しい言語機能、最適化のサポートが提供される、LLVM ベースのインテル® Fortran コンパイラー (ifx) へ移行することを推奨します。
ifx の詳細は、『インテル® Fortran コンパイラー・デベロッパー・ガイドおよびリファレンス』 (英語) および『インテル® oneAPI ポーティング・ガイド (ifx)』を参照してください。
インテル® oneAPI ツールキット向け診断ユーティリティーは非推奨になりました。2025.0 リリースで削除されました。
インテル® Trace Analyzer & Collector は 2024.1.0 からインテル® HPC ツールキットに含まれなくなりました。現在はスタンドアロン・パッケージとしてダウンロード可能ですが、2025 以降に提供を終了する予定です。詳細はこちら。
インテル® Inspector は 2024.1.0 からインテル® HPC ツールキットに含まれなくなりました。現在はスタンドアロン・パッケージとしてダウンロード可能ですが、2025 以降に提供を終了する予定です。詳細はこちら。
次の OS は非推奨になりました。2025.0 リリースでサポートを終了します。
「インテル® oneAPI ツールキットのインストール・ガイド」 (英語) を参照してください。
以下を参考にしてください。
本資料には、インテル® HPC ツールキットの動作環境が記載されています。インテル® HPC ツールキットを利用するには、インテル® oneAPI ベース・ツールキットが必要です。詳細は、「インテル® oneAPI ベース・ツールキット 2025 リリースノートおよび動作環境」を参照してください。
インテル® HPC ツールキットは、インテル® oneAPI ベース・ツールキットのアドオンです。
これらの OS ディストリビューションはインテルによってテストされたもの、または動作が確認されているものです。その他のディストリビューションは、動作する場合としない場合があり、推奨されません。質問がある場合は、インテル・コミュニティー・フォーラム (英語) でサポートを受けることができます。商用サポートを利用可能な場合は、サポートチケットを作成してください。
インテル® HPC ツールキット 2025 は、Windows* および Linux* で検証を行っています。
サポートされているターゲット・オペレーティング・システム:
注: サポートされているアクセラレーターへのオフロードは、一部のオペレーティング・システムでのみサポートされます。
開発ツール要件:
サポートされているターゲット・オペレーティング・システム:
Windows* 10 と Windows* 11 で Microsoft* Windows* Subsystem for Linux* 2 (WSL2) を使用すると、CPU および GPU ワークフロー向けにインテル® ソフトウェア開発ツールとライブラリーのネイティブ Linux* ディストリビューションを Windows* 上にインストールできます。詳細は、https://www.intel.com/content/www/us/en/developer/articles/technical/use-oneapi-toolkits-on-wsl-2.html (英語) を参照してください。
開発ツール要件:
GPU 開発の要件:
OpenCL* およびレベル 0 グラフィックス・ドライバーをインストールする必要があります。
インテル® oneAPI ツールキット向け VS Code 拡張は、oneAPI アプリケーションを作成、デバッグ、およびプロファイルする開発者を支援します。詳細は、「Visual Studio* Code とインテル® oneAPI ツールキットの使用ユーザーガイド」 (英語) を参照してください。
VS Code Marketplace (英語) から以下の VS Code 拡張を利用できます。
インテル® oneAPI ツールキット向け診断ユーティリティーは、インテル製品を使用するためシステムの状態を診断するように設計されています。このユーティリティーを使用することで、以下のようなエラーを見つけることができます。
詳細は、「インテル® oneAPI ツールキット向け診断ユーティリティー・ユーザーガイド」 (英語) を参照してください。
インテル® HPC ツールキット 2024 (PDF)
インテル® oneAPI HPC ツールキット 2023 (PDF)
インテル® oneAPI HPC ツールキット 2022 (PDF)
インテル® oneAPI HPC ツールキット 2021
インテルのテクノロジーを使用するには、対応したハードウェア、ソフトウェア、またはサービスの有効化が必要となる場合があります。
絶対的なセキュリティーを提供できる製品またはコンポーネントはありません。
実際の費用と結果は異なる場合があります。
© Intel Corporation. Intel、インテル、Intel ロゴ、その他のインテルの名称やロゴは、Intel Corporation またはその子会社の商標です。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
✝開発コード名
本資料は、(明示されているか否かにかかわらず、また禁反言によるとよらずにかかわらず) いかなる知的財産権のライセンスも許諾するものではありません。
本資料で説明されている製品には、エラッタと呼ばれる設計上の不具合が含まれている可能性があり、公表されている仕様とは異なる動作をする場合があります。現在確認済みのエラッタについては、インテルまでお問い合わせください。
インテルは、明示されているか否かにかかわらず、いかなる保証もいたしません。ここにいう保証には、商品適格性、特定目的への適合性、および非侵害性の黙示の保証、ならびに履行の過程、取引の過程、または取引での使用から生じるあらゆる保証を含みますが、これらに限定されるわけではありません。
性能は、使用状況、構成、その他の要因によって異なります。詳細については、http://www.intel.com/PerformanceIndex/ (英語) を参照してください。