インテル® HPC ツールキット 2025.1 リリースノート

バージョン: 2025.1
最終更新日: 2025年3月19日

本資料は、インテルのウェブサイトで公開されている「Intel® HPC Toolkit Release Notes」の日本語参考訳です。原文は更新される可能性があります。原文と翻訳文の内容が異なる場合は原文を優先してください。


インテル® HPC ツールキット (HPC キット) は、ベクトル化、スレッド化、マルチノード並列化、メモリー最適化の最新技術により、HPC アプリケーションの開発、解析、最適化、および拡張に必要なものを開発者に提供します。

詳細は、「インテル® oneAPI ベース・ツールキット・リリースノート」も参照してください。

動作環境

インテル® HPC ツールキットの動作環境」を参照してください。

インテル® HPC ツールキットの主要コンポーネントのバージョン

次の表は、インテル® HPC ツールキット 2025.0.1 の主要コンポーネントのバージョンです。

コンポーネント

バージョン

インテル® oneAPI DPC++/C++ コンパイラー

2025.1.0

インテル® Fortran コンパイラー

2025.1

インテル® MPI ライブラリー

2021.15

インテル® HPC ツールキット 2025.1 の新機能

ツールキット・レベルの新機能

インテル® HPC ツールキットには、インテル® oneAPI ベース・ツールキット 2025.1 に含まれる更新に加えて、以下の更新が含まれています。

  • インテル® Fortran コンパイラーは、CPU でサポートしているメモリー・サニタイザーの機能を、GPU を含むデバイス側に拡張します。この拡張により、Fortran 開発者は CPU とデバイスコードの両方で問題を簡単に検出してトラブルシューティングできるため、より信頼性が高く強固なアプリケーションを実現できます。
  • インテル® Fortran コンパイラーは、スレッド間で作業を効率的に分散する WORKDISTRIBUTE 構造と、ループネスト内のループを並べ替える INTERCHANGE 構造を導入することで、OpenMP 6.0 標準のサポートを拡張し、並列パフォーマンスとコード最適化を向上させます。
  • インテル® Fortran コンパイラーは、Fortran 23 のサポートを強化し、SYSTEM_CLOCK 組込み関数の整数引数の種類の一貫性が確保され、PUBLIC NAMELIST グループに PRIVATE 変数を含めることができるようになりました。開発者の Fortran 23 言語標準への準拠を支援し、コードの柔軟性を高めます。
  • インテル® MPI ライブラリー・アプリケーションで、スケールアップを向上するスレッド分割ハンドオフ、DeepSpeed 向け CPU 推論の最適化、ポイントツーポイント共有メモリー操作の最適化など、P-cores 搭載インテル® Xeon® 6 プロセッサー向けの新しいパフォーマンス・チューニングを活用できるようになりました。
  • インテル® MPI ライブラリーのデフォルトのピニング・アルゴリズムを改良しました。すぐに使用できるリソース使用率が向上し、ホモジニアスおよびハイブリッド・アーキテクチャー・システムにメリットをもたらします。
  • インテル® MPI ライブラリーで、新しい MPI 標準に先駆けて、サポートされている GPU でデバイス開始 MPI-RMA 機能をサポートしました。
  • 新しいコンポーネント: インテル® SHMEM!
    • 開発者は、プログラミング・モデルとサポートしている API 呼び出しの詳細、サンプルプログラム、ビルドおよび実行手順などについて詳しく述べた、完全なインテル® SHMEM 仕様にアクセスできます。
    • インテル® SHMEM を使用する開発者は、ポイントツーポイントのリモート・メモリー・アクセス (RMA)、アトミックメモリー操作 (AMO)、シグナリング、メモリー順序付け、チーム、集合、同期操作、ストライド RMA 操作を含む、OpenSHMEM 1.5 および 1.6 の機能を使用して、デバイスとホストの両方をターゲットにできます。
    • 開発者は、インテル® SHMEM および SYCL のデバイスの API サポートを RMA、シグナリング、集合、メモリー順序付け、同期操作の SYCL ワークグループおよびサブグループ・レベルの拡張に、ホストの API サポートを SYCL キュー順序付け RMA、集合、シグナリング、同期操作に利用できます。

インテル® oneAPI DPC++ コンパイラー 2025.1.0

インテル® oneAPI DPC++/C++ コンパイラー 2025.1.0

  • グラフィックス API DirectX 12 および Vulkan interop との SYCL 相互運用性を追加しました。開発者は、インテル® グラフィックス上で非常に効率的なビジュアル・コンピューティング、メディア処理、レンダリング・アプリケーションを作成できるため、パフォーマンスと開発者の生産性の両方が向上します。
  • メモリー・サニタイザーの機能を、GPU を含むデバイス側に拡張します。この拡張により、開発者は CPU とデバイスコードの両方で問題を簡単に検出してトラブルシューティングできるため、より信頼性が高いアプリケーションを実現できます。
  • ビルド時間を大幅に短縮する ccache (英語) をサポートしました。以前のコンパイルをキャッシュして再利用することで、反復処理が高速化し、ワークフローが効率化されます。開発者は、ビルドに時間をかけずに、高品質のコードの作成に集中できます。
  • コード・カバレッジ・ツールには、C/C++、SYCL、OpenMP を使用するアプリケーション向けの GPU サポートと拡張 CPU カバレッジが追加されました。テスト済みおよび未テストのコードセクションを識別するための詳細な解析と包括的な HTML レポートが提供されることにより、テストカバレッジとコード品質が向上し、ワークフローへの容易な統合が保証されます。

インテル® Fortran コンパイラー 2025.1

新しい Fortran 2023 の機能

  • SYSTEM_CLOCK 組み込み関数の変更が実装されました。すべての整数引数は同じ種別でなければならず、少なくともデフォルトの整数種別である必要があります。これらの制限に違反すると、コマンドラインでオプション stand f2023 (Windows: /stand:f23) またはオプション standard-semantics を指定したときに、標準メッセージとして診断されます。
  • PUBLIC NAMELIST グループに PRIVATE 変数が含まれるようになりました。

新しい OpenMP の機能

  • OpenMP 6.0 WORKDISTRIBUTE 構造は、関連付けられた文のブロックを、囲んでいる TEAMS 構造のスレッドでそれぞれ 1 回実行する作業単位に分割します。関連付けられたブロック内のプロシージャー参照は、固定サイズの配列引数での MATMUL への参照を除き、現時点ではこの構造のワークシェアリング・プロパティーを抑制します。
  • OpenMP 6.0 INTERCHANGE 構造は、入れ子のループ内のループの順序を変更します。

詳細は、『インテル® Fortran コンパイラー・デベロッパー・ガイドおよびリファレンス』 (英語) を参照してください。

インテル® MPI ライブラリー 2021.15

  • Granite Rapids (GNR)✝プラットフォームのパフォーマンス・チューニング
    • スケールアップを向上するスレッド分割ハンドオフ
    • DeepSpeed 向け CPU 推論の最適化
    • ポイントツーポイント共有メモリー操作の最適化
  • デフォルトのピニング・アルゴリズムの改良
    • ハイブリッド・アーキテクチャーのピニング
  • NVIDIA GPU の OMPI と同等の機能
  • デバイス開始 MPI-RMA のサポート (インテルと NVIDIA の GPU) - 新しい MPI 標準に先駆けてサポート。
  • EFA プロバイダーの更新
  • 問題の修正

インテル® HPC ツールキット 2025.0.1 の新機能

このパッチリリースには、バグ修正と品質向上を含む、次のコンポーネントのパッチリリース更新が含まれています。

  • インテル® oneAPI DPC++ コンパイラー 2025.0.4
  • インテル® MPI ライブラリー 2021.14.1

インテル® HPC ツールキット 2025.0 の新機能

ツールキット・レベルの新機能

  • P-cores 搭載インテル® Xeon® 6 プロセッサー (開発コード名 Granite Rapids) およびインテル® Core™ Ultra プロセッサー (シリーズ 2) (開発コード名 Lunar Lake) のサポートにより最新のハードウェアの性能を最大限に引き出します。
  • インテル® HPC ツールキット (HPC キット) では、特定の開発者ユースケース向けに、ダウンロード・サイズの小さな 2 つのサブセットが提供されるようになりました。インテル® C++ エッセンシャルズは、インテルの CPU と GPU で最も広く利用されているベースキットのパフォーマンス・ライブラリーのコンパイル、デバッグ、利用に重点を置いた C++ 開発者向けのサブセットです。インテル® Fortran エッセンシャルズは、インテルの CPU と GPU で最も広く利用されている HPC キットのパフォーマンス・ライブラリーのコンパイル、デバッグ、利用に重点を置いた Fortran 開発者向けのサブセットです。
  • インテル® Fortran コンパイラーに、クリーンな出力のための AT 編集記述子、SPLIT および TOKENIZE 関数による文字列解析の強化、アップグレードされた IEEE_ARITHMETIC 機能による数値精度の向上など、コーディングの効率とアプリケーション・パフォーマンスを最適化するように設計された新しい F2023 標準の機能が追加されました。
  • 新しい IF 節による条件付き TEAMS 構文実行、DEVICE_TYPE 節による柔軟な TARGET 構文、OpenMP 5.1 アップデートによるデバイスターゲットとタスク・アフィニティー制御の強化など、OpenMP 6.0 の機能強化により、最新のインテル® Fortran コンパイラーを使用して、Fortran アプリケーションの並列処理機能を最大限に活用できます。これらはすべて、開発者がハイパフォーマンス・コンピューティング環境で優れた制御と効率を得られるように設計されています。
  • インテル® Fortran コンパイラーの最新の機能強化により、Fortran アプリケーションで高度な並列処理を実現します。Co-Array の配列サポートの強化と Co-Array のコンポーネントを使用して割付け配列を作成する機能により、開発者に高度な Co-Array プログラミングのための動的でハイパフォーマンスなデータ構造を提供します。
  • インテル® MPI ライブラリーにより、非対称 CPU トポロジーの最適化されたバランス調整のための P-core ピニングを含む、インテル® Xeon® 6 プロセッサーで高いスケールアウトおよびスケールアップ・パフォーマンスを実現します。
  • インテル® MPI ライブラリーは、分割通信、改善されたエラー処理、Fortran 2008 サポートを含む完全な MPI 4.0 実装を提供します。
  • インテル® MPI ライブラリーの MPI_Allreduce の新しい最適化により、インテルの GPU のスケールアップおよびスケールアウト・パフォーマンスが向上します。
  • ISO C++ 並列 STL コードは CPU 上で実行され、インテル® oneAPI DPC++/C++ コンパイラーを使用して GPU にオフロードされます。
  • インテル® oneAPI DPC++/C++ コンパイラーの SYCL バインドレス・テクスチャー・サポートを使用すると、動的で柔軟な GPU プログラミングが可能になります。コンパイル時の知識なしに実行時にテクスチャーを利用して、C++ with SYCL アプリケーションのパフォーマンスとスケーラビリティーを向上できます。強力な新しい LLVM サニタイザーは、開発を効率化し、デバイスコードの信頼性を高めます。
  • インテル® Xeon® 6 プロセッサーやインテル® Core™ Ultra プロセッサー (シリーズ 2) を含む最新のインテルのプラットフォームに合わせてカスタマイズされたインテル® oneAPI DPC++/C++ コンパイラーのパフォーマンス最適化機能を利用して、アプリケーションの効率を最大化し、ピーク・パフォーマンスと最先端のコンピューティング・エクスペリエンスを実現します。
  • 効率と柔軟性を高める OpenMP 5.x および OpenMP 6.0 の機能を含む、強化された OpenMP 標準への準拠とインテル® oneAPI DPC++/C++ コンパイラーのパフォーマンスの機能強化を活用します。アップグレードされたコンパイラーの最適化レポート機能は、詳細なパフォーマンス・データと最適化のフィードバックを提供します。
  • インテル® oneDPL により GPU カーネルの実行速度が速くなり、reduce、scan、その他の多くの関数を含むアルゴリズムのパフォーマンスが最大 4 倍向上しました。
  • 20 を超える新しい C++20 標準の範囲とビューを使用したインテル® oneDPL の範囲ベースのアルゴリズムを使用して、マルチアーキテクチャー・デバイスで高速化します。
  • インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) の SYCL 離散フーリエ変換 API に型の安全性のコンパイルメッセージが追加され、使いやすくデバッグしやすくなりました。インテルの GPU 向けのアプリケーション開発時間が短縮されます。
  • インテル® oneMKL の単精度 3D 実数インプレース FFT を使用する HPC ワークロードは、インテル® データセンター GPU マックス・シリーズで高速に実行できます。
  • インテル® oneAPI スレッディング・ビルディング・ブロック (インテル® oneTBB) の task_group、flow_graph、parallel_for_each のスケーラビリティーの向上により、マルチスレッド・アプリケーションを高速に実行します。
  • インテル® oneTBB のフローグラフを使用して共有グラフの重複メッセージを処理し、新しい try_put_and_wait 試験的 API を使用して特定のメッセージを待機することにより、迅速に結果を取得します。
  • インテル® インテグレーテッド・パフォーマンス・プリミティブ (インテル® IPP) は、CET 対応の保護により、制御フロー攻撃からソフトウェアを保護して、悪用リスクを軽減します。最先端のハードウェア強制セキュリティー対策によりソフトウェアを保護します。
  • インテル® クリプトグラフィー・プリミティブ・ライブラリーを使用した RSA 暗号化 (2K、3K、4K) の高速化により、OpenSSL の最大 4 倍の速度を実現します。
  • インテル® クリプトグラフィー・プリミティブ・ライブラリーを使用して、強化された SM3 アルゴリズムでハッシュの未来を体験しましょう。SM3_NI 命令により 5 倍の高速化を実現します。
  • インテル® VTune™ プロファイラーは、GPU 依存のボトルネックを特定し、レンダリング・パイプラインを最適化して、インテル® Core™ Ultra 200V シリーズ (開発コード名 Lunar Lake) 上でのメディアおよびコンテンツ作成アプリケーションの全体的な応答性を向上させます。
  • インテル® VTune™ プロファイラーは、DirectX API のデバイス側の非効率性を特定して最適化します。
  • インテル® Advisor に、適応性のあるカーネル・マッチング・メカニズムが導入されます。開発者は特定の最適化目標に関連するコード領域を識別して解析することが可能です。XCG アプリの統合により、GPU へ計算をオフロードするプロセスが効率化され、インテルの最新のハードウェアでのパフォーマンスが向上します。
  • インテル® oneAPI ディープ・ニューラル・ネットワーク・ライブラリー (インテル® oneDNN) は、大規模言語モデルとスケーリングされたドット積サブグラフのパフォーマンスを大幅に向上します。
  • インテル® oneAPI コレクティブ・コミュニケーション・ライブラリー (インテル® oneCCL) に、ワークロードのスケーリングとパフォーマンス向上を可能にする最適化が追加されました。集合操作の機能が強化され、シングルノード CPU 構成で多くの最適化が利用できるようになりました。
  • インテル® DPC++ 互換性ツールを使用すると、CUDA コードと CMake ビルドスクリプトを SYCL へ容易に移行して、時間を節約できます。一般的な AI、HPC、レンダリング・アプリケーションで使用される 100 を超える API を自動的に移行します。移行したコードは、SYCLcompat で簡単に理解でき、CodePin を使用して簡単にデバッグでき、NVIDIA GPU で実行できます。
  • インテル® DPC++ 互換性ツールを使用して、バインドレス・テクスチャー API を SYCL 画像拡張機能へ移行することにより、画像処理アプリケーションをベンダー依存から解放できます。
  • インテル® ディストリビューションの GDB は、Windows でインテル® Core™ Ultra プロセッサー (シリーズ 2) のサポートを追加しました。開発者は、これらの新しい CPU と GPU でアプリケーション・コードを効率良くデバッグできます。
  • インテル® ディストリビューションの GDB は、最新の状態を維持し、効果的なアプリケーションのデバッグをサポートする最新の機能拡張に合わせて、GDB 15 をベースとするように変更されました。
  • インテル® ディストリビューションの GDB は、デバッガー・パフォーマンスの向上とユーザー・インターフェイスの改良により、コマンドラインと Microsoft Visual Studio および Visual Studio Code 使用時の両方で開発者のエクスペリエンスが向上します。

インテル® oneAPI DPC++/C++ コンパイラー 2025.0

  • OpenMP 6.0、Fortran 2023、SYCL 2020 などの標準サポートのための新しい機能を追加しました。
  • Emerald Rapids (EMR)、Granite Rapids (GNR)、Battlemage (BMG)、Lunar Lake (LNL) などの新しいインテルのハードウェア向けに最適化され、キャッシュヒントや AI アプリケーション向けの新しいデータ型などの機能により、効率と計算能力が向上します。
  • AI フレームワークと HPC アプリケーション向けにパフォーマンスをチューニングしました。
  • opt-report の強化などによりユーザー・エクスペリエンスを向上しました。
  • インテル® Arc™ GPU 向けバインドレス・テクスチャー・サポートを実装しました。
  • デバイスコードで問題の検出を支援するサニタイザーをサポートしました。
  • --offload-new-driver を使用した新しい SYCL オフロードモデルを導入しました。
  • パフォーマンスの機能を強化し、OpenMP 6.0 機能の早期サポートを導入しました。
  • OpenMP ループ・ローテーションの問題を修正しました。
  • 新しい OpenMP 6.0 の DEVICE_TYPE 節を TARGET 構造で指定できるようになりました。
  • mandatory OpenMP オフロードのサポートを有効にしました。
  • OpenMP オフロードに関する追加の最適化レポート情報の提供によりユーザー・エクスペリエンスを向上しました。
  • SYCL は、インテルのクライアント GPU で CUDA テクスチャーに匹敵する機能を提供します。
  • Ahead-Of-Time (AOT) コンパイルモードでのオプションのカーネル機能のサポートを強化しました。
  • SYCL ABI に重大な変更を加えました。

インテル® Fortran コンパイラー 2025.0

  • 出力前に末尾の空白をトリミングする AT Edit 記述子、文字列解析のための SPLIT and TOKENIZE 組込み関数など、ランタイム・ライブラリーに新しい F2023 標準機能が追加されました。IEEE_ARITHMETIC が F2023 IEEE_MAX、IEEE_MAX_MAG、IEEE_MIN、IEEE_MIN_MAG で強化されました。また、IEEE_MAX_NUM_MAG、IEEE_MIN_NUM、IEEE_MIN_NUM_MAG の F2023 動作が変更されました。
  • このリリースの新しい OpenMP の機能
    1. OpenMP 6.0: IF 節を TEAMS 構造で指定できるようになりました。
    2. OpenMP 6.0: DEVICE_TYPE 節を TARGET 構造で指定できるようになりました。
    3. OpenMP 5.1: DEVICE_TYPE 節を DECLARE TARGET ディレクティブで指定できるようになりました。
    4. OpenMP 5.1: AFFINITY 節が TASK ディレクティブで許可されるようになりました。
  • Co-Array の配列を含む Co-Array に関する新しい変更により、Co-Array コンポーネントを含むデータ・オブジェクトが配列になり、割り当て可能になります。
  • standard-semantics オプションは、stand オプションで設定された標準準拠レベルの影響を受けます。stand オプションが指定されていない場合、standard-semantics は Fortran 2018 標準の動作に準拠するオプションを設定します。
  • 『インテル® Fortran コンパイラー・デベロッパー・ガイドおよびリファレンス』 (英語) を大幅に更新しました。古い資料を削除し、既存の例を更新して、サポートされている Fortran 2018 および Fortran 2023 の言語機能を追加しました。

インテル® MPI ライブラリー 2021.14.0

  • Granite Rapids (GNR)✝/Sierra Forest (SRF)✝のスケールアウトとスケールアップの両方のチューニングと最適化をサポートしました。
    • Granite Rapids (GNR)✝- 非対称 CPU トポロジーの最適化されたバランス調整のための CPU ピニング・ライブラリーのパフォーマンスを向上しました。
  • MPI 4.0 準拠 - 分割通信をサポートし、エラー処理を改善し、Fortran 2008 をサポートしました。
  • インテルの GPU 向けに MPI_Allreduce のスケールアップとスケールアウトを最適化しました。
  • インテルの GPU 向けに reduce を最適化しました。
  • Windows ifx で MPI をサポートしました。
  • OFI プロバイダーが最新のオープンソース・バージョンに更新されました。

終了予定のサポート

  • インテル® Fortran コンパイラー・クラシック (ifort) は oneAPI 2025 リリースで削除されました。

インストール方法

既知の問題

終了予定の機能/削除された機能

  • インテル® Fortran コンパイラー・クラシック (ifort) は oneAPI 2025 リリースで削除されました。Windows および Linux の継続的なサポート、新しい言語のサポート、新しい言語機能、最適化のサポートが提供される、LLVM ベースのインテル® Fortran コンパイラー (ifx) へ移行することを推奨します。
    ifx の詳細は、『インテル® Fortran コンパイラー・デベロッパー・ガイドおよびリファレンス』 (英語) および『インテル® oneAPI ポーティング・ガイド (ifx)』を参照してください。
  • インテル® oneAPI ツールキット向け診断ユーティリティーは非推奨になりました。2025.0 リリースで削除されました。
  • インテル® Trace Analyzer & Collector (英語) は 2024.1.0 からインテル® HPC ツールキットに含まれなくなりました。現在はスタンドアロン・パッケージとしてダウンロード可能ですが、2025 以降に提供を終了する予定です。詳細はこちら
  • インテル® Inspector (英語) は 2024.1.0 からインテル® HPC ツールキットに含まれなくなりました。現在はスタンドアロン・パッケージとしてダウンロード可能ですが、2025 以降に提供を終了する予定です。詳細はこちら
  • 次の OS は非推奨になりました。2025.0 リリースでサポートを終了します。
    • CPU
      • SUSE Linux Enterprise Server (SLES) 15 SP3
      • Ubuntu 20.04
      • Fedora 37
      • Debian 11
      • Amazon Linux 2022
    • GPU
      • Red Hat Enterprise Linux 8.6

インテル® HPC ツールキットに含まれるツールのリリースノート

以前のリリース

法務上の注意書き

インテルのテクノロジーを使用するには、対応したハードウェア、ソフトウェア、またはサービスの有効化が必要となる場合があります。

絶対的なセキュリティーを提供できる製品またはコンポーネントはありません。

実際の費用と結果は異なる場合があります。

© Intel Corporation. Intel、インテル、Intel ロゴ、その他のインテルの名称やロゴは、Intel Corporation またはその子会社の商標です。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
✝開発コード名

本資料は、(明示されているか否かにかかわらず、また禁反言によるとよらずにかかわらず) いかなる知的財産権のライセンスも許諾するものではありません。

本資料で説明されている製品には、エラッタと呼ばれる設計上の不具合が含まれている可能性があり、公表されている仕様とは異なる動作をする場合があります。現在確認済みのエラッタについては、インテルまでお問い合わせください。

インテルは、明示されているか否かにかかわらず、いかなる保証もいたしません。ここにいう保証には、商品適格性、特定目的への適合性、および非侵害性の黙示の保証、ならびに履行の過程、取引の過程、または取引での使用から生じるあらゆる保証を含みますが、これらに限定されるわけではありません。


製品および性能に関する情報

性能は、使用状況、構成、その他の要因によって異なります。詳細については、http://www.intel.com/PerformanceIndex/ (英語) を参照してください。