インテル® oneAPI ベース・ツールキット 2025.3 リリースノート

バージョン: 2025.3
最終更新日: 2025年10月31日

本資料は、インテルのウェブサイトで公開されている「Intel® oneAPI Base Toolkit Release Notes」の日本語参考訳です。原文は更新される可能性があります。原文と翻訳文の内容が異なる場合は原文を優先してください。


インテル® oneAPI ベース・ツールキットは、ダイレクト・プログラミングと API プログラミングをサポートし、インテル® プロセッサーおよび互換プロセッサー、第 9 世代、第 11 世代、第 12 世代インテル® プロセッサー・グラフィックス、インテル® Iris® Xe MAX グラフィックス、インテル® データセンター GPU マックス・シリーズおよびインテル® Arc™ グラフィックス・シリーズを含む多様なハードウェアにわたって、ネイティブコードを完全にサポートする統一された言語とライブラリーを提供します。開発とパフォーマンス・チューニングを支援する解析およびデバッグツールも備えています。

動作環境

インテル® oneAPI ベース・ツールキットの主要コンポーネントのバージョン

バージョン管理スキーマについては、「インテル® oneAPI ツールキットとコンポーネントのバージョン管理スキーマ」 (英語) を参照してください。

次の表は、インテル® oneAPI ベース・ツールキット 2025.3.0 の主要コンポーネントのバージョンです。

コンポーネント名 (略称)

バージョン

インテル® oneAPI DPC++/C++ コンパイラー

2025.3.0

インテル® oneAPI DPC++ ライブラリー

2022.10.0

インテル® DPC++ 互換性ツール (インテル® DPCT)

2025.3.0

インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL)

2025.3.0

インテル® ディストリビューションの GDB

2025.3.0

インテル® VTune™ プロファイラー

2025.7.0

インテル® Advisor

2025.4.0

インテル® oneAPI スレッディング・ビルディング・ブロック (インテル® oneTBB)

2022.3.0

インテル® インテグレーテッド・パフォーマンス・プリミティブ (インテル® IPP)

2022.3.0

インテル® クリプトグラフィー・プリミティブ・ライブラリー

2025.3.0

インテル® oneAPI コレクティブ・コミュニケーション・ライブラリー (インテル® oneCCL)

2021.17.0

インテル® oneAPI データ・アナリティクス・ライブラリー (インテル® oneDAL)

2025.9.0

インテル® oneAPI ディープ・ニューラル・ネットワーク・ライブラリー (インテル® oneDNN)

2025.3.0

注: インテル® AI ツール (英語) を使用する場合は、インテル® oneAPI ベース・ツールキットの互換バージョンをインストールしてください。

インテル® oneAPI ベース・ツールキット 2025.3.0

ツールキット・レベルの更新

  • Python 開発者は、インテル® oneAPI Python パッケージの、新しいテンソル・メンバーシップ・テスト、高度な NumPy インデックス、拡張された FFT と線形代数関数、改善された CuPy との互換性、Python 3.13/3.14 のフルサポートにより、科学研究やデータワークフローを高速化できるようになりました。
  • ディープラーニング開発者は、インテル® oneAPI ディープ・ニューラル・ネットワーク・ライブラリー (インテル® oneDNN) の、強化されたハードウェア最適化、新しいレイヤー正規化手法 (RMSNorm) のサポート、AVX 10.2 および AMX 命令セットへの早期アクセスにより、インテルの® CPU と GPU でより高いパフォーマンスを実現できるようになりました。
  • C++ および SYCL 開発者は、インテル® oneAPI DPC++/C++ コンパイラーの、拡張された DirectX 12 相互運用性、データ並列ワークロード向けの高度な SYCL 言語機能、スマートな OpenMP 並列処理、リファクタリングされた統合ランタイムアダプターによる GPU パフォーマンスの向上により、高速でスケーラブルなアプリケーションを構築できるようになりました。
  • パフォーマンス解析開発者は、インテル® VTune™ プロファイラーで、ファイナライズの高速化 (最大 2 倍)、インストルメンテーションおよびトレーシング・テクノロジー (ITT) のフォーマットされたメタデータを含む豊富な情報の取得、CPU/GPU カーネルの関係の視覚化、新しいメモリー帯域幅メトリックへのアクセスが可能になりました。また、インテル® Arc™ B シリーズ・グラフィックス (開発コード名 Battlemage) とインテル® Core™ Ultra 3 プロセッサーもサポートされました。
  • ソフトウェア開発者は、インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) の、インテル® Xe3 GPU のサポート、OpenMP 6.0 準拠、高速なスパースソルバーと LAPACK ソルバーを活用して、HPC、AI、科学計算のワークロードを高速化できるようになりました。
  • C++ 開発者は、インテル® oneAPI DPC++ ライブラリー (インテル® oneDPL) の、C++20 のランダムアクセス範囲に対応した拡張範囲アルゴリズムのサポート、最適化されたスキャン、検索、セット操作を活用して、高速で効率的な並列アプリケーションを実現できるようになりました。
  • 信号処理とイメージ処理開発者は、インテル® インテグレーテッド・パフォーマンス・プリミティブ (インテル® IPP) の、新しい API と AVX-512 の機能強化により、複雑な数学演算やアフィン画像変換を高速化して、一般的なライブラリーに最適化されたパフォーマンスを統合できるようになりました。
  • 通信ライブラリー開発者は、インテル® oneAPI コレクティブ・コミュニケーション・ライブラリー (インテル® oneCCL) の、NCCL のような API プレビュー、すべての集合での柔軟なマルチスレッド、ユーザー定義のリダクション操作、大規模メッセージ Allgather 向けに最適化されたスケーラビリティーのメリットを享受できるようになりました。
  • 並列プログラミング開発者は、インテル® oneAPI スレッディング・ビルディング・ブロック (インテル® oneTBB) の、新しい task_group 依存関係機能、改善された task_arena 統合、Linux cgroup による CPU リソース処理の改善、mutex 操作のスケーラビリティー強化により、タスク管理を簡素化できるようになりました。
  • インテル® ディストリビューションの GDB がアップストリーム GDB 16.3 をベースとするように変更されたことにより、開発者は最新のデバッグ機能に加えて、アタッチ操作後のカスタム自動化を実現する独自の Python API post_attach イベントを利用できるようになりました。
  • SYCL に移行する開発者は、拡張された CMake スクリプト構文サポートのメリットを享受できるようになりました。インテル® DPC++ 互換性ツールは 2025.3 リリースで非推奨になりました。将来のリリースで削除される予定です。SYCLomatic オープンソース・コミュニティーは、今後の貢献および問題の報告を歓迎します。

新機能、サポート対象プラットフォーム、既知の問題の詳細については、コンポーネントのリリースノートを参照してください。

インテル® oneAPI DPC++/C++ コンパイラー 2025.3.0

  • DirectX 12 との SYCL 相互運用性の拡張: さらに多くの DirectX 12 画像形式のサポートが追加され、開発者は計算とレンダリングのワークフローを適切に統合できるようになりました。この機能強化は、グラフィックスと計算の緊密な連携が必要な、高度なマルチメディア、ゲーム、ビジュアライゼーション・アプリケーションに最適です。
  • SYCL 言語機能の改善: Graph USM 割り当てのサポート、カーネルコンパイルの高速化、フリー関数カーネルの最終版を導入しました。これらの改善により、データ並列ワークロードのコードのスケーラビリティーとモジュール性が向上し、開発者はハイパフォーマンスな AI 推論、科学計算、シミュレーション・アプリケーションを構築できるようになります。
  • 統合ランタイム L0 v2 アダプターのリファクタリング: インテル® oneAPI DPC++/C++ コンパイラー 2025.3 は、リファクタリングされた統合ランタイム L0 v2 アダプターを提供するようになりました。インテル® Arc™ B シリーズ・グラフィックスおよびその他のインテル® Xe2 ベースの GPU ではデフォルトで有効です。計算集約型のグラフィックス、AI、HPC ワークロードのパフォーマンスが向上し、デバイス管理の効率が向上します。
  • OpenMP 並列処理の強化: 動的タスク制御のための条件付き NOWAIT 節、DECLARE VARIANT によるデバイス固有のチューニング、バリア使用時の最適化コメントなど、スマートな OpenMP 並列処理を実現します。並列ループ内でのアトミック構造とループ変換構造の新たなサポートにより、表現力に富む効率的な並列コードを実現し、HPC、金融モデリング、リアルタイム解析を高速化します。

インテル® oneAPI DPC++ ライブラリー 2022.10.0

  • 範囲アルゴリズムのカバレッジを拡張: C++20 ランダムアクセス範囲を受け入れる追加範囲アルゴリズムのサポートを追加し、最新の C++ 標準との互換性を拡張して、開発者の生産性を向上しました。
  • コア・アルゴリズムの最適化: スキャン、検索、およびセット操作アルゴリズムのパフォーマンスが大幅に向上し、実行時間が短縮されて、アプリケーションのスループットが向上しました。

インテル® DPC++ 互換性ツール 2025.3.0

  • CMake 移行サポートの拡張: CMake スクリプトの移行で、さらに多くの構文をサポートしました。
  • 終了予定のサポート: インテル® DPC++ 互換性ツールは 2025.3 リリースで非推奨になりました。問題報告やリクエストは SYCLomatic オープンソース・コミュニティーで連絡してください。インテルは、影響を推定して、必要なサポートを提供します。皆様の SYCLomatic コミュニティーへの貢献を歓迎します。

インテル® oneAPI マス・カーネル・ライブラリー 2025.3.0

  • インテル® Xe3 統合 GPU のサポート: インテル® oneMKL 2025.3 で、インテル® Xe3 統合 GPU をサポートしました。
  • OpenMP 6.0 準拠: OpenMP 6.0 標準に準拠するように OpenMP オフロード機能を更新しました。

インテル® ディストリビューションの GDB 2025.3.0

  • GDB 16.3 をベースとするように変更: GDB バージョン 16.3 をベースとするように変更されました。詳細は、GDB ニュース (英語) を参照してください。
  • 新しい Python API イベント: Python API に、attach コマンドの実行後に発行される新しい post_attach イベントを追加しました。
  • 問題の修正と改善: さまざまな問題の修正と全般的な改善を行いました。

インテル® VTune™ プロファイラー 2025.7.0

  • ITT API コード・アノテーションの強化: インストルメンテーションおよびトレーシング・テクノロジー (ITT) API にフォーマットされたメタデータ API が導入され、printf 形式でフォーマットされた文字列データをタスクに添付できるようになりました。タイムラインのツールチップで豊富なコンテキスト情報を表示できるようになり、ボトムアップ解析ビューのグループ化も改善されました。
  • メモリーアクセス解析の拡張: 関数ごとのメモリー帯域幅メトリックが追加され、関数レベルでのメモリー使用量に関する詳細な情報が提供されるようになりました。
  • ファイナライズの高速化: 大規模な計算タスクとマルチ GPU を使用するワークロードで、ファイナライズが最大 2 倍高速化しました (内部のベンチマークの結果)。
  • CPU/GPU カーネルの接続を含むタイムラインの拡張: CPU と GPU カーネル実行の関係を視覚化するテクニカルプレビュー機能で、有効にするには AMPLXE_EXPERIMENTAL=tasks-overview を指定します。
  • 新しいハードウェアのサポート: インテル® Arc™ B シリーズ・グラフィックス (開発コード名 Battlemage) とインテル® Core™ Ultra 3 プロセッサー (開発コード名 Panther Lake) をサポートしました。
  • 問題の修正とセキュリティーの更新: 重大な問題の修正とセキュリティーの更新が含まれます。
  • サポートの終了:
    • オペレーティング・システム: FreeBSD と Amazon Linux のサポートを終了しました。
    • IDE サポート: Eclipse 統合と Microsoft Visual Studio 2019 16.x のサポートを終了しました。
    • CPU プラットフォームのサポート: インテル® Xeon® プロセッサー・ファミリー (開発コード名 Ice Lake およびそれ以前)、第 3 世代インテル® Xeon® スケーラブル・プロセッサー・ファミリー (およびそれ以前)、第 10 世代インテル® Core™ プロセッサー (およびそれ以前) のサポートを終了しました。

インテル® Advisor 2025.4.0

  • 問題の修正とセキュリティーの更新: 重大な問題の修正とセキュリティーの更新が含まれます。
  • サポートの終了: Amazon Linux と Microsoft Visual Studio 2019 16.x のサポートを終了しました。

インテル® oneAPI スレッディング・ビルディング・ブロック 2022.3.0

  • プレビュー: タスクグループの依存関係: 新しいプレビュー機能で、ユーザーは task_group タスクに依存関係を追加できるようになり、スケーラブルなタスクグラフを実現する高レベルでユーザーフレンドリーな API を使用した明示的なタスク管理が復活しました。
  • タスクアリーナとタスクグループの使用の簡素化: 新しい機能により、task_arena と task_group の使用が簡単になりました。task_arena::enqueue と task_arena::wait_for による柔軟なワーク管理も含まれます。
  • Linux cgroups のサポートの改善: Linux cgroups を使用して設定された CPU リソース制限を適切に考慮するようになり、Kubernetes や Docker などの環境でのパフォーマンスが向上しました。
  • ミューテックスのスケーラビリティーの向上: spin_mutex と queuing_mutex のテスト操作およびテストとセット操作により、スケーラビリティーが大幅に向上しました。
  • カスタム・アサーション・ハンドラーのサポート: カスタム・アサーション・ハンドラーのサポートが復活し、開発者はインテル® oneTBB のアサーションに独自のハンドラーを設定できるようになりました。

インテル® インテグレーテッド・パフォーマンス・プリミティブ 2022.3.0

  • 新しいハイパフォーマンスな複素数演算 API: インテル® AVX-512 対応ハードウェア (開発コード名 Granite Rapids) 向けに最適化された、浮動小数点複素加算および乗算 API (ippsAddProductC_32fc および ippsAddProductC_64fc) を追加しました。高度な信号処理と数学計算を高速化します。
  • イメージ処理の高速化: インテル® AVX-512 対応ハードウェア (開発コード名 Granite Rapids) 上で 16 ビット整数および 32 ビット浮動小数点データ向けに最適化されたアフィン変換機能 (ippiWarpAffine API) を使用することにより、コンピューター・ビジョン・アプリケーションのイメージ変換を高速化します。
  • サードパーティー・ライブラリーとの統合の強化: LZ4 v1.10.0 および GraphicsMagic v1.3.41 のパッチを含み、これらのライブラリーと IPP の機能を統合して、圧縮およびイメージ処理ワークフローを改善します。

インテル® クリプトグラフィー・プリミティブ・ライブラリー 2025.3.0

  • ポスト量子暗号のサポート: ML-KEM ポスト量子アルゴリズムのサポートを追加しました。将来のセキュリティー要件となる量子耐性暗号方式に対応します。
  • 高度なハッシュ・アルゴリズム機能: Keccak ファミリーの拡張可能出力関数 (XOF) のサポートを追加しました。特殊な暗号化アプリケーション向けに柔軟なハッシュ出力長を提供します。
  • SHA3 パフォーマンスの最適化: パフォーマンスを最適化して SHA3 ハッシュ・アルゴリズムを強化しました。高スループットの暗号処理とデータ整合性検証で、高速で安全なハッシュ処理を実現します。

インテル® oneAPI コレクティブ・コミュニケーション・ライブラリー 2021.17.0

  • API の互換性と使いやすさの改良: 新しい onecclCommDestroy および onecclGetErrorString API を含む NCCL のような API アライメントのテクニカルプレビュー機能を追加し、包括的な問題の修正とパフォーマンス最適化を行いました。
  • 柔軟なマルチスレッドとカスタム操作: スケールアップのためにすべての集合操作と pt2pt/グループ API で単一プロセス複数スレッドをサポート、ユーザー定義のリダクション操作をサポート。
  • パフォーマンスとスケーラビリティーの向上: 大規模メッセージ向けに Allgather を最適化 (最大 8 ノードまでスケールアウト)、スケールアップのためにグループ API と pt2pt 操作を拡張、BMG のサポートを追加 (オープンソースで利用可能)。

インテル® oneAPI データ・アナリティクス・ライブラリー 2025.9.0

  • 新機能: kNN 検索向けに SPMD API のサポートを追加、csr_table 変換のメモリー割り当て問題を修正、安定性向上のためにロジスティック回帰の無限大予測エラーを解消。
  • scikit-learn-intelex:
    • kNN 検索向けに SPMD API のサポートを実装し、PCA、EmpiricalCovariance、およびそれらのインクリメンタル・バリアントに配列 API との互換性を追加しました。
    • 問題の修正: GPU 配列の決定関数のエラーを修正、daal4py オブジェクトの再利用問題を修正、ロジスティック回帰の無限大予測エラーを解消。

インテル® oneAPI ディープ・ニューラル・ネットワーク・ライブラリー 2025.3.0

  • ハードウェアのパフォーマンスの向上: インテル® Core™ Ultra プロセッサー (シリーズ 2) 統合 GPU、インテル® Arc™ B シリーズ・グラフィックス・カード (開発コード名 Battlemage)、第 4 世代インテル® Xeon® スケーラブル・プロセッサー (開発コード名 Sapphire Rapids)、インテル® Xeon® 6 プロセッサー (開発コード名 Granite Rapids) を含むインテルの最新のハードウェアでパフォーマンスが向上し、インテル® Xe3 統合 GPU もサポートしました。
  • 新しい RMSNorm 機能: レイヤー正規化プリミティブに、インテル® CPU とインテル® GPU 向けに最適化された二乗平均平方根正規化 (RMSNorm) モードが導入されました。
  • 将来のプロセッサーのサポート: インテル® AVX 10.2 およびインテル® AMX 命令セットに対応した今後登場予定のインテル® Xeon® プロセッサーおよびインテル® Core™ プロセッサーの初期サポートを追加しました。早期アクセスには、ONEDNN_MAX_CPU_ISA 環境変数を使用したオプトインが必要です。

インテル® oneAPI ベース・ツールキット 2025.2.1 パッチリリース

パフォーマンスと開発者の生産性向上を目的として、コンパイラー、oneCCL および PTI の問題を修正しました。

インテル® oneAPI ベース・ツールキット 2025.2.0

ツールキット・レベルの更新

  • インテル® oneAPI DPC++/C++ コンパイラーの Vulkan および DirectX グラフィックス API との SYCL 相互運用性が強化され、クロスプラットフォームの互換性、パフォーマンス、効率性が向上しました。レンダリングやデータ可視化などのアプリケーションに恩恵をもたらします。
  • C++ 開発者は、次の C++26 標準に準拠するように拡張されたインテル® oneAPI DPC++ ライブラリー (インテル® oneDPL) の範囲ベース API を使用して、効率的な並列アルゴリズム・プログラミングのコーディング・オプションを利用できます。インテル® oneDPL のセット・アルゴリズムのパフォーマンス強化も行われました。
  • データセンター・アプリケーション開発者は、インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) の新しい SYCL DFT API を使用して、2D および 3D 非バッチ FFT に複数の GPU を組み合わせて使用できるようになりました。
  • インテル® DPC++ 互換性ツールを使用すると、一般的な AI およびアクセラレーテッド・コンピューティング・アプリケーションで使用される 357 以上の API が自動的に移行され、CUDA コードを SYCL に簡単に移行できます。
  • 高度なスレッド・フィルタリングにより、アクティブなスレッドに焦点を当て、エラー管理を簡素化して、Visual Studio でのデバッグを効率化できます。ゲーム開発やリアルタイム・シミュレーションに最適です。正規表現の検証、エラー処理のオプション、ビジュアル・インジケーターを活用して、効率的で直感的なデバッグ環境を構築できます。
  • さまざまなアセンブリー言語で記述された GPU カーネルにブレークポイントを設定できる機能により、デバッグ・エクスペリエンスを向上しました。AI ワークロードなど、GPU にオフロードされるコードに最適です。インテル® oneDNN やインテル® oneMKL のようなライブラリーからのライブラリー呼び出しのデバッグも含まれており、より合理化された効率良い開発プロセスを実現します。
  • 高精度画像処理アプリケーションのユーザーは、インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) に対応したインテル® CPU で 32 ビット浮動小数点画像を高速に操作および調整できます。インテル® インテグレーテッド・パフォーマンス・プリミティブ (インテル® IPP) のワープ・パースペクティブ関数と最近傍補間を使用するアプリケーションや、インテル® IPP でビルドされた OpenCV を使用するアプリケーションでも同様です。
  • 16 ビット整数画像/信号データを処理するインテル® IPP の位相関数を使用するユーザーは、インテル® AVX2 およびインテル® AVX-512 に対応した CPU でパフォーマンスが数倍高速になります。
  • インテル® クリプトグラフィー・プリミティブ・ライブラリーの新しい XMSS キー/署名生成と強化された SHA3 アルゴリズムを使用して、従来のコンピューティングや量子コンピューティングの脅威からデータを保護することで、アプリケーションのユーザーに将来も通用するデータ・セキュリティーの安全性を提供します。
  • インテル® クリプトグラフィー・プリミティブ・ライブラリーの新しい HKDF アルゴリズムを利用すると、開発者は短く強力な秘密鍵を作成して、データを保護し、安全な通信を行うことができます。
  • AI 開発者は、パフォーマンスのボトルネックを最適化することにより、インテルのクライアント GPU で DirectML ベースの AI アプリケーションのパフォーマンスを向上できます。
  • AI 開発者は、アプリケーションの頻度を理解することで、インテルの NPU で実行される AI アプリケーションのパフォーマンスを最適化できるようになりました。

インテル® oneAPI DPC++/C++ コンパイラー 2025.2.0

新しい OpenMP 6.0 の機能:

  • stripe ループ変換構造を追加しました。ループまたは入れ子のループのストライピングは、GPU オフロードのパフォーマンスを調整するのに役立ちます。
  • targettarget enter/exit data、および target update 構文の nowait 節で、オプションのブール引数を指定して、非同期オフロードと同期オフロードを条件付きで選択できるようになりました。

新しい OpenMP の動作:

  • OpenMP アウトライン・ルーチンのデバッグ情報のサポートを改善しました。以前は一部の変数が gdb により最適化されなかったとレポートされていました。
  • spir64 デバイス向けに、新しいコマンドライン・オプション、-fopenmp-target-teams-default-vla-alloc-mode=malloc/wilocal (デフォルト: wilocal) を追加しました。このオプションにより、teams および distribute 構文にプライベートな可変長配列のローカルコピーの割り当て方法を制御できます。
  • spir64 オフロードされた OpenMP ループのループストライドを制御する新しいコマンドライン・オプション、-fopenmp-target-loop-stride=local-size/global-size/one (デフォルト: local-size) を追加しました。

インテル® oneAPI DPC++ ライブラリー 2022.9.0

  • 並列アルゴリズム向けの範囲ベース API を追加しました。これにより、インテル® oneDPL アルゴリズムの API と次の C++26 標準とのアライメントが向上します。
  • セット・アルゴリズムのパフォーマンスが向上しました。

インテル® DPC++ 互換性ツール 2025.2.0

  • 優先度の高いアプリケーションで使用される 49 の API (cuBlasLt/cuSparse/nvSHMEM/テクスチャー/グラフィックス interop/ASM) と、利用可能なマッピングを含むその他の 308 の API (nvSHMEM/グラフ) の移行をサポートすることにより、API カバレッジを強化しました。
  • 5 つのセマフォーと 4 つの API で、CUDA Vulkan/DX グラフィックス interop の移行をサポートしました。

インテル® oneAPI マス・カーネル・ライブラリー 2025.2.0

  • 複数の GPU で 2/3D 非バッチ FFT を計算するための PVC サポートを備えた分散 SYCL DFT API を導入しました。
  • SYCL RNG デバイス API で counter_engine_adaptor と (u)int8/16 型をサポートしました。
  • コンパイラー・チームがバージョン 2025.0.1 で導入したデバイスイメージ圧縮機能がインテル® oneMKL 2025.2 ビルドで有効になりました。この機能により、Linux の静的ライブラリーと動的ライブラリー、および Windows の動的ライブラリーで、大規模なカーネルを含む SYCL ライブラリーのサイズが約 12%~40% 削減されます。

インテル® ディストリビューションの GDB 2025.2.0

  • VS および VSCode の IDE にスレッド・フィルタリング・オプションを追加しました。
  • CLI スレッドフィルター機能を強化しました。
  • グループスレッド再開機能を追加しました。
  • インテル® oneDNN とインテル® oneMKL 向けのアセンブリー GPU カーネルのデバッグを強化しました。

インテル® VTune™ プロファイラー 2025.4.0

  • PIX マークアップ・デバイス (GPU) 経由で DirectML をサポートしました。
  • NPU パフォーマンス・メトリック (周波数) でレポートされるセットを拡張しました。

インテル® Advisor 2025.2.0

  • セキュリティーおよび問題の修正。

インテル® oneAPI スレッディング・ビルディング・ブロック 2022.2.0

  • NUMA API の予測可能性のため、tbbbind とスタティック HWLOC をリンクしました。

インテル® インテグレーテッド・パフォーマンス・プリミティブ 2022.2.0

  • インテル® IPP でビルドされた OpenCV でインテル® IPP の warp() 呼び出しを有効化しました。
  • ippiWarpPerspectiveLinear_32f_C1R でインテル® AVX-512 最適化を有効化しました。
  • DFT/IDFT_16fc 72 および 216 のパフォーマンスを向上しました。

インテル® クリプトグラフィー・プリミティブ・ライブラリー 2025.2.0

インテル® Core™ Ultra 200V シリーズ (開発コード名 Lunar Lake)、インテル® Core™ Ultra 200S シリーズ (開発コード名 Arrow Lake-S) および新しいインテル® Xeon® スケーラブル・プロセッサー (開発コード名 Clearwater Forest) 向けに SM4 および SHA-512 ハッシュ・ファミリー・アルゴリズムを最適化しました (最適化はそれぞれ新しい SM4 および SHA512 命令ベース)。

  • ECDSA (署名および検証)、公開鍵生成、NIST p256r1 曲線上の ECDHE のインテル® AVX-IFMA 実装により Crypto Multi-Buffer ライブラリーを拡張しました。
  • RFC-5869 で定義されている HKDF (HMAC (Hashed Message Authentication Code、ハッシュメッセージ認証コード) ベースの鍵導出関数) をサポートしました。
  • FIPS PUB 202 で定義されている SHA3-224、SHA3-256、SHA3-384、SHA3-512、SHAKE128 および SHAKE256 ハッシュ・アルゴリズムをサポートしました。
  • eXtended Merkle Signature Scheme (XMSS) アルゴリズムの鍵生成と署名生成をサポートしました。

インテル® oneAPI コレクティブ・コミュニケーション・ライブラリー 2021.16.0

  • Allgather、Allreduce および ReduceScatter の記録と再生で SYCL グラフをサポート。
  • Allgather のリング・アルゴリズムの SYCL ベースの実装。
  • Broadcast の SYCL ベースの実装。
  • Allgather および ReduceScatter スケールアップ実装のマルチスレッド・サポート。
  • CPU のブロッキング操作を指定するコミュニケーターの属性。

インテル® oneAPI データ・アナリティクス・ライブラリー 2025.6.0

  • 特徴量 4,000 以上の線形回帰のパフォーマンスを向上しました。
  • AMD での高度な SIMD 命令セットの使用をサポートしました。
  • 相関距離メトリックを追加しました。
  • 行数が多いときに GPU K 平均法で発生していたクラッシュを修正しました。

インテル® oneAPI ディープ・ニューラル・ネットワーク・ライブラリー 2025.2.0

  • インテル® Core™ Ultra プロセッサー (シリーズ 2) の統合 GPU (開発コード名 Lunar Lake および Arrow Lake) とディスクリート GPU (開発コード名 Battlemage) でのパフォーマンスを向上しました。
  • インテル® Xeon® 6 プロセッサー (開発コード名 Granite Rapids) でのパフォーマンスを向上しました。
  • グラフ API を使用した SDPA、MLP、GQA 融合パターンの柔軟性を向上しました。

インテル® oneAPI ベース・ツールキット 2025.1.3 パッチリリース

インテル® プロファイリング・ツール・インターフェイス (インテル® PTI) の問題を修正しました。

インテル® oneAPI ベース・ツールキット 2025.1.2 パッチリリース

インテル® oneCCL とインテル® PTI の問題を修正しました。

インテル® oneAPI ベース・ツールキット 2025.1.1 パッチリリース

コンパイラー、インテル® oneCCL、インテル® oneDNN、インテル® PTI、インテル® VTune™ プロファイラー、インテル® Advisor、GDB の問題を修正しました。

インテル® oneAPI ベース・ツールキット 2025.1.0

ツールキット・レベルの更新

  • インテル® oneAPI DPC++/C++ コンパイラーは、すでに CPU でサポートしているメモリー・サニタイザーの機能を、GPU を含むデバイス側に拡張します。この拡張により、開発者は CPU とデバイスコードの両方で問題を簡単に検出してトラブルシューティングできるため、より信頼性が高いアプリケーションを実現できます。
  • インテル® oneAPI DPC++/C++ コンパイラーは、ビルド時間を大幅に短縮する ccache (英語) をサポートしました。以前のコンパイルをキャッシュして再利用することで、反復処理が高速化し、ワークフローが効率化されます。開発者は、ビルドに時間をかけずに、高品質のコードの作成に集中できます。
  • インテル® oneAPI DPC++/C++ コンパイラーのコード・カバレッジ・ツールには、C/C++、SYCL、OpenMP を使用するアプリケーション向けの GPU サポートと拡張 CPU カバレッジが追加されました。テスト済みおよび未テストのコードセクションを識別するための詳細な解析と包括的な HTML レポートが提供されることにより、テストカバレッジとコード品質が向上し、ワークフローへの容易な統合が保証されます。
  • インテル® oneAPI DPC++/C++ コンパイラーの Altera FPGA の統合サポートは 2025.1 リリースで削除されました。Altera は、専用の FPGA ソフトウェア開発ツールにより FPGA サポートを引き続き提供します。既存のユーザーは、FPGA 開発をサポートし、APT、YUM/DNF、Zypper などの Linux パッケージ・マネージャーから利用できる、インテル® oneAPI DPC++/C++ コンパイラー 2025.0 リリースを引き続き使用できます。有効なサポートライセンスをお持ちのユーザーは、カスタマー・サポート・アカウントからインテル® oneAPI DPC++/C++ コンパイラー 2025.0 リリースにアクセスできます。
    Altera 開発ツールへの移行に関する詳細とサポートについては、Altera の担当者までお問い合わせください。
  • GPU カーネルは、インテル® oneAPI DPC++ ライブラリー (インテル® oneDPL) (英語) の copytransformorder-changinggeneration および set operations を含むアルゴリズムを最大 3 倍高速に実行します。また、copytransform および merge 範囲ベースの C++20 標準アルゴリズムのサポートも追加しました。
  • インテル® oneAPI マス・カーネル・ライブラリーでサポートしている機能に幾何分布が追加され、開発者の乱数分布の選択肢が増えました。
  • インテルのディスクリート GPU および統合 GPU の特定のケースで高速フーリエ変換のパフォーマンスが向上し、ワークロードの実行が高速化されます。
  • インテル® oneAPI スレッディング・ビルディング・ブロック (インテル® oneTBB) で任意の次元のテンソルの並列処理が可能になりました。新しい blocked_nd_range 機能により 3 次元から N 次元までサポートが拡張されます。
  • インテル® VTune™ プロファイラー
    • DirectML または WinML API を呼び出す AI ワークロードのパフォーマンス・ボトルネックを特定します。
    • GPU と NPU のオフロードのボトルネックを 1 つのビューで確認することにより、アクセラレーターの全体的なパフォーマンスを把握します。
    • Python 3.12 で最も時間のかかるコード領域とクリティカルなコードパスをピンポイントで特定します。
  • インテル® DPC++ 互換性ツールを使用すると、一般的な AI およびアクセラレーテッド・コンピューティング・アプリケーションで使用される 158 以上の API が自動的に移行され、CUDA コードを SYCL に簡単に移行できます。
  • ゲーム、グラフィックス、コンテンツ作成の開発者と ISV は、C++ with SYCL を使用して GPU 高速化を行うことにより、リアルタイムのビジュアル AI とゲームのエクスペリエンスを実現できます。
    • Vulkan および DirectX 12 との SYCL 相互運用性が強化され、GPU からイメージ・テクスチャー・マップ・データを直接共有できるようになり、CPU と GPU 間の余分なイメージコピーが排除され、イメージ処理と高度なレンダリング・アプリケーションでシームレスなパフォーマンスが確保され、コンテンツ作成の生産性が向上します。
  • インテル® ディストリビューションの GDB は、最新の状態を維持し、効果的なアプリケーションのデバッグをサポートする最新の機能拡張に合わせて、GDB 15.2 をベースとするように変更されました。
  • Linux マシンでデバッグするとき VSCode をデフォルトでステップ実行する scheduler-locking IDE オプションが追加されました。正確な制御と強化されたデバッグ・エクスペリエンスが提供されます。
  • インテル® ディストリビューションの GDB は、既存の Windows でのサポートに加えて、Linux でインテル® Core™ Ultra プロセッサー (シリーズ 2) およびインテル® Arc™ B シリーズ・グラフィックスをサポートしました。開発者は、これらの新しい CPU と GPU でアプリケーション・コードを効率良くデバッグできます。
  • インテル® インテグレーテッド・パフォーマンス・プリミティブの、最大 512 メガピクセルの画像サイズをサポートし、高性能でメモリー・オーバーヘッドの少ない画像スケーリングを実現する、インプレース MulC 関数を使用して画像処理アプリケーションを強化します。
  • インテル® インテグレーテッド・パフォーマンス・プリミティブの、セルラーシステムの重要な要求に合わせて特別に調整された拡張離散フーリエ変換 (DFT) を使用して 5G 信号処理を最適化します。
  • インテル® Core™ Ultra 200V シリーズ、インテル® Core™ Ultra 200S シリーズおよび新しいインテル® Xeon® スケーラブル・プロセッサー向けに最適化されたインテル® クリプトグラフィー・プリミティブ・ライブラリーの SM4 および SHA-512 ハッシュ・アルゴリズムを使用して、安全かつ効率的なアプリケーションを開発できます。
  • 開発者は、インテル® Xeon® プロセッサー向けに最適化されたインテル® oneDNN を使用して、行列乗算と畳み込みのパフォーマンスを強化できます。これらの改良は、インテル® アドバンスト・マトリクス・エクステンション (インテル® AMX) 命令セットを活用した、データセンターの AI ワークロードに最適なもので、アプリケーションが最新のインテル® アーキテクチャーで効率的に実行されることを保証します。
  • クライアント CPU で AI 推論を実行する開発者は、インテル® Arc™ グラフィックスでインテル® oneDNN を使用することにより、パフォーマンスを向上できます。この最適化により、インテル® Core™ Ultra プロセッサー (シリーズ 2) とインテル® Arc™ B シリーズ・ディスクリート・グラフィックスの機能が最大限に活用されます。AI アプリケーションが高速かつ効率的に実行されるようになり、開発作業が強化されます。
  • 開発者は、インテル® oneDNN の暗黙的なカジュアルマスクを使用して、ゲート付き多層パーセプトロン (ゲート付き MLP) と SPDA (Scaled Dot-Product Attention) のパフォーマンスを向上させ、AI モデルを最適化できます。Graph API を通じて int8 または int4 圧縮キーと値をサポートすることで、速度と効率の両方を向上させ、強力で応答性の高い AI アプリケーションを作成できます。
  • インテル® oneCCL の Allreduce と Reduce-Scatter 集合操作に Average のサポートが追加され、多くの操作で集合操作を活用できるようになりました。
  • インテル® oneCCL の集合操作をサポートするグループ API の拡張機能と、コミュニケーターを分割する新しい API により、開発者は集合通信をより細かく制御できます。
  • インテル® oneCCL の Alltoall のパフォーマンス最適化により、ユーザーは効率良くスケールアップできます。
  • 2025.1 リリースで、コンポーネントの env/vars スクリプトに引数 (例: key=value1,value2,value3,...) を渡せるように、構成ファイルが拡張されました。
    これらの引数を定義するには、次の引数リスト行を含む `config.txt` ファイルを作成します。

    mkl=latest,lp64 ilp64
    ipp=exclude
    compiler=latest,--include-intel-llvm,vs2022
    ippcp=2025.0
    dpcpp-ct=latest,vs2017
    tbb=2022.1,all
    上記の例では、

    • 各キーの最初の引数は必須ですが、残りの引数はオプションです。
    • 最初の引数には、コンポーネント・ディレクトリーの最上位にあるバージョン・ディレクトリーを指定します。シンボリック・リンクにすることもできます。
    • 後の引数はカンマ区切りで、追加の構成オプションを指定します。

インテル® oneAPI DPC++/C++ コンパイラー 2025.1.0

  • グラフィックス API DirectX 12 および Vulkan interop との SYCL 相互運用性を追加しました。開発者は、インテル® グラフィックス上で非常に効率的なビジュアル・コンピューティング、メディア処理、レンダリング・アプリケーションを作成できるため、パフォーマンスと開発者の生産性の両方が向上します。
  • メモリー・サニタイザーの機能を、GPU を含むデバイス側に拡張します。この拡張により、開発者は CPU とデバイスコードの両方で問題を簡単に検出してトラブルシューティングできるため、より信頼性が高いアプリケーションを実現できます。
  • ビルド時間を大幅に短縮する ccache (英語) をサポートしました。以前のコンパイルをキャッシュして再利用することで、反復処理が高速化し、ワークフローが効率化されます。開発者は、ビルドに時間をかけずに、高品質のコードの作成に集中できます。
  • コード・カバレッジ・ツールには、C/C++、SYCL、OpenMP を使用するアプリケーション向けの GPU サポートと拡張 CPU カバレッジが追加されました。テスト済みおよび未テストのコードセクションを識別するための詳細な解析と包括的な HTML レポートが提供されることにより、テストカバレッジとコード品質が向上し、ワークフローへの容易な統合が保証されます。

インテル® oneAPI DPC++ ライブラリー 2022.8.0

  • copy、transform、order-changing、generation および set operation アルゴリズムのパフォーマンスを向上しました。
  • copy、transform、merge アルゴリズムの範囲ベース API を追加しました。

インテル® DPC++ 互換性ツール 2025.1.0

  • 158 の API (82 の cuBLAS/cuSPARSE API、11 のランタイム/ドライバー API、6 つの PTX、36 の SIMD 数学 API、10 のテクスチャー/サーフェス API、1 つの Thrust API、5 つの CUB API、8 つのグラフィックス interop API) の移行を可能にすることにより、API のカバレッジを強化しました。
  • CMake ベースのアプリのビルドスクリプトの移行と、PyTorch ベースのアプリの Python setup.py の移行がさらに向上しました。
  • カスタマイズされた移行ルールを公開することにより、PyTorch (CUDA 向けの C10 API) の移行をサポートしました。
  • 多くの API で API マッピングクエリーがさらに向上しました。
  • 移行をサポートしていない API と DPCT 機能の使用状況情報を収集する新しいテレメトリー・ライブラリーをサポートしました。

インテル® ディストリビューションの GDB 2025.1.0

  • インテル® ディストリビューションの GDB は、最新の状態を維持し、効果的なアプリケーションのデバッグをサポートする最新の機能拡張に合わせて、GDB 15.2 をベースとするように変更されました。
  • Linux マシンでデバッグするとき VSCode をデフォルトでステップ実行する scheduler-locking IDE オプションが追加されました。正確な制御と強化されたデバッグ・エクスペリエンスが提供されます。
  • インテル® ディストリビューションの GDB は、既存の Windows でのサポートに加えて、Linux でインテル® Core™ Ultra プロセッサー (シリーズ 2) およびインテル® Arc™ B シリーズ・グラフィックスをサポートしました。開発者は、これらの新しい CPU と GPU でアプリケーション・コードを効率良くデバッグできます。

インテル® VTune™ プロファイラー 2025.1.0

  • DirectML または WinML API を呼び出す AI ワークロードのパフォーマンス・ボトルネックを特定します。
  • GPU と NPU のオフロードのボトルネックを 1 つのビューで確認することにより、アクセラレーターの全体的なパフォーマンスを把握します。
  • Python 3.12 で最も時間のかかるコード領域とクリティカルなコードパスをピンポイントで特定します。

インテル® Advisor 2025.1.0

  • GPU ルーフラインと GPU 命令ミックスでインテル® Xe マトリクス・エクステンション (インテル® XMX) (シストリック・アレイ) を有効にしました。
  • 全体的な GPU プロファイリングの品質と精度を向上しました。GPU サーベイ収集のオーバーヘッドを軽減しました。

インテル® oneAPI スレッディング・ビルディング・ブロック 2022.1.0

  • 任意の次元のテンソルの並列処理が可能になりました。新しい blocked_nd_range 機能により 3 次元から N 次元までサポートが拡張されます。
  • oneTBB blocked_nd_range のクラス・テンプレート引数推論 (CTAD) の試験的サポートが含まれました。コンパイラーがクラス・テンプレート引数を自動推論できるようになり、コードが簡素化され、使いやすさが向上します。
  • oneTBB parallel_phase API を使用して CPU スレッドリソースの共有に影響を与え、フェーズ内のレイテンシーを最小限に抑える機能を備えた、複数の並列処理フェーズを持つアプリケーションを提供します。

インテル® インテグレーテッド・パフォーマンス・プリミティブ 2022.1.0

  • 画像の MulC 機能に新しいインプレース API を追加しました。
  • 5G で重要な信号サイズに合わせて、DFT の選択サイズを最適化しました。

インテル® クリプトグラフィー・プリミティブ・ライブラリー 2025.1.0

インテル® Core™ Ultra 200V シリーズ (開発コード名 Lunar Lake)、インテル® Core™ Ultra 200S シリーズ (開発コード名 Arrow Lake-S) および新しいインテル® Xeon® スケーラブル・プロセッサー (開発コード名 Clearwater Forest) 向けに SM4 および SHA-512 ハッシュ・ファミリー・アルゴリズムを最適化しました (最適化はそれぞれ新しい SM4 および SHA512 命令ベース)。

インテル® oneAPI コレクティブ・コミュニケーション・ライブラリー 2021.15.0

  • Allreduce と Reduce-Scatter 集合操作で Average をサポートしました。
  • 集合操作をサポートするグループ API の拡張機能と、開発者が集合通信を細かく制御できるコミュニケーターを分割する新しい API を追加しました。
  • Alltoall のスケールアップのパフォーマンスを最適化しました。

インテル® oneAPI データ・アナリティクス・ライブラリー 2025.1.0

  • RNG プリミティブ関数の統合 API を更新しました。
  • RNG クローンのストリーム処理を変更しました。
  • コードサンプル (C++20 でビルド) の問題を修正しました。

インテル® oneAPI ディープ・ニューラル・ネットワーク・ライブラリー 2025.1.0

  • インテル® AMX 命令セットをサポートするインテル® Xeon® プロセッサー (開発コード名 Sapphire Rapids および Granite Rapids) で matmul と畳み込みプリミティブのパフォーマンスが向上しました。
  • インテル® Core™ Ultra プロセッサー (シリーズ 2) (開発コード名 Lunar Lake) のインテル® Arc™ グラフィックスおよびインテル® Arc™ B シリーズ・ディスクリート・グラフィックス (開発コード名 Battlemage) でのパフォーマンスが向上しました。
  • Xe3 アーキテクチャー・ベースのインテル® GPU の初期最適化を導入しました。
  • ゲート付き多層パーセプトロン (ゲート付き MLP)、暗黙的なカジュアルマスクを使用した SPDA (Scaled Dot-Product Attention)、および Graph API を通じた int8 または int4 圧縮キーと値を使用した SDPA のパフォーマンスが向上しました。

インテル® oneAPI ベース・ツールキット 2025.0.1

インテル® oneAPI ベース・ツールキット 2025.0.1 パッチリリースには、主に問題の修正と品質向上を含む、次のコンポーネントのパッチリリース更新が含まれています。

  • インテル® oneAPI DPC++/C++ コンパイラー 2025.0.4
  • インテル® oneAPI DPC++ ライブラリー 2022.7.1
  • インテル® DPC++ 互換性ツール 2025.0.1
  • インテル® oneAPI マス・カーネル・ライブラリー 2025.0.1
  • インテル® VTune™ プロファイラー 2025.0.1
  • インテル® oneAPI データ・アナリティクス・ライブラリー 2025.0.1
  • インテル® oneAPI ディープ・ニューラル・ネットワーク・ライブラリー 2025.0.1

インテル® oneAPI ベース・ツールキット 2025.0

ツールキット・レベルの更新

  • P-cores 搭載インテル® Xeon® 6 プロセッサー (開発コード名 Granite Rapids) およびインテル® Core™ Ultra プロセッサー (シリーズ 2) (開発コード名 Lunar Lake) のサポートにより最新のハードウェアの性能を最大限に引き出します。
  • インテル® oneAPI ベース・ツールキット (ベースキット) では、特定の開発者ユースケース向けに、ダウンロード・サイズの小さな 2 つのサブセットが提供されるようになりました。インテル® C++ エッセンシャルズは、インテルの CPU と GPU で最も広く利用されているベースキットのパフォーマンス・ライブラリーのコンパイル、デバッグ、利用に重点を置いた C++ 開発者向けのサブセットです。インテル® ディープラーニング・エッセンシャルズは、インテルの CPU と GPU 向けの PyTorch や TensorFlow などのディープラーニング・フレームワークとライブラリーを開発、コンパイル、テスト、最適化するためのツールとライブラリーを含む上級開発者向けのサブセットです。
  • ISO C++ 並列 STL コードは CPU 上で実行され、インテル® oneAPI DPC++/C++ コンパイラーを使用して GPU にオフロードされます。
  • インテル® oneAPI DPC++/C++ コンパイラーの SYCL バインドレス・テクスチャー・サポートを使用すると、動的で柔軟な GPU プログラミングが可能になります。コンパイル時の知識なしに実行時にテクスチャーを利用して、C++ with SYCL アプリケーションのパフォーマンスとスケーラビリティーを向上できます。強力な新しい LLVM サニタイザーは、開発を効率化し、デバイスコードの信頼性を高めます。
  • インテル® Xeon® 6 プロセッサーやインテル® Core™ Ultra プロセッサー (シリーズ 2) を含む最新のインテルのプラットフォームに合わせてカスタマイズされたインテル® oneAPI DPC++/C++ コンパイラーのパフォーマンス最適化機能を利用して、アプリケーションの効率を最大化し、ピーク・パフォーマンスと最先端のコンピューティング・エクスペリエンスを実現します。
  • 効率と柔軟性を高める OpenMP 5.x および OpenMP 6.0 の機能を含む、強化された OpenMP 標準への準拠とインテル® oneAPI DPC++/C++ コンパイラーのパフォーマンスの機能強化を活用します。アップグレードされたコンパイラーの最適化レポート機能は、詳細なパフォーマンス・データと最適化のフィードバックを提供します。
  • インテル® oneDPL により GPU カーネルの実行速度が速くなり、reduce、scan、その他の多くの関数を含むアルゴリズムのパフォーマンスが最大 4 倍向上しました。
  • 20 を超える新しい C++20 標準の範囲とビューを使用したインテル® oneDPL の範囲ベースのアルゴリズムを使用して、マルチアーキテクチャー・デバイスで高速化します。
  • インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) の SYCL 離散フーリエ変換 API に型の安全性のコンパイルメッセージが追加され、使いやすくデバッグしやすくなりました。インテルの GPU 向けのアプリケーション開発時間が短縮されます。
  • インテル® oneMKL の単精度 3D 実数インプレース FFT を使用する HPC ワークロードは、インテル® データセンター GPU マックス・シリーズで高速に実行できます。
  • インテル® oneAPI スレッディング・ビルディング・ブロック (インテル® oneTBB) の task_group、flow_graph、parallel_for_each のスケーラビリティーの向上により、マルチスレッド・アプリケーションを高速に実行します。
  • インテル® oneTBB のフローグラフを使用して共有グラフの重複メッセージを処理し、新しい try_put_and_wait 試験的 API を使用して特定のメッセージを待機することにより、迅速に結果を取得します。
  • インテル® インテグレーテッド・パフォーマンス・プリミティブ (インテル® IPP) は、CET 対応の保護により、制御フロー攻撃からソフトウェアを保護して、悪用リスクを軽減します。最先端のハードウェア強制セキュリティー対策によりソフトウェアを保護します。
  • インテル® クリプトグラフィー・プリミティブ・ライブラリーを使用した RSA 暗号化 (2K、3K、4K) の高速化により、OpenSSL の最大 4 倍の速度を実現します。
  • インテル® クリプトグラフィー・プリミティブ・ライブラリーを使用して、強化された SM3 アルゴリズムでハッシュの未来を体験しましょう。SM3_NI 命令により 5 倍の高速化を実現します。
  • インテル® VTune™ プロファイラーは、GPU 依存のボトルネックを特定し、レンダリング・パイプラインを最適化して、インテル® Core™ Ultra 200V シリーズ (開発コード名 Lunar Lake) 上でのメディアおよびコンテンツ作成アプリケーションの全体的な応答性を向上させます。
  • インテル® VTune™ プロファイラーは、DirectX API のデバイス側の非効率性を特定して最適化します。
  • インテル® Advisor に、適応性のあるカーネル・マッチング・メカニズムが導入されます。開発者は特定の最適化目標に関連するコード領域を識別して解析することが可能です。XCG アプリの統合により、GPU へ計算をオフロードするプロセスが効率化され、インテルの最新のハードウェアでのパフォーマンスが向上します。
  • インテル® oneAPI ディープ・ニューラル・ネットワーク・ライブラリー (インテル® oneDNN) は、大規模言語モデルとスケーリングされたドット積サブグラフのパフォーマンスを大幅に向上します。
  • インテル® oneAPI コレクティブ・コミュニケーション・ライブラリー (インテル® oneCCL) に、ワークロードのスケーリングとパフォーマンス向上を可能にする最適化が追加されました。集合操作の機能が強化され、シングルノード CPU 構成で多くの最適化が利用できるようになりました。
  • インテル® DPC++ 互換性ツールを使用すると、CUDA コードと CMake ビルドスクリプトを SYCL へ容易に移行して、時間を節約できます。一般的な AI、HPC、レンダリング・アプリケーションで使用される 100 を超える API を自動的に移行します。移行したコードは、SYCLcompat で簡単に理解でき、CodePin を使用して簡単にデバッグでき、NVIDIA GPU で実行できます。
  • インテル® DPC++ 互換性ツールを使用して、バインドレス・テクスチャー API を SYCL 画像拡張機能へ移行することにより、画像処理アプリケーションをベンダー依存から解放できます。
  • インテル® ディストリビューションの GDB は、Windows でインテル® Core™ Ultra プロセッサー (シリーズ 2) のサポートを追加しました。開発者は、これらの新しい CPU と GPU でアプリケーション・コードを効率良くデバッグできます。
  • インテル® ディストリビューションの GDB は、最新の状態を維持し、効果的なアプリケーションのデバッグをサポートする最新の機能拡張に合わせて、GDB 15 をベースとするように変更されました。
  • インテル® ディストリビューションの GDB は、デバッガー・パフォーマンスの向上とユーザー・インターフェイスの改良により、コマンドラインと Microsoft Visual Studio および Visual Studio Code 使用時の両方で開発者のエクスペリエンスが向上します。

インテル® oneAPI DPC++ コンパイラー 2025.0.0

  • インテル® oneAPI DPC++/C++ コンパイラーの SYCL バインドレス・テクスチャー・サポートを使用すると、インテルの GPU の動的実行と柔軟なプログラミングが可能になります。開発者はコンパイル時の知識なしに実行時にテクスチャーを利用し、テクスチャー・オブジェクトを活用して、C++ with SYCL アプリケーションのパフォーマンスとスケーラビリティーを向上できます。
  • インテル® oneAPI DPC++/C++ コンパイラーの新しい LLVM サニタイザーを使用して、開発プロセスを合理化できます。デバイスコードの問題を簡単に検出して解決できる強力なツールを提供することにより、クリーンで信頼性の高いアプリケーションを実現します。
  • インテル® Xeon® 6 プロセッサーやインテル® Core™ Ultra プロセッサー (シリーズ 2) を含む最新のインテルのプラットフォームに合わせてカスタマイズされたインテル® oneAPI DPC++/C++ コンパイラーのパフォーマンス最適化機能を利用して、アプリケーションの効率を最大化し、ピーク・パフォーマンスと最先端のコンピューティング・エクスペリエンスを実現します。
  • インテル® oneAPI DPC++/C++ コンパイラーは、OpenMP 5.x および新しい OpenMP 6.0 標準への準拠とパフォーマンス最適化を強化しました。新しい interop のプロパティー、待機なしターゲット同期、フリーエージェント・スレッド/タスク、拡張 OMP_PLACES 構文、高度なスレッド制限制御を特徴とし、比類のない効率と柔軟性でアプリケーションのパフォーマンスを向上するように設計されています。
  • インテル® oneAPI DPC++/C++ コンパイラーの opt-report 機能の大幅なアップグレードにより、コンパイラーの考察が強化され、OpenMP オフロードの詳細を含むユーザーフレンドリーな最適化レポートが提供されるようになりました。また、オープンソースの最適化コメント・フレームワークとの統合により、SYCL および OpenMP ランタイムと AOT コンパイルパスに最適化レポート機能が追加され、アプリケーションのパフォーマンスの改善をより包括的に理解できるようになりました。
  • インテル® oneAPI DPC++/C++ コンパイラーの最新の機能強化により FPGA 開発が合理化されました。使いやすさとパフォーマンスの向上、柔軟なローカル・バッファー・サイズ構成、シームレスな SPIR-V 変換、コマンドオプションの合理化 (-fintelfpga-qactypes を意味し、-fp-model=fastaoc -vpfp-relaxed をトリガー)、ワークフローの簡素化などにより、高速で効率的な FPGA アプリケーション開発が可能になります。

インテル® oneAPI DPC++ ライブラリー 2022.7.0

  • インテル® oneDPL により GPU カーネルの実行速度が速くなり、reduce、scan、その他の多くの関数を含むアルゴリズムのパフォーマンスが最大 4 倍向上しました。
  • 20 を超える新しい C++20 標準の範囲とビューを使用したインテル® oneDPL の範囲ベースのアルゴリズムを使用して、マルチアーキテクチャー・デバイスで高速化します。
  • ISO C++ 並列 STL コードは CPU 上で実行され、インテル® oneAPI DPC++/C++ コンパイラーを使用して GPU にオフロードされます。

インテル® DPC++ 互換性ツール 2025.0.0

  • インテル® DPC++ 互換性ツールを使用すると、CUDA コードと CMake ビルドスクリプトを SYCL へ容易に移行して、時間を節約できます。一般的な AI、HPC、レンダリング・アプリケーションで使用される 100 を超える API を自動的に移行します。移行したコードは、SYCLcompat で簡単に理解でき、CodePin を使用して簡単にデバッグでき、NVIDIA GPU で実行できます。
  • インテル® DPC++ 互換性ツールを使用して、バインドレス・テクスチャー API を SYCL 画像拡張機能へ移行することにより、画像処理アプリケーションをベンダー依存から解放できます。

インテル® oneAPI マス・カーネル・ライブラリー 2025.0.0

  • インテル® Xeon® 6 プロセッサーがターゲットの開発者は、BLAS、LAPACK、FFT などさまざまな分野で、インテル® oneMKL 2025.0 で利用可能なパフォーマンス最適化の恩恵を受けます。
  • 単精度 3D 実数インプレース FFT を使用する HPC ワークロードは、インテル® データセンター GPU マックス・シリーズで大幅なパフォーマンス向上が得られます。
  • SYCL デバイス API を使用した乱数生成 (RNG) に新しい分布モデルとデータ型を利用できます。
  • SYCL 離散フーリエ変換 API に型の安全性のコンパイルメッセージが追加され、使いやすくデバッグしやすくなりました。インテルの GPU 向けのアプリケーション開発時間が短縮されます。
  • SYCL API のスパースドメインで、座標形式 (COO) を使用したスパース (疎) 行列をサポートしました。この形式は、高速な疎行列構築で広く使用されており、圧縮スパース行 (CSR) や圧縮スパース列 (CSC) などのほかの一般的な形式に簡単に変換できます。

インテル® ディストリビューションの GDB 2025.0.0

  • インテル® ディストリビューションの GDB は、Windows でインテル® Core™ Ultra プロセッサー (シリーズ 2) のサポートを追加しました。開発者は、これらの新しい CPU と GPU でアプリケーション・コードを効率良くデバッグできます。
  • 最新の状態を維持し、効果的なアプリケーションのデバッグをサポートする最新の機能拡張に合わせて、GDB 15 をベースとするように変更されました。
  • デバッガー・パフォーマンスの向上とユーザー・インターフェイスの改良により、コマンドラインと Microsoft Visual Studio および Visual Studio Code 使用時の両方で開発者のエクスペリエンスが向上します。

インテル® VTune™ プロファイラー 2025.0.0

  • インテル® Core™ Ultra 200V シリーズ (開発コード名 Lunar Lake)、インテル® Core™ Ultra 200S シリーズ (開発コード名 Arrow Lake-S)、第 6 世代インテル® Xeon® スケーラブル・プロセッサー (開発コード名 Granite Rapids) のサポートを追加しました。
  • GPU 依存のボトルネックを特定し、レンダリング・パイプラインを最適化して、インテル® Core™ Ultra 200V シリーズ (開発コード名 Lunar Lake) 上でのメディアおよびコンテンツ作成アプリケーションの全体的な応答性を向上させます。
  • DirectX API のデバイス側の非効率性を特定して最適化します。
  • Python 3.11 のプロファイル・サポートを追加しました。Python のプロファイルを関心領域のみに集中し、ITT API (英語) を使用してパフォーマンス・データ収集を制御する機能により、生産性が向上しました。
  • インテル® VTune™ プロファイラーのプラットフォーム・プロファイラーの最終リリースがスタンドアロン・ダウンロードとして利用できるようになりました。この最終リリース以降、機能の改善やセキュリティー修正は提供されません。これらの機能は、EMON コマンドライン・インターフェイスに移行されました。詳細は、インテル® VTune™ プロファイラー – プラットフォーム・プロファイラーの移行 (英語) を参照してください。

インテル® Advisor 2025.0.0

  • インテル® Advisor 2025.0.0 では、ハードウェアのサポートが拡張され、インテルの次世代のプラットフォームである P-cores 搭載インテル® Xeon® 6 プロセッサー (開発コード名 Granite Rapids) が含まれました。開発者は、インテル® Advisor の強力な解析機能と最適化機能を最新のハードウェアで利用できます。
  • 適応性のあるカーネル・マッチング・メカニズムが導入されます。開発者は特定の最適化目標に関連するコード領域を識別して解析することが可能です。XCG アプリの統合により、GPU へ計算をオフロードするプロセスが効率化され、インテルの最新のハードウェアでのパフォーマンスが向上します。

インテル® oneAPI スレッディング・ビルディング・ブロック 2022.0.0

  • インテル® oneAPI スレッディング・ビルディング・ブロック (インテル® oneTBB) の task_group、flow_graph、parallel_for_each のスケーラビリティーの向上により、マルチスレッド・アプリケーションを高速に実行します。
  • インテル® oneTBB のフローグラフを使用して共有グラフの重複メッセージを処理し、新しい try_put_and_wait 試験的 API を使用して特定のメッセージを待機することにより、迅速に結果を取得します。

インテル® インテグレーテッド・パフォーマンス・プリミティブ 2022.0.0

  • セキュリティー最優先: インテル® IPP は、CET 対応の保護により、制御フロー攻撃からソフトウェアを保護して、悪用リスクを軽減します。最先端のハードウェア強制セキュリティー対策によりソフトウェアを保護します。
  • 最適化された関数による高速化: ippiNormRel_L2_8u_C*MR がインテルの最新のプラットフォーム (P-cores 搭載インテル® Xeon® 6 プロセッサー (開発コード名 Granite Rapids) および第 4 世代インテル® Xeon® スケーラブル・プロセッサー (開発コード名 Sapphire Rapids)) 向けに最適化されました。
  • スレッドセーフの強化: ippsWinKaiser_32f_I() の問題が修正され、マルチスレッド環境での信頼性が向上しました。
  • インテル® インテグレーテッド・パフォーマンス・プリミティブ・クリプトグラフィー (インテル® IPP クリプトグラフィー) はインテル® クリプトグラフィー・プリミティブ・ライブラリーに名称を変更しました。
  • インテル® Xeon® 6 プロセッサー (開発コード名 Sierra Forest) のディスパッチと、マルチバッファー機能を使用した RSA 暗号化 (2K、3K、4K) の高速化により、OpenSSL の最大 4 倍の速度を実現します。
  • 強化された SM3 アルゴリズムでハッシュの未来を体験しましょう。SM3_NI 命令により 5 倍の高速化を実現します。
  • 安全で強力な ICX コンパイラーを使用して構築されたライブラリーは、ピーク・パフォーマンスを発揮するように最適化されます。

インテル® クリプトグラフィー・プリミティブ・ライブラリー 2025.0.0

  • インテル® インテグレーテッド・パフォーマンス・プリミティブ・クリプトグラフィー (インテル® IPP クリプトグラフィー) はインテル® クリプトグラフィー・プリミティブ・ライブラリーに名称を変更しました。
  • インテル® Xeon® 6 プロセッサー (開発コード名 Sierra Forest) のディスパッチと、マルチバッファー機能を使用した RSA 暗号化 (2K、3K、4K) の高速化により、OpenSSL の最大 4 倍の速度を実現します。
  • 強化された SM3 アルゴリズムでハッシュの未来を体験しましょう。SM3_NI 命令により 5 倍の高速化を実現します。
  • 安全で強力な ICX コンパイラーを使用して構築されたライブラリーは、ピーク・パフォーマンスを発揮するように最適化されます。

インテル® oneAPI コレクティブ・コミュニケーション・ライブラリー 2021.14.0

インテル® oneAPI コレクティブ・コミュニケーション・ライブラリー 2021.14.0 では、ワークロードのスケーリングとパフォーマンスを向上する、さらなる最適化が可能になります。次のような機能が含まれます。

  • ランク間の通信を改善し、ワークロードを多数のノードにスケールアップできるようにインテル® oneCCL のキー値格納を強化しました。
  • Allgather、Allreduce、Reduce-scatter などの集合操作のパフォーマンスを向上しました。
  • シングルノード CPU 構成のワークロードのさらなる最適化を行いました。
  • 速度とリソース使用率を向上するその他の低レベルの最適化を行いました。

インテル® oneAPI データ・アナリティクス・ライブラリー 2025.0.0

  • 説明可能性 RF アルゴリズムに必要な 2 項分類モデルの SHAP 値の計算が可能になりました。
  • ランダムフォレストのパフォーマンスが向上しました。

インテル® oneAPI ディープ・ニューラル・ネットワーク・ライブラリー 2025.0.0

次の機能が追加されました。

  • AI ワークロードの高速化: 大規模言語モデルとスケーリングされたドット積サブグラフのパフォーマンスが大幅に向上します。
  • インテルのハードウェア向けの最適化: インテルの CPU と GPU 向けにカスタマイズされたインテル® oneDNN の最適化により、最大限の効率とパフォーマンスを実現します。
  • 生産性の向上: インテル® oneDNN の最先端のハードウェア・アクセラレーション・テクノロジーを活用して AI の開発とデプロイを高速化し、時間とリソースを節約します。

終了予定のサポート

  • インテル® oneAPI DPC++/C++ コンパイラーの Altera FPGA の統合サポートは 2025.1 リリースで削除されました。Altera は、専用の FPGA ソフトウェア開発ツールにより FPGA サポートを引き続き提供します。既存のユーザーは、FPGA 開発をサポートし、APT、YUM/DNF、Zypper などの Linux パッケージ・マネージャーから利用できる、インテル® oneAPI DPC++/C++ コンパイラー 2025.0 リリースを引き続き使用できます。有効なサポートライセンスをお持ちのユーザーは、カスタマー・サポート・アカウントからインテル® oneAPI DPC++/C++ コンパイラー 2025.0 リリースにアクセスできます。
    Altera 開発ツールへの移行に関する詳細とサポートについては、Altera の担当者までお問い合わせください。

インストール方法

ツールの使用方法

既知の問題、制限事項、および回避方法

  1. 既知の問題: APT のアップグレード処理中に、インテル® VTune™ コンポーネントのツールキット統合環境内でリンク切れが発生し、ツールキット環境のセットアップ時にインテル® VTune™ 環境の初期化に失敗します。

    回避方法: インテル® VTune™ プロファイラーを再インストールします。新しいバージョンをインストールする前に古いバージョンを削除することも、この問題を回避するのに役立ちます。適切なバージョンへのシンボリック・リンクを手動で設定することもできます。

  2. 既知の問題: Eclipse インストーラー (例: 2025-03 RC1 (英語)) 経由で Eclipse をインストールすると、インテル® oneAPI ツールキットのインストールに失敗し、次のようなエラーメッセージが表示されることがあります。
    Warning! "Missing requirement: Intel® C++ Compiler Integration 25.1.0.202501311450
    (com.intel.compiler.oneapi.feature.group 25.1.0.202501311450) requires
    'org.eclipse.equinox.p2.iu; org.eclipse.osgi.services 3.3.0' but it could not be found"
    このメッセージがインストール中に表示された場合でも、Eclipse プラグインのインテル® oneAPI ツールキット向けサンプルブラウザーの機能には影響しません

    回避方法: Eclipse インストーラー (例: 2025-03 RC1 (英語)) を使用して Eclipse をインストールした後、次のコマンドを実行して不足している依存関係を解決します。

    sudo ./eclipse -application org.eclipse.equinox.p2.director -repository http://download.eclipse.org/releases/latest -installIU org.eclipse.osgi.services

    インテル® oneAPI ツールキットを再インストールします。
    注: この問題は、Eclipse IDE for C/C++ Developers パッケージ (例: 2025-03 RC1 (英語)) を使用している場合は発生しません

  3. 既知の問題: Linux マシンでインテル® oneAPI DPC++/C++ コンパイラーを使用する場合、検出された GNU gcc の最新バージョンと同等の g++ パッケージがインストールされていない場合、問題が発生することがあります。エラーと回避策の詳細は、「Fatal Error: 'C++ Header' File Not Found with Intel® oneAPI DPC++/C++ Compiler (致命的なエラー: インテル® oneAPI DPC++/C++ コンパイラーで「C++ ヘッダー」ファイルが見つかりません)」 (英語) を参照してください。
  4. FPGA のサポートはコンパイラーの 2025.1 .0 リリースで削除されました。2025.0.0 の FPGA オプションを使用するには、マシンから 2025.0 ツールセットと 2025.1 ツールセットをアンインストールし、2025.0 ツールセットを再度インストールして、FPGA オプションでサポートしている VS 拡張機能をインストールする必要があります。
  5. 制限事項
    1. インテル® oneAPI 開発ツールの 2025.0 リリース以降、32 ビット・アプリケーションの作成はサポートされません。64 ビット・アプリケーションの作成のみサポートされます。インテル® oneAPI ツールキット 2025.0 に含まれる環境設定スクリプト (setvars、oneapi-vars および modulefiles) では、64 ビット開発環境の初期化のみサポートします。

      インテル® oneAPI ツールキットの古いバージョン (2024.x 以前) を使用して 32 ビットのライブラリーとアプリケーションを開発している場合、32 ビット開発環境を手動で設定する必要があります。例えば、icc コンパイラー 2023.0.0 とインテル® oneMKL ライブラリー 2023.0.0 を使用している場合、ia32 パラメーターを指定して source コマンドで $ONEAPI_ROOT/compiler/2023.0.0/env/vars.sh および $ONEAPI_ROOT/mkl/2023.0.0/env/vars.sh スクリプトを実行して、手動で環境を設定できます。

      インテル® oneAPI ツールキット 2024.x リリースで導入された新しい統合ディレクトリー・レイアウトを使用している場合、oneapi-vars スクリプトに引数として ia32 を渡すことにより、oneapi-vars スクリプトを使用して 32 ビット開発環境を設定できます (2024.x リリースのみ)。これは、各 oneapi-vars スクリプトが統合ディレクトリー・レイアウトで固有であるためです。この方法は 2024.x リリースでのみ機能します。

      同様に、インテル® oneAPI ツールキットの各リリースには、固有の modulefiles のセットが含まれています。そのため、2025.0 以前のツールキットを参照する場合のみ、ユーザーは modulefiles を使用して 32 ビット開発環境を設定できます。

    2. 仮想マシンでの GPU コードの実行は、現在サポートされていません。

    3. オフラインの導入ガイドをダウンロードした場合、Chrome ではウィンドウサイズを変更するとテキストが消えることがあります。この問題を解決するには、ブラウザーウィンドウのサイズを再度変更するか、別のブラウザーを使用してください。

インテル® oneAPI ベース・ツールキットに含まれるツールのリリースノート

法務上の注意書き

インテルのテクノロジーを使用するには、対応したハードウェア、ソフトウェア、またはサービスの有効化が必要となる場合があります。

絶対的なセキュリティーを提供できる製品またはコンポーネントはありません。

実際の費用と結果は異なる場合があります。

© Intel Corporation. Intel、インテル、Intel ロゴ、その他のインテルの名称やロゴは、Intel Corporation またはその子会社の商標です。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。

本資料は、(明示されているか否かにかかわらず、また禁反言によるとよらずにかかわらず) いかなる知的財産権のライセンスも許諾するものではありません。

本資料で説明されている製品には、エラッタと呼ばれる設計上の不具合が含まれている可能性があり、公表されている仕様とは異なる動作をする場合があります。現在確認済みのエラッタについては、インテルまでお問い合わせください。

インテルは、明示されているか否かにかかわらず、いかなる保証もいたしません。ここにいう保証には、商品適格性、特定目的への適合性、および非侵害性の黙示の保証、ならびに履行の過程、取引の過程、または取引での使用から生じるあらゆる保証を含みますが、これらに限定されるわけではありません。


製品および性能に関する情報

性能は、使用状況、構成、その他の要因によって異なります。詳細については、https://www.intel.com/PerformanceIndex/ (英語) を参照してください。