中小企業 - オースティンデイリーヘラルド (2024)

GlobEnewswire

2024年6月3日月曜日午前3時UTC

- 更新されたAMD Instinct Acceleratorのロードマップは、リーダーシップAIのパフォーマンスとメモリ機能の年次リズムをもたらします -

- 最大288GBのHBM3Eメモリで、2024年第4四半期に利用可能になると予想される新しいAMD本能MI325Xアクセラレータ。AMD cDNA 4アーキテクチャに基づく新しいAMD Instinct MI350シリーズアクセラレータは、2025年にAI推論パフォーマンスの35倍の世代の増加を期待されると予想されます -

台北、台湾、2024年6月2日(Globe Newswire) - Computex 2024、AMD(NASDAQ:AMD)は、議長兼CEOのリサSU博士によるオープニングの基調講演中に、AMD Instinct™アクセラレータファミリーの勢いが増していることを紹介しました。AMDは、あらゆる世代でリーダーシップのAIパフォーマンスとメモリ機能の年次リズムをもたらす、AMDの本能アクセラレータロードマップを複数年に拡張したことを発表しました。

更新されたロードマップは、2024年第4四半期に利用できる新しいAMD Instinct MI325Xアクセラレータから始まります。その後、新しいAMD cDNA™4アーキテクチャを搭載したAMD本能MI350シリーズは、2025年に利用可能になると予想されます。AMD cDNA 3アーキテクチャを備えたAMD InstinctMI300シリーズと比較したAI推論パフォーマンスの35倍の増加1。2026年に到着する予定のAMD Instinct MI400シリーズは、AMD cDNA「Next」アーキテクチャに基づいています。

「AMD Instinct MI300X Acceleratorsは、Microsoft Azure、Meta、Dell Technologies、HPE、Lenovoなどを含む多数のパートナーや顧客からの強力な採用を続けています。Data Center Accelerated Compute、AMDのコーポレートバイスプレジデント。「最新の毎年恒例の製品のリズムにより、私たちはイノベーションのペースに執lessであり、AI業界と顧客がデータセンターのトレーニングと推論の次の進化を推進することを期待しているリーダーシップの能力とパフォーマンスを提供します。」

AMD AIソフトウェアエコシステムが成熟します
AMD ROCM™6オープンソフトウェアスタックは成熟し続け、AMDの本能MI300Xアクセラレータが最も人気のあるLLMのいくつかの印象的なパフォーマンスを促進できるようになりました。8つのAMD Instinct MI300X AcceleratorsとROCM 6 Running Meta Llama-3 70Bを使用するサーバーでは、顧客は競争と比較して1.3倍の優れた推論パフォーマンスとトークン生成を得ることができます2。ROCM 6を搭載した単一のAMD本能MI300Xアクセラレータでは、Mistral-7Bで1.2倍の競合と比較して、顧客がより良い推論パフォーマンスとトークン生成スループットを得ることができます3。AMDはまた、AIモデルの最大かつ最も人気のあるリポジトリである抱擁フェイスが、AMDの本能MI300Xアクセラレータで箱から出していることを確認するために、最も人気のあるモデルの700,000を毎晩テストしていることを強調しました。さらに、AMDは、Pytorch、Tensorflow、Jaxなどの人気のあるAIフレームワークに上流の作業を継続しています。

AMDは新しいアクセラレータをプレビューし、毎年のケイデンスロードマップを明らかにします
基調講演中、AMDは、AMD Instinct Acceleratorのロードマップがより多くのAI計算の需要を満たすために、更新された年間ケイデンスを明らかにしました。これは、AMDの本能加速器が次世代のフロンティアAIモデルの開発を推進することを保証するのに役立ちます。更新されたAMD Instinct Annual Roadmapが強調表示されています。

  • 新しいAMD Instinct MI325Xアクセラレータは、288GBのHBM3Eメモリとメモリ帯域幅の1秒あたり6テラバイトをもたらし、AMD Instinct MI300シリーズで使用される同じ業界標準のユニバーサルベースボードサーバーデザインを使用し、一般的に2024年第4四半期に入手できます。業界をリードするメモリ容量と帯域幅があり、それぞれ競争よりも2倍と1.3倍になります4、および1.3xが良くなります5競争よりもパフォーマンスを計算します。
  • AMD Instinct MI350シリーズの最初の製品であるAMD Instinct MI350X Acceleratorは、AMD cDNA 4アーキテクチャに基づいており、2025年に利用可能になると予想されています。高度な3NMプロセステクノロジーを使用して構築され、FP4およびFP6 AIデータ型をサポートし、最大288 GBのHBM3Eメモリを持っています。
  • AMD CDNA「Next」アーキテクチャは、AMD Instinct MI400シリーズアクセラレータをパワーすることで、2026年に利用可能になると予想され、推論と大規模なAIトレーニングの追加パフォーマンスと効率のロックを解除するのに役立つ最新の機能と機能を提供します。

最後に、AMDは、AMDの本能MI300Xアクセラレーターの需要が、アクセラレータを使用して、次のような要求の厳しいAIワークロードを強化するために、多数のパートナーや顧客とともに成長し続けていることを強調しました。

ComputexでAMD AIの発表を続けてくださいここそして、の基調講演のビデオリプレイを見るAMD YouTubeページ

サポートリソース

  • フォローしてくださいLinkedIn
  • フォローしてくださいバツ

AMDについて
50年以上にわたり、AMDは高性能コンピューティング、グラフィックス、視覚化技術のイノベーションを推進してきました。数十億人、フォーチュン500の大手企業、世界中の最先端の科学研究機関は、AMDテクノロジーに毎日依存して、彼らがどのように生き、仕事、遊び、遊びをしていますか。AMDの従業員は、可能なことの境界を押し広げるリーダーシップの高性能および適応製品の構築に焦点を当てています。AMDが今日どのように有効になり、明日インスピレーションを与えているかの詳細については、AMD(NASDAQ:AMD)をご覧くださいWebサイトブログLinkedIn、 そしてバツページ。

©2024 Advanced Micro Devices、Inc。All Rights Reserved。AMD、AMD Instinct、AMD cDNA、ROCM、およびその組み合わせは、Advanced Micro Devices、Incの商標です。

注意事項
このプレスリリースには、AMD Instinct™アクセラレータファミリー、AMD CDNA™4およびAMDなどのAMD製品の機能、機能、パフォーマンス、可用性、タイミング、および予想される利点など、Advanced Micro Devices、Inc。(AMD)に関する将来の見通しに関する記述が含まれています。CDNA™の「次の」、製品ロードマップ、リーダーシップAIパフォーマンス、成長する勢い、パートナーと顧客の需要は、1995年の民間証券訴訟改革法の安全な港湾条項に従って行われます。「wome」、「may」、「expects」、「believes」、「slung」、「intends "" "projects"、その他の用語などの言葉などの言葉。投資家は、このプレスリリースの将来の見通しに関する記述は、現在の信念、仮定、期待に基づいており、このプレスリリースの日付の時点でのみ発言し、実際の結果を現在の期待とは大きく異なる可能性のあるリスクと不確実性を伴うことに注意してください。このような声明は、特定の既知の未知のリスクと不確実性の対象となります。その多くは、予測が困難であり、一般的にAMDの制御を超えています。将来の見通し情報と声明。実際の結果を現在の期待と大幅に異なる可能性のある重要な要因には、以下に限定されません。IntelCorporationがマイクロプロセッサ市場の優位性とその積極的なビジネス慣行が含まれます。半導体産業の周期的な性質。AMD製品が販売されている産業の市場状況。重要な顧客の喪失。AMDの製品が販売されている競争力のある市場。経済および市場の不確実性。四半期および季節の販売パターン。AMDの技術またはその他の知的財産を適切に保護する能力。好ましくない通貨為替レートの変動。サードパーティ製造業者がAMDの製品を十分な量でタイムリーに製造し、競争力のある技術を使用する能力。必須の機器、材料、基質、または製造プロセスの可用性。AMDの製品の予想される製造利回りを達成する能力。予想される機能とパフォーマンスレベルでタイムリーに製品を導入するAMDの能力。Semi-Custom SoC製品から収益を生み出すAMDの能力。潜在的なセキュリティの脆弱性。IT停止、データ損失、データ侵害、サイバー攻撃などの潜在的なセキュリティインシデント。AMDの製品の注文と出荷を含む不確実性。AMDがサードパーティの知的財産に依存して、新製品をタイムリーに設計および導入します。マザーボード、ソフトウェア、メモリ、およびその他のコンピュータープラットフォームコンポーネントの設計、製造、供給のためのサードパーティ企業へのAMDの依存。AMDがMicrosoftおよびその他のソフトウェアベンダーのサポートに依存して、AMDの製品を実行するソフトウェアを設計および開発します。AMDがサードパーティのディストリビューターとアドインボードパートナーに依存しています。AMDの内部ビジネスプロセスと情報システムの変更または中断の影響。AMDの製品と業界標準のソフトウェアとハ​​ードウェアとの互換性。欠陥のある製品に関連するコスト。AMDのサプライチェーンの効率。サードパーティのサプライチェーンロジスティクス機能に依存するAMDの能力。AMDが灰色市場で製品の販売を効果的に制御する能力。AMDのビジネスに対する気候変動の長期的な影響。輸出規制、関税、貿易保護措置などの政府の行動と規制の影響。延期された税資産を実現するAMDの能力。潜在的な税金負債;現在および将来の請求と訴訟。環境法、紛争鉱物関連の規定、その他の法律または規制の影響。企業責任の問題に関する政府、投資家、顧客、その他の利害関係者からの期待を進化させる。AIの責任ある使用に関連する問題。AMDのメモを管理する契約、Xilinxのメモの保証、および回転信用枠によって課される制限。AMDのビジネスに対する買収、合弁事業、および/または投資の影響、およびAMDの買収企業を統合する能力。結合した会社の資産の減損の影響。政治的、法的および経済的リスクと自然災害。技術ライセンスの購入の将来の障害。有資格者を引き付けて維持するAMDの能力。AMDの株価のボラティリティ。投資家は、AMDの有価証券および交換委員会の申請書のリスクと不確実性を詳細に検討するように促されます。

1MI300-55:2024年5月31日現在の推論パフォーマンスの予測は、将来のAMD cDNA 4ベースのInstinct MI350シリーズアクセラレータの設計に基づいたエンジニアリング推定値を使用して、予測されたAMD cDNA™4パフォーマンスのプロキシとして。トークンからトークンのレイテンシ= 70msリアルタイム、最初のトークンレイテンシ= 5s、入力シーケンス長、出力シーケンス長= 256、4x 8モードMI350シリーズプロキシ(cDNA4)GPUパフォーマンスの比較あたり8倍のMI300X。実際のパフォーマンスは、生産シリコンの最終仕様、システムの構成、推論モデルと使用されるサイズを含むがこれらに限定されない要因に基づいて異なります。

2MI300-54:AMDパフォーマンスラボによる05/28/2024に完了したテストテキストは、各システムのバッチサイズ1および2048入力トークンと128出力トークンを使用してLLAMA3-70Bを生成しました。

構成:
2P AMD EPYC 9534 64コアプロセッサベースの生産サーバー8x AMD INSTINCTM MI300X(192GB、750W)GPU、Ubuntu®22.04.1、およびROCM™6.1.1
vs。
2p Intel Xeon Platinum 8468 48コアプロセッサベースの生産サーバー8x Nvidia Hopper H100(80GB、700W)GPU、Ubuntu 22.04.3、およびCUDA®12.2
このテストでは、各システムの8 GPUが使用されました。

サーバーメーカーは構成が異なる場合があり、結果が異なります。パフォーマンスは、最新のドライバーの使用と最適化によって異なる場合があります。
3MI300-53:AMDパフォーマンスラボによる05/28/2024に完了したテストテキストは、Mistral-7Bモデル比較を使用して測定されたスループットを生成しました。
Mistral-7Bのバッチサイズ56および2048入力トークンと2048出力トークンを使用してテストを実行しました

構成:
2P AMD EPYC 9534 64コアプロセッサベースの生産サーバー8x AMD INSTINCTM MI300X(192GB、750W)GPU、Ubuntu®22.04.1、およびROCM™6.1.1
vs。
2p Intel Xeon Platinum 8468 48コアプロセッサベースの生産サーバー8x Nvidia Hopper H100(80GB、700W)GPU、Ubuntu 22.04.3、およびCUDA®12.2

このテストでは、各システムに1つのGPUのみが使用されました。

サーバーメーカーは構成が異なる場合があり、結果が異なります。パフォーマンスは、最新のドライバーの使用と最適化によって異なる場合があります。
4MI300-48-現在の仕様および /または推定に基づいて、2024年5月22日現在、AMDパフォーマンスラボが実施した計算。AMD Instinct™MI325X OAM Acceleratorは、288GB HBM3Eメモリ容量と6 TFLOPSピークの理論的メモリ帯域幅のパフォーマンスを持つと予測されています。生産シリコンに基づく実際の結果は異なる場合があります。

NVIDIA Hopper H200(141GB)SXM GPUアクセラレータで最も高い公開された結果は、141GB HBM3Eメモリ容量と4.8 TB/S GPUメモリ帯域幅のパフォーマンスをもたらしました。
https://nvdam.widen.net/s/nb5zzzsjdf/hpc-datasheet-sc23-h200-datasheet-3002446

Nvidia Blackwell HGX B100(192GB)700W GPUアクセラレータで最も高い結果が発表された結果、192GB HBM3Eメモリ容量と8 TB/S GPUメモリ帯域幅のパフォーマンスが発生しました。

https://resources.nvidia.com/en-us-blackwell-architecture?_gl = 1*1r4pme7*_gcl_aw*r0nmlje3mtm5njq3ntauq2p3s0nbancynkt4we kmhcrevpd0f1nktyddlwexy1ddlddldddlddddldddddlddddlddddlddddlwexy1dddlwexy1dddlwexy1dddlwexy1dddlwexy1ddddlwexy1dddlwexy1dddlwexy1dddlwexy1dddlwexy1ddlwexy1dddlwexy1dddlwexy1を知っていますQae40wki4thzbawfvajfytghyd3hlqmlzq3pcb0nsvelrqxzzex0j3rq ..

Nvidia Blackwell HGX B200(192GB)GPUアクセラレータで最も高い公開された結果は、192GB HBM3Eメモリ容量と8 TB/S GPUメモリ帯域幅のパフォーマンスをもたらしました。

https://resources.nvidia.com/en-us-blackwell-architecture?_gl=1*1r4pme7*_gcl_aw*R0NMLjE3MTM5NjQ3NTAuQ2p3S0NBancyNkt4QmhCREVpd0F1NktYdDlweXY1dlUtaHNKNmhPdHM4UVdPSlM3dFdQaE40Wk I4THZBaWFVajFyTGhYd3hLQmlZQ3pCb0NsVElRQXZEX0J3RQ..*_gcl_au*MTIwNjg4NjU0Ny4xNzExMDM1NTQ3

5MI300-49:AMD Instinct™MI325X GPUの2024年5月28日現在、AMDパフォーマンスラボが実施した計算により、1307.4 TFLOPSピーク理論ハーフ精密(FP16)、1307.4 TFLOPSピーク理論Blops16形式の精度(BF16)、2614.9 TECHERTET(BF16)8ビット精度(FP8)、2614.9 TOPS INT8フローティングポイントパフォーマンス。実際のパフォーマンスは、最終仕様とシステム構成によって異なります。

NVIDIA H200 SXM(141GB)GPUでの発行:989.4 TFLOPS PEAK理論的精密テンソル(FP16テンソル)、989.4 TFLOPSピーク理論的なBFLOAT16テンソル形式の精密(BF16テンソル)、1,978.9 TFLOPS 1,978.9 TFLOPS PEAC PEAC PEAC PEAC sピーク理論的int8フローティングポイントパフォーマンス。BFLOAT16テンソルコア、FP16テンソルコア、FP8テンソルコア、およびINT8テンソルコアパフォーマンスは、SPARSITYを使用してNVIDIAによって公開されました。比較の目的のために、AMDはこれらの数値を2で割ることにより非散布/密度に変換し、これらの数値が上に表示されます。

nvidia H200出典:https://nvdam.widen.net/s/nb5zzzsjdf/hpc-datasheet-sc23-h200-datasheet-3002446およびhttps://www.anandtech.com/show/21136/nvidia-at-sc23-H200-Accelerator with-hbm3e-and-jupiter-supercomputer-for-2024

注:NVIDIA H200 GPUは、H100製品と同じ公開されたフロップパフォーマンスを持っていますhttps://resources.nvidia.com/en-us-tensor-core/

中小企業 - オースティンデイリーヘラルド (1)
中小企業 - オースティンデイリーヘラルド (2)

連絡先:Aaron Grabeinamd Communications+1(737)256-9518aaron.grabein@amd.comsuresh bhaskaranamd Investor Relations+1(408)749-2845Suresh.bhaskaran@amd.com

中小企業 - オースティンデイリーヘラルド (3)

中小企業 - オースティンデイリーヘラルド (2024)
Top Articles
Latest Posts
Article information

Author: The Hon. Margery Christiansen

Last Updated:

Views: 5614

Rating: 5 / 5 (50 voted)

Reviews: 89% of readers found this page helpful

Author information

Name: The Hon. Margery Christiansen

Birthday: 2000-07-07

Address: 5050 Breitenberg Knoll, New Robert, MI 45409

Phone: +2556892639372

Job: Investor Mining Engineer

Hobby: Sketching, Cosplaying, Glassblowing, Genealogy, Crocheting, Archery, Skateboarding

Introduction: My name is The Hon. Margery Christiansen, I am a bright, adorable, precious, inexpensive, gorgeous, comfortable, happy person who loves writing and wants to share my knowledge and understanding with you.