2024年3月18日T1
NVIDIA Blackwell B200 発表 ── 生成AI 時代の旗艦 GPU
GTC 2024 で NVIDIA が次世代 GPU アーキテクチャ「Blackwell」と、 その最初の製品 B200 を発表。 2080億トランジスタ、 TSMC 4nm プロセス、 FP4 演算で20 ペタフロップス、 192GB HBM3e メモリ。 2 つのダイを高速インターコネクトで結合したチップレット設計を採用。 GB200 NVL72 はラック1台で1.4 エクサフロップスの AI 計算能力を持つ。 OpenAI、 Microsoft、 Google、 Meta、 Tesla など主要顧客に2024-2025年に出荷され、 生成AI 計算インフラの中核となった。

メタデータ
- 日付
- 2024年3月18日
- 年代
- 2020s
- Tier
- T1
- 参照年表
- 半導体・ハードウェアの歴史
- 出典数
- 05
- 関連項目
- 00
NVIDIA Blackwell B200 発表 ── 生成AI 時代の旗艦 GPU
2024年3月18日、 米国カリフォルニア州サンノゼで開かれた GTC 2024 の基調講演で、 NVIDIA CEO ジェンスン・フアン(Jensen Huang) は次世代 GPU アーキテクチャ「Blackwell」と、 その最初の製品 B200 を発表した。 統計学者 David Harold Blackwell に因んだ名称である。
ChatGPT 公開から1年4ヶ月、 生成AI ブームの計算需要がデータセンター市場を書き換える只中での発表だった。 「我々は新しい産業革命を起こしている」 ── フアンはそう宣言した。
B200 のスペック
B200 は 2080億トランジスタ を搭載する。 TSMC の 4NP(カスタム 4nm)プロセスで製造された2つのダイを、 10TB/s の高速インターコネクト「NV-HBI」で接続するチップレット構成。 単一の論理 GPU として動作する。
主要スペックは以下。
- FP4 推論性能: 20 PFLOPS(H100 の約5倍)
- FP8 訓練性能: 10 PFLOPS(H100 の約2.5倍)
- メモリ: 192GB HBM3e、 帯域 8TB/s
- TDP: 1000W(液冷前提)
新設された FP4(4ビット浮動小数点) は、 推論時の低精度演算で大きなスループットを稼ぐためのフォーマット。 LLM 推論コストの劇的な低下を狙った設計だった。
GB200 NVL72 ── ラックがコンピュータになる
Blackwell の真の主役は、 単体 GPU ではなく GB200 NVL72 と呼ばれるラックスケール・システムである。
1ラックに 36個の Grace CPU と 72個の B200 GPU を載せ、 第5世代 NVLink で全 GPU を1つの巨大な共有メモリ空間として結合。 FP4 で 1.4 エクサフロップス、 13.5TB の HBM3e を搭載。 ラック価格は推定 200万〜300万ドル。
「GPU を買う」という従来の概念から、 「AI 工場を1ラック単位で買う」というモデルへの移行を象徴する製品だった。
遅延 ── マスク欠陥と熱の問題
派手な発表の裏で、 Blackwell は深刻な製造問題に陥っていた。
2024年8月、 The Information が B200 のシリコンマスクに設計欠陥があると報道。 NVIDIA は CoWoS-L パッケージング工程で、 GPU ダイ、 LSI ブリッジ、 RDL インターポーザ、 基板の 熱膨張係数の不整合 によるパッケージ反りを認めた。 上部メタル層とバンプ構造の修正(mask re-spin) が必要となり、 当初の Q3 2024 量産は数ヶ月後ろ倒し。
さらに GB200 NVL72 ラックでは過熱問題が発生。 一部顧客は液冷システムの再設計を強いられた。
最終的に量産は 2024年12月に始まり、 大規模出荷は 2025年第1四半期から本格化。 それでも需要は供給を圧倒し、 新規発注のリードタイムは 6〜12ヶ月。
顧客と TAM
主要 GB200 顧客として確認されたのは ── Microsoft Azure、 Amazon AWS、 Google Cloud、 Oracle Cloud、 Meta、 Tesla、 xAI、 OpenAI、 CoreWeave、 Dell。 ハイパースケーラー4社だけで2024年の AI 設備投資総額は2000億ドルを超え、 その大半が NVIDIA に流れた。
フアンは GTC で「データセンター市場の TAM は 2000億ドル超」と語った。 一年後にはこれを「1兆ドル」に上方修正することになる。
競合 ── AMD MI300X と Google TPU v5p
NVIDIA の独走には対抗馬もあった。
AMD MI300X: 153億トランジスタの CDNA 3 アーキテクチャ、 192GB HBM3。 Microsoft、 Meta が採用を表明。 しかし CUDA エコシステムの壁は厚く、 ソフトウェア対応で遅れを取り続けた。
Google TPU v5p: Google 自身の生成AI 学習に投入。 外販はせず、 Google Cloud 経由でのみ利用可能。
AWS Trainium2、 Microsoft Maia 100: クラウド各社の自社チップ開発も加速。 「いつまで NVIDIA に支払い続けるのか」という戦略的不安が、 各社を自前チップへ向かわせた。
それでも 2024〜2025年の AI チップ市場での NVIDIA のシェアは 90%超。 競合は皆、 まだ「NVIDIA を補完する選択肢」の段階にとどまっていた。
バブル懸念
熱狂の裏では、 冷ややかな見方も育っていた。 「ハイパースケーラーの AI 設備投資は本当に回収できるのか」「LLM の推論コスト低下と、 中国製オープンモデル(DeepSeek 等) の台頭が、 NVIDIA GPU 需要を将来縮小させるのではないか」 ── これらの問いは、 2025年1月の DeepSeek-R1 ショックで現実の市場下落として噴出することになる。
Blackwell B200 は、 生成AI 計算インフラの頂点に立った製品であると同時に、 NVIDIA 一強体制の最盛期を象徴する製品でもあった。 この頂点から、 物語は次の段階 ── 「AI 計算の経済性そのものが問い直される時代」 ── へ移っていく。