NVIDIA一強揺さぶるGoogle・セレブラスAI半導体包囲網

AI半導体の主戦場が推論へ移る背景

AI半導体市場では、NVIDIAの強さがなお際立っています。同社は2026年5月20日、2027年度第1四半期の売上高が816億1500万ドル、データセンター売上高が752億4600万ドルだったと発表しました。次四半期の売上高見通しも910億ドル前後で、中国向けデータセンター計算売上を織り込まない前提です。

それでも市場の関心は、単純な成長率から競争構造へ移りつつあります。学習用GPUの不足がAIブームを動かした局面から、AIエージェントや検索、業務アプリが常時推論を走らせる局面へ移るためです。推論では、最高性能だけでなく、レイテンシ、消費電力、メモリー帯域、クラウド料金、運用ソフトまで含めた費用対効果が問われます。

この変化が、GoogleのTPU、Cerebrasのウェハースケール半導体、AWSや中国勢の自社AIチップに機会を生んでいます。NVIDIAが崩れるというより、AIインフラのどの層を誰が握るのかが再定義され始めています。

NVIDIAの成長を支えるAI工場戦略

決算が示す需要の厚み

NVIDIAの最新決算は、AI投資が失速していないことを明確に示しました。2027年度第1四半期の売上高は前年同期比85%増で、データセンター売上高は92%増です。CFOコメンタリーによると、データセンター売上の約半分はハイパースケーラー、残りはAIクラウド、産業、企業、ソブリン需要などから生まれています。

この内訳は重要です。NVIDIAの売上は一部の大手クラウドに偏っているとの懸念を受けてきましたが、同社は報告区分を「データセンター」と「エッジコンピューティング」に再編し、さらにデータセンター内を「ハイパースケール」と「AI Clouds, Industrial, Enterprise」に分けました。GPUの販売台数ではなく、AIを生産する基盤全体を市場として示す狙いがあります。

同社は供給面でも先行投資を続けています。CFO資料では、在庫が258億ドル、供給関連コミットメントが1190億ドルに達したことが示されました。これは数四半期先の需要を取りに行く姿勢であり、AIサーバーの納入能力そのものが競争力になっていることを意味します。

AP通信は、NVIDIAの決算が市場予想を上回った一方で、時間外取引では株価が小幅安になったと報じました。期待を超える数字を出しても反応が鈍いのは、投資家が「成長の有無」ではなく「この成長がどこまで持続するか」を見始めているためです。

CUDAとNVLinkが作る移行コスト

NVIDIAの強みはGPU単体ではありません。Blackwell、NVLink、InfiniBand、Spectrum-X、Dynamo、CUDA-Xなどを組み合わせ、AIモデルの学習から推論、ネットワーク、ストレージ、運用までを一体のプラットフォームとして提供している点にあります。

とくに大規模モデルでは、GPUの演算性能だけでなく、GPU間をどう接続し、HBMにどうデータを置き、推論リクエストをどう分散するかが性能を左右します。NVIDIAが「AI工場」という言葉を使うのは、データセンターを単なる計算資源ではなく、トークンを継続的に生産する産業設備として捉えているからです。

この構造は顧客の移行コストも高めます。開発者はCUDA、PyTorch、NVIDIAの推論ライブラリ、クラウド上のGPUインスタンスに慣れています。既存コード、運用監視、チューニング、ベンダーサポートまで含めると、単に安いチップが出たから乗り換えるという判断にはなりにくいのです。

一方で、プラットフォーム化は死角も生みます。クラウド事業者や大手AI企業から見れば、NVIDIA依存はコスト交渉力を弱め、供給制約にもつながります。推論需要が爆発するほど、顧客は「すべてをNVIDIAで動かす」よりも、「用途ごとに最適な半導体を組み合わせる」誘因を強めます。

GoogleとCerebrasが狙う推論のくさび

TPUが変えるクラウドの価格設計

GoogleのTPU戦略は、NVIDIAのGPU市場を横から削る最も現実的な対抗軸です。Googleは2025年4月、推論向けに設計した第7世代TPU「Ironwood」を発表しました。Ironwoodは最大9216チップのポッド構成で42.5エクサフロップスをうたい、1チップあたり192GBのHBM、7.37TB毎秒のメモリー帯域を備えます。

Googleが狙うのは、半導体そのものの外販ではなく、クラウド全体の原価構造です。GeminiやGoogle検索、Workspace、広告、Google CloudのAIサービスは、大量の推論を継続的に走らせます。自社設計のTPUを使えば、モデル、コンパイラ、ネットワーク、データセンターを同時に最適化でき、トークン当たりコストを下げやすくなります。

2026年4月には、第8世代TPUとして学習向けのTPU 8tと推論向けのTPU 8iを分ける方針も示しました。Googleによれば、TPU 8tは1つのスーパーポッドで9600チップ、2ペタバイトの共有HBM、121エクサフロップスの計算性能を持ちます。TPU 8iは低遅延推論を重視し、288GBのHBMと384MBのオンチップSRAMを組み合わせ、前世代比で性能単価を80%改善するとしています。

この分化は、AIエージェント時代の設計思想を映しています。学習は巨大な同期計算で、推論は短い待ち時間と安定した応答が価値です。GoogleはTPU 8iでBoardflyという新しいネットワーク構成を使い、Mixture of Experts型モデルのような通信の多い推論に合わせています。GPUの汎用性に対し、TPUはクラウド内での最適化で勝負する構図です。

ただし、TPUは万能の代替品ではありません。Google自身もNVIDIAのVera RubinインスタンスをGoogle Cloudで提供する方針を示しており、顧客がGPUを求める場面は残ります。TPUの本質はNVIDIA排除ではなく、Googleが自社クラウドの価格、供給、サービス差別化を自分で握ることにあります。

WSE-3が狙う低遅延推論

Cerebrasは、Googleとは別の角度からNVIDIAの牙城にくさびを打ち込んでいます。同社のWSE-3は、5ナノメートル世代のウェハースケールエンジンで、4兆個のトランジスタ、90万個のAIコア、44GBのオンチップSRAM、125ペタフロップスのピークAI性能をうたいます。一般的なGPUを多数つなぐ設計ではなく、巨大な1枚のチップに計算資源を集約する発想です。

この設計の価値は、推論の遅延を左右するデータ移動にあります。大規模言語モデルの推論は、入力を処理するプリフィルと、回答を1トークンずつ生成するデコードで性質が異なります。デコードではメモリーとの往復が詰まりやすく、オンチップメモリーと内部帯域を大きく取るCerebrasの設計が効きやすい領域です。

AWSがCerebrasと複数年の提携を結び、WSE-3をクラウドで提供する方針を示したことは象徴的です。報道によると、AWSはTrainiumがプリフィルを担い、Cerebrasがデコードを担う分離型アーキテクチャを検討しています。これは、GPUクラスタで何でも処理する設計から、推論工程ごとに異なる半導体を割り当てる設計への転換を示します。

資本市場もこの物語に反応しました。TechCrunchやAxiosによれば、Cerebrasは2026年5月のIPOで約55億ドル超を調達し、公開価格185ドルに対して初値は大きく上回りました。Kiplingerは、同社の2025年売上高が5億1000万ドル、純利益が2億3780万ドルだったと報じています。

もっとも、CerebrasはNVIDIAを全面的に置き換える企業ではありません。ウェハースケールは製造、歩留まり、冷却、供給網、顧客集中のリスクを伴います。Cerebrasの強みは、NVIDIAの巨大なGPUエコシステムを正面から崩すことではなく、低遅延推論や特定クラウド案件で「別解」を提示できる点にあります。

中国規制と電力制約が生む市場の分岐

競争軸を複雑にしているのが、中国市場の分離です。NVIDIAは次四半期見通しで中国向けデータセンター計算売上を織り込まないと明記しました。米国の輸出規制だけでなく、中国側も国産半導体を優先する動きを強めており、NVIDIAがかつてのように中国AI需要を取り込む余地は狭くなっています。

ロイター系の報道では、DeepSeek V4の公開後、ByteDance、Tencent、AlibabaなどがHuaweiのAscend 950系チップの確保に動いているとされます。HuaweiはAscend 950PRを推論のプリフィル、950DTをデコードや学習に向ける計画を示しており、NVIDIAと同じく用途別のシステム設計へ進んでいます。

Cambriconも中国国内のAIチップ需要を取り込んでいます。Tom’s Hardwareは、同社の2026年第1四半期売上高が4億2300万ドル相当になり、前年同期比160%増だったと報じました。中国メーカーは性能面でBlackwell世代に及ばない部分がある一方、調達可能性と政策支援が強い武器になります。

ただし、中国勢の台頭はNVIDIAの世界シェア低下だけを意味しません。輸出規制の強化は、先端GPUの密輸や迂回輸出の摘発も招いています。AP通信は台湾当局がNVIDIAチップ搭載サーバーの中国向け密輸疑惑を捜査していると報じました。AI半導体は商材であると同時に安全保障上の管理対象になり、サプライチェーンの透明性が価格と同じ重みを持ち始めています。

もう一つの制約は電力です。GoogleはTPU 8tと8iで前世代Ironwood比最大2倍の性能電力比をうたい、液冷やネットワーク統合を強調しています。推論需要が常時稼働型になるほど、1チップの性能より、データセンター全体で何ワット当たり何トークンを生むかが競争力になります。AI半導体競争は、設計技術だけでなく、電力、冷却、土地、規制対応を含むインフラ競争へ広がっています。

投資家と企業が確認すべき競争軸

NVIDIAの一強は、短期で崩れる構図ではありません。売上規模、粗利益率、ソフトウェア資産、クラウドでの採用、供給網の前倒し投資を見れば、AIインフラの中心にいる事実は揺らいでいません。むしろ最新決算は、同社がGPUメーカーからAI工場プラットフォーム企業へ進化していることを示しました。

それでも、競争の焦点は確実に変わっています。企業が見るべき指標は、GPU性能比較だけではありません。推論のトークン単価、モデルごとのレイテンシ、HBM調達、電力当たり性能、クラウドの囲い込み、輸出規制の影響、顧客集中リスクを合わせて評価する必要があります。

投資家にとっても、NVIDIA対その他という単純な図式では不十分です。Googleはクラウド原価を下げるためにTPUを使い、Cerebrasは低遅延推論でニッチを拡大し、中国勢は政策と調達制約を背景に国内市場を押さえます。AI半導体の次の勝者は、最速のチップを作る企業ではなく、用途別に最も安定して計算資源を届けられる企業です。

参考資料:

NewsHub.JP

NVIDIA一強揺さぶるGoogle・セレブラスAI半導体包囲網

AI半導体の主戦場が推論へ移る背景

NVIDIAの成長を支えるAI工場戦略

決算が示す需要の厚み

CUDAとNVLinkが作る移行コスト

GoogleとCerebrasが狙う推論のくさび

TPUが変えるクラウドの価格設計

WSE-3が狙う低遅延推論

中国規制と電力制約が生む市場の分岐

投資家と企業が確認すべき競争軸

関連記事

NVIDIA最高益が映すAIエージェント経済と半導体覇権の行方

富士通とNVIDIA提携の核心 MONAKAとAI基盤は何を変えるか

GoogleのSparkで始まる検索と買い物代行のAI本命戦略

アルファベット円債過去最大、AI投資を支える財務戦略と市場変化

キオクシア営業益1.3兆円予想を生むNAND専業時代の勝ち筋

最新ニュース

中国新5カ年計画、国内完結サプライ網で米中摩擦に備える量より質

加熱式たばこ受動喫煙リスク、厚労省資料で規制見直し議論本格化

伊藤忠BX職に見る事務職再定義と440万人余剰時代の人材戦略

水不足が迫る半導体・データセンター、水処理運営が新成長商機へ

Gemini Spark無料化構想とGoogle広告収益の岐路