NVIDIA一強揺さぶるGoogle・セレブラスAI半導体包囲網
AI半導体の主戦場が推論へ移る背景
AI半導体市場では、NVIDIAの強さがなお際立っています。同社は2026年5月20日、2027年度第1四半期の売上高が816億1500万ドル、データセンター売上高が752億4600万ドルだったと発表しました。次四半期の売上高見通しも910億ドル前後で、中国向けデータセンター計算売上を織り込まない前提です。
それでも市場の関心は、単純な成長率から競争構造へ移りつつあります。学習用GPUの不足がAIブームを動かした局面から、AIエージェントや検索、業務アプリが常時推論を走らせる局面へ移るためです。推論では、最高性能だけでなく、レイテンシ、消費電力、メモリー帯域、クラウド料金、運用ソフトまで含めた費用対効果が問われます。
この変化が、GoogleのTPU、Cerebrasのウェハースケール半導体、AWSや中国勢の自社AIチップに機会を生んでいます。NVIDIAが崩れるというより、AIインフラのどの層を誰が握るのかが再定義され始めています。
NVIDIAの成長を支えるAI工場戦略
決算が示す需要の厚み
NVIDIAの最新決算は、AI投資が失速していないことを明確に示しました。2027年度第1四半期の売上高は前年同期比85%増で、データセンター売上高は92%増です。CFOコメンタリーによると、データセンター売上の約半分はハイパースケーラー、残りはAIクラウド、産業、企業、ソブリン需要などから生まれています。
この内訳は重要です。NVIDIAの売上は一部の大手クラウドに偏っているとの懸念を受けてきましたが、同社は報告区分を「データセンター」と「エッジコンピューティング」に再編し、さらにデータセンター内を「ハイパースケール」と「AI Clouds, Industrial, Enterprise」に分けました。GPUの販売台数ではなく、AIを生産する基盤全体を市場として示す狙いがあります。
同社は供給面でも先行投資を続けています。CFO資料では、在庫が258億ドル、供給関連コミットメントが1190億ドルに達したことが示されました。これは数四半期先の需要を取りに行く姿勢であり、AIサーバーの納入能力そのものが競争力になっていることを意味します。
AP通信は、NVIDIAの決算が市場予想を上回った一方で、時間外取引では株価が小幅安になったと報じました。期待を超える数字を出しても反応が鈍いのは、投資家が「成長の有無」ではなく「この成長がどこまで持続するか」を見始めているためです。
CUDAとNVLinkが作る移行コスト
NVIDIAの強みはGPU単体ではありません。Blackwell、NVLink、InfiniBand、Spectrum-X、Dynamo、CUDA-Xなどを組み合わせ、AIモデルの学習から推論、ネットワーク、ストレージ、運用までを一体のプラットフォームとして提供している点にあります。
とくに大規模モデルでは、GPUの演算性能だけでなく、GPU間をどう接続し、HBMにどうデータを置き、推論リクエストをどう分散するかが性能を左右します。NVIDIAが「AI工場」という言葉を使うのは、データセンターを単なる計算資源ではなく、トークンを継続的に生産する産業設備として捉えているからです。
この構造は顧客の移行コストも高めます。開発者はCUDA、PyTorch、NVIDIAの推論ライブラリ、クラウド上のGPUインスタンスに慣れています。既存コード、運用監視、チューニング、ベンダーサポートまで含めると、単に安いチップが出たから乗り換えるという判断にはなりにくいのです。
一方で、プラットフォーム化は死角も生みます。クラウド事業者や大手AI企業から見れば、NVIDIA依存はコスト交渉力を弱め、供給制約にもつながります。推論需要が爆発するほど、顧客は「すべてをNVIDIAで動かす」よりも、「用途ごとに最適な半導体を組み合わせる」誘因を強めます。
GoogleとCerebrasが狙う推論のくさび
TPUが変えるクラウドの価格設計
GoogleのTPU戦略は、NVIDIAのGPU市場を横から削る最も現実的な対抗軸です。Googleは2025年4月、推論向けに設計した第7世代TPU「Ironwood」を発表しました。Ironwoodは最大9216チップのポッド構成で42.5エクサフロップスをうたい、1チップあたり192GBのHBM、7.37TB毎秒のメモリー帯域を備えます。
Googleが狙うのは、半導体そのものの外販ではなく、クラウド全体の原価構造です。GeminiやGoogle検索、Workspace、広告、Google CloudのAIサービスは、大量の推論を継続的に走らせます。自社設計のTPUを使えば、モデル、コンパイラ、ネットワーク、データセンターを同時に最適化でき、トークン当たりコストを下げやすくなります。
2026年4月には、第8世代TPUとして学習向けのTPU 8tと推論向けのTPU 8iを分ける方針も示しました。Googleによれば、TPU 8tは1つのスーパーポッドで9600チップ、2ペタバイトの共有HBM、121エクサフロップスの計算性能を持ちます。TPU 8iは低遅延推論を重視し、288GBのHBMと384MBのオンチップSRAMを組み合わせ、前世代比で性能単価を80%改善するとしています。
この分化は、AIエージェント時代の設計思想を映しています。学習は巨大な同期計算で、推論は短い待ち時間と安定した応答が価値です。GoogleはTPU 8iでBoardflyという新しいネットワーク構成を使い、Mixture of Experts型モデルのような通信の多い推論に合わせています。GPUの汎用性に対し、TPUはクラウド内での最適化で勝負する構図です。
ただし、TPUは万能の代替品ではありません。Google自身もNVIDIAのVera RubinインスタンスをGoogle Cloudで提供する方針を示しており、顧客がGPUを求める場面は残ります。TPUの本質はNVIDIA排除ではなく、Googleが自社クラウドの価格、供給、サービス差別化を自分で握ることにあります。
WSE-3が狙う低遅延推論
Cerebrasは、Googleとは別の角度からNVIDIAの牙城にくさびを打ち込んでいます。同社のWSE-3は、5ナノメートル世代のウェハースケールエンジンで、4兆個のトランジスタ、90万個のAIコア、44GBのオンチップSRAM、125ペタフロップスのピークAI性能をうたいます。一般的なGPUを多数つなぐ設計ではなく、巨大な1枚のチップに計算資源を集約する発想です。
この設計の価値は、推論の遅延を左右するデータ移動にあります。大規模言語モデルの推論は、入力を処理するプリフィルと、回答を1トークンずつ生成するデコードで性質が異なります。デコードではメモリーとの往復が詰まりやすく、オンチップメモリーと内部帯域を大きく取るCerebrasの設計が効きやすい領域です。
AWSがCerebrasと複数年の提携を結び、WSE-3をクラウドで提供する方針を示したことは象徴的です。報道によると、AWSはTrainiumがプリフィルを担い、Cerebrasがデコードを担う分離型アーキテクチャを検討しています。これは、GPUクラスタで何でも処理する設計から、推論工程ごとに異なる半導体を割り当てる設計への転換を示します。
資本市場もこの物語に反応しました。TechCrunchやAxiosによれば、Cerebrasは2026年5月のIPOで約55億ドル超を調達し、公開価格185ドルに対して初値は大きく上回りました。Kiplingerは、同社の2025年売上高が5億1000万ドル、純利益が2億3780万ドルだったと報じています。
もっとも、CerebrasはNVIDIAを全面的に置き換える企業ではありません。ウェハースケールは製造、歩留まり、冷却、供給網、顧客集中のリスクを伴います。Cerebrasの強みは、NVIDIAの巨大なGPUエコシステムを正面から崩すことではなく、低遅延推論や特定クラウド案件で「別解」を提示できる点にあります。
中国規制と電力制約が生む市場の分岐
競争軸を複雑にしているのが、中国市場の分離です。NVIDIAは次四半期見通しで中国向けデータセンター計算売上を織り込まないと明記しました。米国の輸出規制だけでなく、中国側も国産半導体を優先する動きを強めており、NVIDIAがかつてのように中国AI需要を取り込む余地は狭くなっています。
ロイター系の報道では、DeepSeek V4の公開後、ByteDance、Tencent、AlibabaなどがHuaweiのAscend 950系チップの確保に動いているとされます。HuaweiはAscend 950PRを推論のプリフィル、950DTをデコードや学習に向ける計画を示しており、NVIDIAと同じく用途別のシステム設計へ進んでいます。
Cambriconも中国国内のAIチップ需要を取り込んでいます。Tom’s Hardwareは、同社の2026年第1四半期売上高が4億2300万ドル相当になり、前年同期比160%増だったと報じました。中国メーカーは性能面でBlackwell世代に及ばない部分がある一方、調達可能性と政策支援が強い武器になります。
ただし、中国勢の台頭はNVIDIAの世界シェア低下だけを意味しません。輸出規制の強化は、先端GPUの密輸や迂回輸出の摘発も招いています。AP通信は台湾当局がNVIDIAチップ搭載サーバーの中国向け密輸疑惑を捜査していると報じました。AI半導体は商材であると同時に安全保障上の管理対象になり、サプライチェーンの透明性が価格と同じ重みを持ち始めています。
もう一つの制約は電力です。GoogleはTPU 8tと8iで前世代Ironwood比最大2倍の性能電力比をうたい、液冷やネットワーク統合を強調しています。推論需要が常時稼働型になるほど、1チップの性能より、データセンター全体で何ワット当たり何トークンを生むかが競争力になります。AI半導体競争は、設計技術だけでなく、電力、冷却、土地、規制対応を含むインフラ競争へ広がっています。
投資家と企業が確認すべき競争軸
NVIDIAの一強は、短期で崩れる構図ではありません。売上規模、粗利益率、ソフトウェア資産、クラウドでの採用、供給網の前倒し投資を見れば、AIインフラの中心にいる事実は揺らいでいません。むしろ最新決算は、同社がGPUメーカーからAI工場プラットフォーム企業へ進化していることを示しました。
それでも、競争の焦点は確実に変わっています。企業が見るべき指標は、GPU性能比較だけではありません。推論のトークン単価、モデルごとのレイテンシ、HBM調達、電力当たり性能、クラウドの囲い込み、輸出規制の影響、顧客集中リスクを合わせて評価する必要があります。
投資家にとっても、NVIDIA対その他という単純な図式では不十分です。Googleはクラウド原価を下げるためにTPUを使い、Cerebrasは低遅延推論でニッチを拡大し、中国勢は政策と調達制約を背景に国内市場を押さえます。AI半導体の次の勝者は、最速のチップを作る企業ではなく、用途別に最も安定して計算資源を届けられる企業です。
参考資料:
- NVIDIA Announces Financial Results for First Quarter Fiscal 2027
- CFO Commentary on First Quarter Fiscal 2027 Results
- Nvidia Q1 results surpass Wall Street expectations thanks to massive AI chip demand
- Nvidia earnings show AI demand is still roaring
- Ironwood: The first Google TPU for the age of inference
- Our eighth generation TPUs: two chips for the agentic era
- Cerebras raises $5.5B, then stock pops $108%, in the first huge tech IPO of 2026
- Cerebras raises $5.6 billion in year’s largest IPO
- Cerebras IPO: Should You Buy CBRS Stock?
- Cerebras Systems Unveils World’s Fastest AI Chip with Whopping 4 Trillion Transistors
- Cerebras CS-3: the world’s fastest and most scalable AI accelerator
- AWS will bring Cerebras’ wafer-size WSE-3 chip to its cloud platform
- Exclusive-Big Chinese tech firms scramble to secure Huawei AI chips after DeepSeek V4 launch, sources say
- Chinese GPU maker Cambricon’s Q1 revenue hits $423 million as country’s homegrown AI chip market accelerates
- Taiwan prosecutors investigate 3 people over Nvidia chip smuggling to China
関連記事
NVIDIA最高益が映すAIエージェント経済と半導体覇権の行方
米NVIDIAは2026年2〜4月期に売上高816億ドル、純利益583億ドルを計上し、AI半導体需要の強さを示した。データセンター売上752億ドル、AIエージェント普及、Rubin世代の推論基盤、中国輸出規制と電力制約、巨大クラウド投資の持続性、収益化の条件まで投資家と企業の視点で多角的に読み解く。
富士通とNVIDIA提携の核心 MONAKAとAI基盤は何を変えるか
富士通とNVIDIAの提携は、GPU調達の話ではありません。MONAKA CPU、NVLink Fusion、Kozuchi、Physical AIまでをつなぐ構図を追い、企業向けAI基盤の競争軸がどう変わるのかを解説します。
GoogleのSparkで始まる検索と買い物代行のAI本命戦略
Google I/O 2026で発表されたGemini Sparkは、検索、Gmail、Drive、買い物、決済を横断する常時稼働AIエージェントです。9億人規模のGemini利用と40億人超のWorkspace基盤、Universal Cartの狙いから、個人向けAI代行の競争軸とリスクを詳しく解説。
アルファベット円債過去最大、AI投資を支える財務戦略と市場変化
アルファベットが初の円建て社債で5765億円を調達し、海外企業の円債で過去最大を更新しました。AIデータセンター投資が資本市場を動かすなか、日銀の利上げ観測、日本の投資家需要、バークシャーとの違い、信用リスクの論点から、巨大テックの資金戦略と国内債券市場の転換点を、投資家の実務上の着眼点まで読み解く。
キオクシア営業益1.3兆円予想を生むNAND専業時代の勝ち筋
キオクシアが2027年3月期第1四半期に営業利益1.298兆円を見込む背景には、AIサーバー向けSSD需要、NAND価格急騰、東芝時代のDRAM撤退後に築いた専業体制があります。決算数字、LC9やGPシリーズの技術開発、サンディスクとの共同生産、需給反転リスクから高収益の持続性と投資判断の論点を読み解く。
最新ニュース
中国新5カ年計画、国内完結サプライ網で米中摩擦に備える量より質
中国の第15次5カ年計画は2026年成長目標を4.5〜5%に抑え、半導体、AI、レアアース、内需を軸に国内完結型の供給網を強める。米中関税・輸出規制が続く中、量の拡大から質の成長へ向かう狙いは何か。不動産不況、過剰生産、輸出依存の制約と地政学リスクを踏まえ、日本企業の調達・投資判断への影響を読み解く。
加熱式たばこ受動喫煙リスク、厚労省資料で規制見直し議論本格化
厚労省の専門委員会資料は、加熱式たばこの空気中有害物質と受動喫煙の可能性を示した。2024年調査では現在喫煙者の42.1%が加熱式を使用。紙巻きより低い成分もある一方、飲食店の経過措置や若年層利用が政策課題となる。WHOやFDAの評価を踏まえ、消費行動、施設管理、禁煙支援に及ぶ規制見直しの焦点を解説。
伊藤忠BX職に見る事務職再定義と440万人余剰時代の人材戦略
伊藤忠商事が2025年4月に事務職をBX職へ改称し、トレードや事業管理の専門性を明確にした。経産省が示す2040年の事務職約440万人余剰、文系人材約80万人余剰の推計を踏まえ、AI時代に企業と個人が磨くべき職務再設計、社内異動、評価、リスキリングの要点を働き方と日本の人材採用市場の両面から読み解く。
水不足が迫る半導体・データセンター、水処理運営が新成長商機へ
世界の水ストレスは半導体工場の超純水とAIデータセンターの冷却水を直撃しています。TSMC、Google、Microsoftの開示や国内ウォーターPPPを基に、再生水、漏水対策、運営型水ビジネスがなぜ日本企業の成長機会になるのか。老朽インフラと産業立地の制約から読み解き、投資家と自治体の確認点も示します。
Gemini Spark無料化構想とGoogle広告収益の岐路
Googleが発表したGemini Sparkは、GmailやDocsを横断して作業を進める個人向けAIエージェントです。初期提供は米AI Ultra会員向けですが、月間9億人規模のGemini基盤にどう広がるのか。無料層拡大の余地、広告収益への影響、競争環境と個人データ統治まで経営戦略の焦点を解説。