AMD
0post
2025.11.30 03:00
:0% :0% (-/-)
人気のポスト ※表示されているRP数は特定時点のものです
“GOOGL の TPU は NVDA Blackwell に大きく劣る、と考えている人たちへ——
SemiAnalysis は、むしろ 逆 だと主張している。
彼らの論点はこうだ:
・公称のピーク FLOPs(理論値)は TPUs の方が低く見えるが、実際のモデル稼働時の FLOP 利用効率(MFU)では TPU の方が高く出る ため、実効性能(effective FLOPs)では Ironwood=TPUv7 が有利になり得る。
・ストレステストでは、Hopper(H100)がピークの約 80%、Blackwell は 70%台、AMD MI300シリーズは 50~60%しか出ず、「スペックシート上の差」は現実のギャップを誇張している。
⸻
今、実際に議論されているのは:
「TPU は本当に Nvidia GPU より遅れているのか?」
という点だ。特に SemiAnalysis の最新レポート(TPUv7 Ironwood vs Blackwell)以降、その論争が激しくなっている。
紙のスペック上では、Nvidia(特に GB200 / GB300)はピーク FLOPs を高く見せているが、
現実には 電力・DVFS(動的電圧周波数制御)の制約で、実際の継続的性能は大幅に削られるため、差はかなり縮む。
・TPUv7 はスループットやメモリ帯域で GB200 にほぼ追いつき、
・さらに TCO(総保有コスト)の低さ が強みになる。
Google は Nvidia のシステムマージンを払わなくていいため、ラックスケールでの 1 チップあたりの実コストが大幅に安い。
SemiAnalysis の試算では:
・Anthropic のような高度な顧客の場合、
TPU は GB300 に比べて “実効 PFLOP” あたり 30〜50% 安くなる
(十分なコンパイラ最適化と高 MFU が前提)
・仮に GB300 の利用効率の 半分 しか出せなくても、コスト面でイーブン、もしくは有利 になる可能性がある。
⸻
Anthropic の巨大案件がその証明
・約 100万個の TPUv7
・1GW超のデータセンター構築
これはサイドプロジェクトではなく、
最先端の AI 研究所が「TPU は性能的に十分、かつコスパが優れる」と判断した結果。
SemiAnalysis はさらに、これが市場に与えた影響も指摘している:
・この「TPU の脅威」により、他社(Nvidia)への価格交渉力が改善
・OpenAI はまだ TPU を使ってすらいないが、
「代替を持つ」というだけで、Nvidia からより有利な価格を引き出せている” November 11, 2025
1RP
我有个单向的哥们,最近分享了他在2025年的几个第一性原理:
1. LLM token一定会越来越便宜,模型越来越强大,记住,所有做LLM Agent的人,都必须思考如何用10~1000倍的token带来革命,而不是他妈跟个傻逼似的天天想着省token;
2. chatbot的形式一定会被消灭,no chatbot revolution才是正确方向,一切AI应用不可能 、不应该、绝对不是一个个大号聊天机器人,一个个大对话框等着人大段大段往里敲字,
记住,所有AI产品必须重新设计,一切chatbot AI应用必定会被改写成NO CHATBOT形式,无一例外,chatbot的产品形态必然会彻彻底底、完完全全地淘汰,
或者那个傻逼一样的对话框,至少作为二等公民出现;
3. AI助手一定不能用“按个按钮”、“截个图”、“上传个文件”,再写个长长的prompt的形式出现,让用户解决个问题,先让用户点点按按十几次,
AI助手一定是具有强侵入性的,一定能主动嗅探一切环境,吞掉一切数据和信息,一定会主动在后台观察一切操作和行为——并且在疑似需要帮助的时候,主动弹出个对话框,用户一键确认后,主动接管,主动解决一切问题,
而绝不应该像准备个考试一样,准备文件、准备截图、准备一大堆按钮、准备一大长串prompt,让用户跟个大傻逼似的,手忙脚乱地在那儿表演,
总而言之,无论是商业落地的AI Agent,还是各种办公软件、工具、生活类的AI Agent,一个个不仅是傻逼兮兮的大黑框chatbot,而且要用户手动输入一大堆文件、图表、链接、信息,再敲一大段prompt——这些全都走了大弯路,
toC的无缝衔接强入侵的主动AI Agent助手,完完全全不会给你任何告诉他的机会,而是让AI Agent主动判断你是否需要我,直接给你一个大大的对话框,简单描述一下“我计划怎么帮助你”——你点一下确定,它来解决后面所有的事情。
4. 一切能用coding解决的问题,都是SWE Agent能解决的问题,也就是说,都可以直接拿claude code这类工具套壳来用,
SWE Agent这个形态,最擅长解决的问题,就是在一个确定的环境(一台机器、几台机器、若干仿真环境、一套terminal里的编译器/脚手架/运行环境/包管理、profiling和debugging方法)解决的问题,
而用coding解决的问题,从来都不止coding,一切VHDL/Verilog等电路设计、电路simulation和validation、一切类似labview和matlab simulink中可以仿真的电机、信号、示波器等等模块,
甚至ansys和CAD这类工具,还有大量data science和计算的问题,以及用lean或者formal-proof解决一些proof-based的数学和模型问题,都可以转化成一些API和coding解决的问题,然后让SWE Agent来解决,
这类问题可以叫做“一台机器上的确定环境下的问题”,
这类问题的特点是,可以靠LLM的智能不断拆分成一大堆subtasks,然后在本地环境下反复尝试、反复试错、反复看output、反复试验结果,失败后再换一个新的approach;
5. full self coding(https://t.co/8O8usyl6Af…)就是基于上面所有第一性原理的一个试验。
我将会设计一套侵入式试验,让10~500个ai agent组成一组,给一个github项目找出所有潜在的问题,包括文档、测试、修bug、优化、重构、完成todo list、加功能、加API等等,让10~100个agent并行完成这个repo潜在需要完成的所有任务,
并且让至少10组这样的agent去github上面公开贡献,等于在没有任何人为输入prompt的前提下,造出来1000~5000个agent在开源世界源源不断地做出贡献,就死死赖在github上面,尝试修复一切可能修复的潜在问题,做出贡献。
请你记住full self coding是最坚决贯彻test-time scaling law的行为,
full self coding坚决相信,人是ai agent世界最傻逼、最慢、错误最多、判断失误最高的存在,让程序员手敲prompt,无异于给AI Agent拖后腿,
只有先分析出问题,然后让10~500个agent同时并行运行,才能最大化执行的效率,最快速度解决已经发现的问题,无休止地为github提供潜在的有价值贡献——并且最关键的是,把“敲prompt的程序员”这个最垃圾、最慢、出错最多的环节彻底消除;
6. full self coding最大的瓶颈,一个是token价格过高,一个是目前几乎所有主流供应商,LLM inference速度过慢,
所以我最后的一个想告诉大家的价值观是:
groq、sambanova、cerebras这种在片上堆满几个GB的SRAM,在inference上效率是nvidia、amd、google TPU这些落后架构的10~50倍,这是test-time scaling law的最后一环,
如果人类在claude code、gemini cli上全面接入groq、sambanova、cerebras上host的模型,所有速度都会再快10~50倍。 November 11, 2025
TPUのサプライチェーンが熱くなってきましたね
Google による Nvidia への TPU の挑戦は、2026 年までに AI による銘柄選択が Nvidia のサプライ チェーンだけに依存しなくなることを示唆しています。
台湾株式市場は高値28,554から安値26,395まで下落し、累計2,159ポイントの下落となった。国家安定基金の運用責任者のみが自信を表明し、株式市場の見通しに自信を示したようだ。
台湾株式市場の20日移動平均は、4月の相互関税実施以来初めて下落に転じた。
実際、出来高から判断すると、7月以降は緩やかな上昇基調で徐々に増加し始めました。11月24日の終値は7,130億元でした。しかし、加重指数は26,507ポイントの四半期ラインのサポートを維持し、反発は5日移動平均線の圧力によって抑制されました。4月の公平関税実施以来、20日移動平均線が下向きに転じたのは今回が初めてです。外国人投資家による年末の売り圧力に直面している市場は、あまり気にしていないようです。しかし、今年の最後の5週間は、巳年の強気派と弱気派にとって最も不確実な状況になる可能性があると私は考えています。特に、連邦準備制度理事会(FRB)の12人の当局者のうち5人が利下げを支持しないと表明しています。もし市場が本当にFOMCが利下げを行わない可能性が高いと予想しているのであれば、12月10日までの外国人投資家からの売り圧力は弱まるどころか、強まる可能性があります。
10月8日から11月24日まで、外国人投資家は集中市場において5,404億7,900万台湾ドルの売り越しを記録し、AI関連銘柄が調整の主な対象となりました。これらの銘柄には、TSMC、デルタ・エレクトロニクス、メディアテック、ウィストロン、ウィストロン・マイクロエレクトロニクス、ウィストロン・ニューウェブ、ナンヤ・テクノロジー、アクトン・テクノロジー、ギガバイト、ジェン・ディン・テクノロジー、フォックスコン、コンパル・エレクトロニクス、キング・ユアン・エレクトロニクス、ASUS、タイコー・テクノロジー、チー・ホン、クロミウム・テクノロジー、チンテック、ユニマイクロン・テクノロジー、ハンスター・ディスプレイ、シャープ、インベンテック、FXCM、ヤゲオなどが含まれます。このリストを見ると、ある程度の底堅さを見せたヤゲオ、ナンヤ、シャープを除けば、他の銘柄は短期および中期の移動平均線からの圧力に直面していることがわかります。移動平均線を統合・修復するには時間を要するだけでなく、サポートが確立されているかどうかも不透明です。これは主に第3四半期の財務報告の発表とウォール街でのAIバブル問題に関する議論によるものです。
年末の会計調整を優先する動きから、AI関連銘柄が連日上昇している。
AIバブルとドットコムバブルは性質が全く異なります。前者は巨大IT企業が実際に資金を投じるのに対し、後者は市場シェア獲得のために負債を負うという点です。しかし、市場心理はドットコムバブルの頃ほど不安定ではありません。特に、インターネット技術はeコマースやクラウドコンピューティングといった経済モデルを生み出したため、生成型AI技術は生産性向上に有益であるという認識が一般的です。しかしながら、年末決算のオプションを考慮すると、大きく上昇したAI関連銘柄は当然ながら調整対象として最適です。
どれも非常に合理的な選択のように見えましたが、同時に警戒感も抱かせました。今年のAI関連銘柄の急騰は、800Gスイッチ、ASICサーバー、空冷から液冷への移行、800VDCアーキテクチャ、M9素材といったハードウェアのアップグレードによって牽引されました。これらのハードウェアのアップグレードは、より高級な素材の使用につながり、素材不足を引き起こしました。さらに、Nvidiaはハードウェアを毎年アップグレードすると表明していたため、GB200からGB300への供給がスムーズになると、株式市場の認知度が高まり、資金が大規模な短期投資を行うことが可能になりました。Delta Electronics、BizLink-KY、Chuanhu、Guang Sheng、Taiguang Electronics、Chi Hong、Jian Ce、Wistron、Xin Hua、Qin Chengなど、これらの好調な銘柄の多くは、株価が2倍以上に上昇しました。
しかし、最近のメディア報道によると、NVIDIAはサーバーハードウェアをVera Rubinプラットフォームに高度に統合(L10)し、ハードウェアサプライヤーのスペースをわずか10%にまで縮小するとのことです。これにより、OEM/ODMメーカーの事業運営余地は大幅に縮小するでしょう。もしこの噂が事実であれば、時価総額が大きなウェイトを占める下流サーバーメーカーにとって大きなマイナス要因となり、加重指数に圧力をかけることになります。これは、NVIDIAの第3四半期決算が好調であったにもかかわらず、サーバー関連銘柄のパフォーマンスが低迷し、ASUS、Gigabyte、Inventecが年間移動平均線を下回っている理由を説明できるでしょう。これは、10月初旬から外国人投資家による売りが続いている理由も説明できるかもしれません。
メモリーチップ銘柄は高値水準で推移している。
強気相場を阻むもう一つの重要な要因は、メモリのスーパーサイクルがどれだけ長く続くかだ。モルガン・スタンレーは、メモリチップ価格が10%上昇した場合、ハードウェアメーカーの粗利益率を0.45%から1.50%圧迫する可能性があると指摘している。今年の第3四半期と第4四半期には、メモリ価格(SSD、DRAM、VRAMを含む)は平均で約30%から50%上昇した。したがって、メモリ価格の上昇は、下流ブランドメーカーの利益を1.35%から7.50%押し下げる可能性がある。コスト転嫁ができない場合、実際には粗利益率は3%から6%近く(サプライチェーンの投資収益率に非常に近い)減少する可能性がある。
もう一つの変数は、エイサーの陳春生会長が、メモリチップの価格上昇が鈍化するかどうかは、長鑫メモリのDDR5生産能力がいつ「大量稼働」するかにかかっていると述べたことです。すべてが順調に進めば、長鑫メモリは2~3ヶ月以内(つまり2026年第1四半期)に月産28万~30万枚(現状比約50%増)に大幅に増加すると予想されています。その時点で、メモリチップ価格の上昇圧力は大幅に緩和されると予想されます。
ADATAとInnoluxは、メモリは2026年まで供給不足が続くと断言していますが、Nanya Technology、Winbond Electronics、Phisonといった主要メモリ銘柄は明らかに高値圏で推移しています。移動平均線の抵抗線を突破するには、しばらく時間がかかるでしょう。また、国内機関投資家からの売り圧力は依然として強いようです。そのため、サーバーセクターとメモリセクターの株価が引き続き推移した場合、加重指数が四半期サポートレベルを維持し、過去最高値を直接更新する可能性は低いと考えられます。
GoogleのGemini 3 Proは高い評価を得ています。Gemini 3はChatGPT、Grok、Perplexityよりも高速で俊敏性が高く、より深い推論能力を備えています。さらに重要なのは、Gemini 3はNVIDIAチップではなく、主にGoogle TPUで学習されていることです。TPUはNVIDIA GPUほど柔軟ではありませんが、開発コストが低く、フル負荷時の消費電力も少なくなります。
Google TPUエコシステムの成長の可能性に楽観的
さらに、GoogleのAIインフラストラクチャ責任者であるアミン・ヴァダット氏は、11月6日に開催された全社会議において、Googleはコンピューティング能力を6ヶ月ごとに倍増させる必要があり、今後4~5年で1000倍の増強を目標としていると述べた。さらにヴァダット氏は、「現時点では、投資不足のリスクは過剰投資のリスクよりもはるかに大きい」と述べた。
ゴールドマン・サックスは、2026年までにGoogleのTPUエコシステムの成長ポテンシャルに楽観的な見方を示しており、TPU + AIサービスの価値は9,000億ドルに達する可能性があると予測しています。同社の中核的な優位性は、ソフトウェア、ハードウェア、クラウドの統合と「自社開発+サプライチェーン管理」能力にあります。TPUエコシステムが拡大すれば、BroadcomのASICチップ設計におけるビジネスチャンスも拡大する可能性があります。
3月には、Googleがコスト削減と生産加速のため、次世代TPUでMediaTekと提携する計画があると噂されていました。しかし最近、Creative LabsがGoogle向けにAxion CPUを開発しているとの報道があり、これは2026年の明確な成長ドライバーになると予想されています。Creative Labsの株価は過去最高の2,175台湾ドルを記録しました。
推論モデルは、Nvidia への依存から脱却することを目指しています。
AI ASIC分野における新しいシステムレベルのテストアプリケーションの需要増加の恩恵を受けて、Ingenicの収益は2026年に前年比42%増加すると予測されています。WM Siliconは2026年にGoogle TPUにVPCプローブカードを供給する予定で、その年の収益成長率は46%と推定されています。
GoogleのTPUエコシステムが最終的にNvidiaの独占から脱却できるかどうかに関わらず、OpenAIとAMD、そしてAnthropicとGoogleの連携は、AI大手企業が2026年にはモデルの学習にNvidiaのGPUに依存する必要がある一方で、推論モデルに関してはNvidiaへの依存を減らしたいと考えていることを示しています。したがって、2026年のAI銘柄選定は、もはやNvidiaに支配されることはないでしょう。 November 11, 2025
台積電(TSMC)作為全球晶圓代工龍頭,除了領先的製程技術外,先進封裝(Advanced Packaging)已成為其核心競爭力,對高階AI晶片不可或缺。TSMC正大規模擴充封裝產能,以因應市場需求。尤其在HBM4(High Bandwidth Memory 4)整合中,Base Die(基底晶片)角色轉變重大:以往由記憶體廠如三星、SK海力士、美光製造,未來改由TSMC提供標準化版本,簡化整合流程。
HBM4採用N12製程,電壓從1.1V降至0.8V,提升效率1.5倍,並首度導入標準PHY介面。更進階的HBM4E(C-HBM4E)則躍升至N3P製程,電壓再降至0.75V,效率較傳統DRAM提升2倍;Base Die內建記憶體控制器(原本在GPU內),PHY改為專屬設計。這項技術將率先應用於AMD Instinct MI400系列(432GB容量、19.6TB/s頻寬)與NVIDIA Rubin世代(20TB/s頻寬),強化AI加速器效能。
TSMC先進封裝三大支柱包括CoWoS、SoIC與SoW。
CoWoS為主力,可整合運算晶片與多達8顆HBM;現行CoWoS-S支援3.3倍光罩尺寸(N5/N4製程),CoWoS-R提升互聯頻寬並兼容N3。下一代CoWoS-L於2026年達5.5倍光罩(約4500mm²)、12顆HBM3E/HBM4,鎖定AMD MI450X與NVIDIA Vera Rubin;2027年更進化至9.5倍、超過12顆HBM,搭配A16製程。
SoIC聚焦3D堆疊,如AMD 3D V-Cache所示,目前支援N4-on-N5(6µm微凸點間距),晶片面積達0.8倍光罩;2025年起進入N3-on-N4,上層晶片無尺寸限制。InFO提供晶片間橋接,AMD Instinct已採用,未來InFO-PoP與InFO-2.5D增添設計彈性。SoW(系統級晶圓)則用於Cerebras等大規模應用,後續推出SoW-P與SoW-X。
為管理複雜結構,TSMC開發3Dblox語言,支援階層式模組設計,一次驗證即可重複使用,如檢查微凸點連接。跨晶片驗證透過Layer Projection的DRC確保規則遵守。當前封裝需處理上億微凸點,間距從9µm縮至5µm:CoWoS-S約1500萬個、CoWoS-L5000萬個、SoW最高4億個。 November 11, 2025
Google TPU 要干掉英伟达了吗?Meta 被曝将大规模采购 TPU,引发市场震动。但真相是:TPU 能撼动英伟达,却永远无法取代英伟达。这不是性能之争,而是生态、时机与战略的较量。
The Information 的一篇重磅报道把整个 AI 行业给炸了,Meta 正在与 Google 进行秘密谈判,计划大批量采购 Google 的 TPU 芯片,用于部分替代英伟达的 GPU 以支持其庞大的数据中心 AI 运算。
根据报道披露的细节,这盘棋下得很大:
- 2026 年: Meta 将大规模租用 Google 云服务(Google Cloud)上的 TPU 算力进行模型训练;
- 2027 年: Meta 将直接采购数十亿美元的 TPU 芯片,部署于自建的数据中心内。
什么?全球最大的 GPU 采购大户要抛弃英伟达了? Google 的 TPU 居然要走出自家机房,去取代英伟达的 GPU 了吗?
消息一出,资本市场瞬间恐慌了。英伟达股价应声大跌,而 Google 则逆势暴涨,大家都在问:难道英伟达靠 GPU 垄断 AI 数据中心的故事真的讲不下去了吗?TPU 开始逆转了战局了吗?要讲明白这场 GPU vs TPU 的战争,我们要先从英伟达为什么能够像“铁桶”一般垄断 AI 数据中心讲起。
当今的 AI 技术堆栈:一座精密的金字塔
今天的人工智能是一个无比庞大的工业化产业。像 ChatGPT 这样顶尖的 AI 产品,其背后是由一层一层的技术基石堆砌而成的,这在 IT 行业被称为“技术堆栈(Tech Stack)”。
即使采用最粗略的划分方式,要支撑起当下的生成式 AI,至少也包含 5 层关键技术,缺一不可:
- 第一层:算力硬件层(Infrastructure) 这是金字塔的底座,是一切的基础。核心代表毫无疑问是英伟达的 GPU 和 Google 的 TPU。它们提供了 AI 运算所需的庞大算力,就像是工业时代的电力引擎。
- 第二层:系统软件与加速层(System & Compiler) 光有芯片还不够,AI 计算需要成千上万个芯片协同工作。这一层负责调度硬件并优化效率,充当硬件与上层软件的翻译官,它们决定了你能发挥出硬件多少潜能。这一层最典型的护城河技术,就是英伟达的 CUDA,而 Google 的 TPU 也有能够把上层软件编译为 TPU 机器码的 XLA 编译器。
- 第三层:深度学习框架(Deep Learning Frameworks) 想要构建和训练大规模神经网络,开发者不能手搓底层的软件代码,需要成熟的“脚手架”。业界目前最流行的是 META 发起开源软件 PyTorch(目前对 GPU 生态支持最好,是事实标准),以及 Google 发起的开源软件 JAX 和经典的 TensorFlow。
- 第四层:基础大模型(Foundation Models) 这是由深度学习框架训练出来的“超级大脑”,是目前竞争最激烈的战场。
- 语言/多模态模型: 如 OpenAI 的 GPT-5、Google 的 Gemini 3;
- 视频生成模型: 如 OpenAI 的 Sora、Google 的 Veo;
- 图像生成模型: 如 Google 的 Imagen、Midjourney。
- 第五层:AI 应用与交互层(Applications & Agents) 这是用户直接接触的产品。它将底层强大的模型能力封装成人类可以交互的工具。例如 ChatGPT,它的底层核心是 GPT 模型,但它本身是一个增加了对话界面、联网搜索、记忆功能的产品;又比如 Google 的 NotebookLM。
为什么英伟达在 AI 数据中心市场形成了绝对垄断?
我们经常感叹英伟达的 GPU(如 H100、H200、B200)硬件参数如何炸裂,但这只是冰山一角。英伟达之所以能对 AI 数据中心市场形成近乎无解的垄断(市占率一度超过 95%),主要源于以下三个维度的降维打击:
1. 通用性极强的单点算力 英伟达的 GPU 本质上是通用计算加速器(GPGPU)。它不仅能完美覆盖 AI 大模型的训练(Training)和推理(Inference),还能兼顾科学计算(气象模拟、药物研发)、图形渲染甚至加密货币挖掘。这种“一卡多用”的特性,使其成为了数据中心的硬通货——买了永远不亏,不用来炼丹还能用来挖矿(开玩笑,但道理如此)。
2. 恐怖的集群扩展能力(Scale-up & Scale-out) AI 大模型训练不是单打独斗,而是需要成千上万张显卡协同作战。英伟达在这方面做得太绝了:
- 节点内互联:通过独家的 NVLink 技术,英伟达可以将多个 GPU(甚至高达 72 个 GPU 组成的 GB200 NVL72 机柜系统)连接成一个“超级逻辑 GPU”,显存和算力实现无缝共享。
- 节点间互联:通过收购 Mellanox 获得的 InfiniBand 高速网络技术,让成千上万台服务器之间的数据传输快如闪电,解决了大规模集群的通信瓶颈。
3. 真正的护城河:CUDA 软件生态 这是英伟达最难被逾越的壁垒,就像 PC 时代的 Windows 操作系统。
- 底层基石:CUDA 提供了最底层的并行计算库,几乎所有的高性能计算场景都基于此构建,经过了 20 年的打磨。
- 顶层框架:当今统治级的深度学习框架 PyTorch 对 CUDA 提供了最原生的支持。这意味着开发者只需编写几行 Python 代码,就能调用底层强大的算力。
- 生态闭环:围绕 PyTorch/CUDA/GPU 已经形成了一套成熟的“开箱即用”基础设施。
为什么竞争对手很难追赶? 即使竞争对手(如 AMD 或国产芯片厂商)在硬件参数上追平了 H200,依然无法撼动英伟达的地位。因为缺乏庞大的软件生态支持,意味着极高的迁移成本和时间风险。
一个真实的行业痛点(听起来很痛): 目前很多致力于适配非英伟达芯片的 AI 团队都面临着巨大的痛苦。许多针对英伟达 GPU 进行过深度优化的模型(特别是涉及复杂算子或 MoE 架构的模型),一旦迁移到其他芯片平台,往往会面临严重的兼容性问题。
- 开发难:大量算子需要从头手写,费时费力,如同用汇编语言写网页。
- 稳定性差:模型训练过程中经常出现莫名其妙的数值溢出或系统崩溃(Crash)。
在当前的 AI 竞赛中,一次全量模型训练往往耗时数月,成本以千万美元计。如果因为芯片兼容性导致训练中途崩溃几次,浪费的不仅是电费,更是半年甚至一年的宝贵时间窗口。这种巨大的试错成本,是任何一家争分夺秒的 AI 公司都无法承受的。传言某国内顶级 AI 模型就是因为在国产芯片上训练下一代模型频繁崩溃,导致一直难产,真的是太痛了。
这就是为什么英伟达在 AI 数据中心市场越成功,行业对其路径依赖就越严重——因为没有人敢承担离开英伟达的代价。
Google 的 TPU 又是怎么崛起的?
尽管英伟达的统治力无可争议,但是 Google TPU 却是个异类,它不仅活下来了,还活得很好,已在 AI 顶级赛道站稳脚跟。
首先,TPU 已经用实战成绩证明了自己在 AI 大模型训练和推理领域的成功:
- Google 本家基石: Google 最强的 Gemini 系列模型,完全基于 TPU 进行训练和推理;
- 独角兽的选择: 顶级 AI 公司 Anthropic (Claude) 在 Google Cloud 上大规模使用了 TPU 算力;
- 科技巨头的背书: 就连 Apple 在训练其 Apple Intelligence 基础模型时,也公开表示使用了 Google 的 TPU v4 和 v5p 集群,而非英伟达 GPU。
那么,在英伟达已经成为绝对霸主的情况下,Google TPU 凭什么能异军突起?我们不妨对照英伟达成功的三个维度来深度解析:
1. 算力哲学:极度通用 vs 极致专用 英伟达 GPU 的强大在于“通用性”。而 Google TPU 从 2012 年设计之初,就是为了特定用途——大规模矩阵乘法而生。 现在的 AI 大模型训练,本质上就是在大规模地做矩阵乘法。因为放弃了图形渲染等通用功能,TPU 的芯片设计得以大幅简化,从而在“矩阵计算”这单一场景下取得了极致的能效比和性能表现。
2. 互联技术:电互联 vs 光互联 (OCS) 英伟达在服务器间的高速互联(NVLink/InfiniBand)上表现出色,覆盖了从单机多卡到万卡集群的广泛场景。 而 Google TPU 另辟蹊径,主攻超大规模集群互联。Google 引入了独特的 OCS(光路交换)技术,用光互联将成千上万颗 TPU 动态编织在一起。最新的 TPU v5p 单个 Pod 即可容纳 8960 颗芯片,甚至可以通过光互联扩展至数万卡的超级集群。这种架构在大规模并行训练中,展现出了极高的带宽利用率和灵活性,且布线极其整洁。
3. 软件生态:CUDA 帝国 vs JAX/XLA 新势力 英伟达的 CUDA 和 PyTorch 让 AI 开发变得“开箱即用”,这是其最大的护城河。但 Google 经过多年深耕,也打磨出了一套极为硬核的软件栈:
- XLA (2016): 一个强大的编译器,能将计算图直接编译为 TPU 机器码,榨干硬件性能。
- JAX (2018): 一个旨在替代 TensorFlow 的前沿框架。
对比 PyTorch: PyTorch 是面向对象编程,符合人类直觉,简单易用;而 JAX 是函数式编程,学习曲线陡峭,但在处理超大规模并行计算时具有先天优势,代码更简洁,数学表达更纯粹。
跨界打击: JAX 的优秀甚至溢出了 TPU 生态。如马斯克的 xAI 虽然使用的是英伟达 H100 集群,但为了追求对硬件性能的极致压榨,在训练 Grok 模型时并没有使用 PyTorch,而是选择了 JAX。
总结:生态位的胜利 经过多年的演化,在超大模型训练这一“皇冠上的明珠”场景下,JAX + XLA + TPU 技术栈已经形成了一个完整的闭环。它不仅被验证是成功的,甚至在某些超大规模场景下,能取得比 Pytorch + CUDA + GPU 更优的能效比。在 Google Cloud 上,TPU 的 token 成本定价低于英伟达 GPU,就是最好的证明。这也是 Google Cloud 在云计算市场竞争中的秘密武器。总之:
英伟达 vs Google:两种技术哲学的碰撞
- 应用场景: 通用型霸主 vs 超大模型专用特种兵
- 软件门槛: 低门槛的群众基础 vs 高门槛的专家利器
- 商业模式: 庞大的全行业生态 vs 垂直整合的自研闭环
如果说英伟达就像一辆豪华的全能越野车,哪里都能去,谁都能开,到处都有维修店;那么 Google 就像一辆定制的 F1 方程式赛车,只能跑赛道,赛车手才能开。大多数人买车首选 SUV(英伟达),因为方便、省心;但在争夺世界冠军的顶级赛场上,追求极致速度的车队(如 Google、xAI、Anthropic)会考虑使用 F1 赛车(TPU)。
Google TPU 能干掉英伟达吗?
照你这么说的话,Google TPU 岂不是已经成功挑战英伟达,打破了英伟达 GPU 的绝对垄断地位吗?事情没有那么简单。
1. TPU 的局限性与 Google 的双重身份 前面提到 Google TPU 极其擅长超大模型的训练/推理以及大规模推荐系统,但在通用性上,其他场景要么根本不适用,要么能效比不如英伟达 GPU。 对于 Google 庞大的产品线(YouTube、Search、Cloud)来说,对通用 GPU 的需求依然是海量的。因此,Google 一边自研 TPU,一边依然是英伟达 GPU 的全球采购大户。这一点在未来几年内都不会改变。
2. 迁移成本高昂的“生态墙” 尽管在超大模型场景下,JAX + XLA + TPU 的技术栈能取得显著优势,但这要求你必须“从零开始”就拥抱 Google 生态。 如果现有的项目是基于 PyTorch 和 CUDA 深度优化的,想要迁移到 TPU,约等于重写底层代码并进行大规模兼容性测试。这种“重起炉灶”的时间成本和工程风险,足以让绝大多数企业望而却步。
因此目前来看,Google TPU 的用户群体画像非常清晰,主要就两类:一是高校科研(科学计算),二是超大模型的训练和推理。
为什么 TPU 会有很多科学计算用户? 这是因为 Google Cloud 长期为高校科研开放免费的 TPU 资源(TPU Research Cloud),加上极度好用的 Colab 服务(免费提供 TPU/GPU 算力),在学术界圈粉无数,培养了一大批习惯 TPU 的科研生力军。
那么,超大模型领域的潜在客户呢? 我们逐一分析市面上的两类大客户:
- 大型云计算厂商: Amazon, Microsoft, Oracle 以及 CoreWeave 等新兴 GPU 云厂商。
- AI 大模型厂商: OpenAI, Anthropic, xAI, Meta 等。
大型云计算厂商(Amazon, Microsoft)本身就是 Google Cloud 的死对头,且都在自研芯片(Trainium, Maia),绝无可能去买对手的算力。而 Oracle 和 CoreWeave 早就通过深度绑定英伟达赚得盆满钵满,是英伟达的铁杆盟友。
AI 大模型厂商呢?
- OpenAI: Google Gemini 的头号宿敌,微软的盟友,不可能用 TPU。
- xAI: 马斯克与 Google 积怨已久,且正通过特斯拉和 xAI 构建自己的超算集群。
- Meta: 回到开头的新闻,Meta 是个超级大户。虽然传闻在谈,但 Meta 也是 Google 广告业务的直接对手。扎克伯格目前手握全球最大规模的 H100 集群之一,并且 Meta 正在积极迭代自研芯片 MTIA。虽然他们不搞公有云,但为了战略安全和技术自主,Meta 不太可能全面依赖 Google 的 TPU,最多是作为补充或谈判筹码。
- Anthropic: 剩下的只有它了。Google 是 Anthropic 的大金主,所以 Anthropic 使用 TPU 是顺理成章的。
盘算下来,TPU 的外部大客户其实寥寥无几。 这点体量,完全不足以对英伟达的统治地位构成“颠覆性”冲击。 因此,Google 最明智的策略依然是:在 Google Cloud 上提供极致性价比的 TPU 服务,用“省钱”和“能效”从其他云厂商口中抢肉吃,而不是想着彻底干掉英伟达。
如果 Google 非要“头铁”,下场卖 TPU 芯片抢市场呢? 我认为这极其不明智:
- 供应链与利润结构: TPU 是 Google 与博通(Broadcom)合作设计的 ASIC。如果对外售卖,不仅涉及复杂的供应链管理,还要分润给博通,这会拉低硬件毛利。卖贵了,打不过英伟达;卖便宜了,除去博通的成本,Google 图什么?
- 客户池太浅: 如前所述,愿意买 TPU 且不与 Google 构成直接竞争的大客户极少。
- 田忌赛马的反面: 用自己公司的“内部工具/副业”去硬拼英伟达赖以生存的“主业”,胜算能有多高?
- 最后,也是最关键的宏观背景: 目前全球 AI 数据中心市场正处于“短缺经济”时代。不仅 GPU 缺,HBM 内存、CoWoS 封装产能、电力、甚至建设数据中心的土地都极度紧缺。虽然各大科技巨头的资本支出(Capex)已经高得吓人,但面对爆炸性的业务需求,供给依然不够。微软今年初曾试图下调资本支出,结果发现需求太猛,转头又开始疯狂追加投入。
在一个供不应求的增量市场里,无论你填进去多少算力(无论是 GPU 还是 TPU),都会被瞬间吃干抹净。英伟达的 GPU 和 Google 的 TPU 目前仍处于“各自跑马圈地”的阶段,而非“你死我活”的零和博弈。
我的结论:
Google TPU 对英伟达确实有冲击,但不必过度恐慌。 从长期看,Google TPU 的存在更像是一个强有力的“议价筹码”。当大客户有了备胎(TPU 或自研芯片),英伟达就很难长期维持如今夸张的 75% 利润率。
英伟达未来的市场份额确实会受影响,主要来自:
- Google 自身业务(搜索、推荐、Gemini)更多转向 TPU,减少购买 GPU;
- Google Cloud 的深度合作伙伴(如 Anthropic)减少购买 GPU。 这可能会导致英伟达在数据中心的市占率从 90%+ 缓慢回落到 75%-80% 左右,但这并不改变其商业逻辑的本质。
这就像当年的 PC 市场: 苹果 Macintosh 电脑的崛起虽然让 Windows 的市占率有所下降,但并没有终结 Windows 的垄断。真正终结 Windows 霸权时代的,不是 Mac,而是智能手机的兴起。 同理,Google TPU 干不掉英伟达。真正能干掉英伟达的,只能是下一代计算范式的彻底变革。
Google 的成功是不可复制的
好吧,虽然你说的很有道理,但是 Google 能干成全栈自研,尝到了甜头的其他巨头岂不是会纷纷效仿吗?Amazon,Microsoft,Meta,OpenAI 这几个英伟达的头部大客户都在自研 ASIC 芯片,将来他们都减少了对英伟达芯片的采购,英伟达不是要喝西北风了?
我的观点就是:Google 的成功是不可复制的。
Google 的技术栈能够成功,综合了以下几个不可或缺的因素,而这恰恰是微软、Meta 和亚马逊所不具备的:
1. 十年的时间壁垒(Time & Iteration)
芯片设计不是搭积木,它需要漫长的迭代周期。 Google 早在 2013-2014 年就开始秘密研发 TPU,2016 年 AlphaGo 击败李世石震惊世界时,背后就是 TPU v1 在提供算力。
当微软在 2023 年才匆忙推出 Maia 100 时,Google 的 TPU 已经迭代到了第 6 代甚至第 7 代。
这 10 年间踩过的坑、修复的 Bug、积累的制程经验、以及对散热和互联架构的微调,绝非其他公司靠“砸钱”就能在两三年内追平的。在硅基世界里,经验值就是良率,就是能效比。
2. 真正全栈的“软硬一体”的垂直整合掌控力(Full-Stack Control)
这是 Google 最可怕的地方,也是其他巨头最大的软肋。
Google 拥有整个链条: 硬件(TPU)+ 编译器(XLA)+ 框架(JAX)+ 模型(Gemini)。Google 的科学家 Jeff Dean 可以让设计 Gemini 的算法团队直接坐在设计 TPU 的硬件团队对面,告诉他们:“我们需要一个特定的指令集来加速这个算子。”这种协同效应是核爆级的。
反观微软/Meta: 微软虽然造了 Maia 芯片,但它上面的软件栈主要依赖 OpenAI,而 OpenAI 和整个业界主流依赖的是 PyTorch。PyTorch 的亲爹是 Meta,但 PyTorch 对英伟达 GPU 的优化是刻在基因里的。
微软想要 Maia 好用,就得去魔改 PyTorch 底层,或者指望 OpenAI 为了适配 Maia 去重写代码。这中间不仅隔着公司墙,还隔着巨大的技术债务。
只要 PyTorch 依然是业界标准,其他自研芯片就永远是在“模拟”或“适配”英伟达,而 Google 是在玩一套完全独立的游戏规则。
3. 极其特殊的“光互联”基础设施(OCS Infrastructure)
前面提到的 OCS(光路交换)技术,是 Google 数据中心的独门绝技。 Google 为了适配 TPU 的大规模互联,甚至重新设计了数据中心的物理布线和机柜架构。这种光互联技术允许 TPU 节点之间以极低的延迟和功耗进行动态重组。 其他云厂商的数据中心是基于标准以太网架构建设的,想要复刻 Google 这套“光互联”网络,意味着要推翻现有的数据中心物理架构,这个沉没成本是天文数字。
4. 无法比拟的内部“吞吐量”(Internal Workload)
在生成式 AI 爆发之前,Google 就拥有地球上最庞大的 AI 推荐系统——Google Search、YouTube 推荐算法和 Google Ads。
这些业务每天产生数以亿计的并发请求,为 TPU 提供了天然的、海量的“练兵场”。
即便没有外部客户买单,Google 自己的业务就能消化掉 TPU 的产能。这让 Google 敢于在 TPU 早期性能不完善时,强行在内部推广(Dogfooding),通过海量真实数据把芯片“磨”出来。
相比之下,Meta 虽然有推荐算法需求,但起步晚且早期全押注 GPU;微软的 Azure 主要是卖资源给客户,如果自研芯片不好用,客户会直接用脚投票切回英伟达。
英伟达更像 AI 时代英特尔
著名电影《大空投》原型 Michael Burry 曾暗示英伟达正处于类似互联网泡沫时期的境地,不少看空者也认为英伟达与 OpenAI 之间相互投资和采购的关系,吹起了一个巨大的估值泡沫。他们认为一旦泡沫破裂,英伟达就会像 2000 年的 Cisco(思科)一样,股价暴跌 80% 以上。
但我认为,当下的英伟达并不像当年的 Cisco,而更像 PC 黄金时代的 Intel。 Intel 的股价腾飞始于 1993 年,于 2000 年触顶,随后经历了漫长的震荡与调整。 回顾那段历史,我们可以发现惊人的相似性:
- 1993 年之前(群雄逐鹿): PC 的 CPU 市场处于混战时代,各路架构互不相让。
- 1993 年(霸主确立): Intel 推出奔腾(Pentium)处理器,凭借强悍的性能一举确立了 CPU 市场的统治地位。
- 1995 年(杀手级应用爆发): 微软推出 Windows 95,图形界面的革命引发了全球性的 PC 换机潮。受此驱动,Intel 的股价在 1996 年迎来了极高斜率的上涨。
- 2000 年(盛极而衰): Intel 股价在 2000 年见顶,随后狂跌。这背后既有互联网泡沫破灭的宏观原因,也有 PC 市场渗透率见顶的因素。同时,Intel 在技术路线上遭遇了 AMD 速龙(Athlon)处理器的强力挑战,且在后续的 64 位指令集之争中(安腾项目)犯了严重的战略错误。
2022 年 ChatGPT 的横空出世,就是 AI 时代的 "Windows 95 时刻",它极大刺激了全行业对于算力基础设施的升级换代。借助这股 AI 浪潮,英伟达正在狂飙突进。现在的英伟达,像极了 1997 年处于巅峰缓慢爬升期的 Intel。
我相信,在未来几年的 AI 算力市场将呈现“一超一强多级”的格局:
- 英伟达(The Generalist King): 依然是绝对的“一超”。它占据 75%-80% 的市场份额,服务于所有追求通用性、追求开发效率、追求 Time-to-market 的企业。所有的初创公司、大部分云客户、以及需要频繁试错的模型团队,依然只能选英伟达。
- Google TPU(The Specialized Powerhouse): 它是那个“特种部队”。它守住 Google 自己的万亿帝国,并在超大模型训练这一垂直领域,成为唯一能跟英伟达叫板的“异类”。
- 其他自研芯片和 AMD(AWS Trainium, MS Maia, Meta MTIA): 它们更多是“成本调节器”。它们会被用于处理那些负载稳定、算法成熟的推理任务(比如每天运行几亿次的简单推荐或聊天机器人推理)。巨头们用它来通过简单的替代降低运营成本,也就是所谓的“省钱芯片”,但很难承担起“探索下一代 AI 前沿”的重任。
Google 的王者归来:全栈自研的胜利
2022 年底 ChatGPT 的横空出世,曾让 Google 这位 AI 领域的先行者显得黯淡无光。然而,站在 2025 年底的今天回望,Google 的表现足以让人刮目相看。
目前的 Google,是全球唯一一家真正实现了AI 全栈自研、软硬件垂直整合的头部厂商。这种整合优势正在形成巨大的飞轮效应:
- 算力底座: 在硬件层面,Google 利用 TPU 大规模集群高效实现了 Gemini 3 模型的训练和推理,摆脱了对外部 GPU 的依赖。
- 生态闭环: 通过多年的技术积累,打造了难以复制的软硬件一体化技术栈生态:JAX / XLA / TPU,极大地提升了研发效率。
- 云端优势: Google Cloud 虽然在市场份额上仍居 Amazon 和 Microsoft 之后,但增速惊人。更重要的是,得益于自研芯片,其 TPU 的租赁费用相比 GPU 拥有显著的价格优势,这对初创公司极具吸引力。
- 模型与成本:Gemini 3 在多项基准测试中已完全不输 GPT-5.1,甚至在长上下文和多模态理解上有所超越。基于自有云和芯片的成本优势,Gemini 能够提供更具竞争力的 API 调用价格,这种“低成本高智能”的反向优势正在快速抢占开发者市场。
- 产品矩阵全面开花:
1. NotebookLM 已成为“杀手级”的 AI 知识库和学习工具,深受科研与教育用户喜爱。
2. 多模态创作: Gemini 现已深度整合 Veo(视频生成)和 Imagen(图像生成),用户可在一个工作流中完成复杂的创作任务。
3. 搜索进化: Google Search 全面推出了 AI Overviews,成功将传统搜索与 AI 问答无缝整合。
4. 交互创新: 最新推出的生成式 UI (Generative UI) 更是令人惊艳,根据用户意图实时生成交互界面。
关键在于,Google 形成了一个从芯片、基础设施、模型到应用产品的完整闭环,各环节还能互相加强。这就好比 Google 一家公司独自完成了“英伟达 + 微软 + OpenAI”三家公司的工作。再加上 Google 全球数十亿的用户基数,以及 Chrome 浏览器和 Android 移动端两大核心入口,其上限不可估量。
为何半年前股价低迷、备受质疑的 Google,能在这半年实现逆袭?
此前市场看衰 Google,主要基于以下隐忧:
- 商业模式挑战: Google Search 靠竞价排名赚钱,市场担心 AI 问答范式会彻底颠覆这一现金牛。
- 大公司病与人才流失: 尽管 AI 大模型的基石——Transformer 论文是 Google 于 2017 年发表的,但果实却被 OpenAI 摘取。CEO Sundar Pichai 被认为过于稳健,缺乏魄力;内部 DeepMind 和 Google Brain 两个顶尖团队曾各自为战,内耗严重,导致许多论文作者离职。
- 模型落后: 在 Gemini 2.5 发布之前,Google 长期被 OpenAI 的 GPT 系列压制,甚至一度不如 Anthropic 的 Claude,面临在 AI 时代掉队的风险。
但在过去两年,Google 成功扭转了局势:
- 搜索护城河依然稳固: 事实证明,Google Search 并未被轻易颠覆,反而通过集成 AI 变得更强。用户在多轮对话中不仅有明确的个性化需求,AI 还能更精准地推荐个性化的产品与服务。广告业务被 AI 范式颠覆的风险被大大高估了。
- 组织架构重塑: 2023 年起,创始人 Sergey Brin 回归一线,深度参与模型开发。Google 将原本竞争的两个 AI 团队合并为 Google DeepMind,由 Demis Hassabis 挂帅。这一举措成功消除了内耗,重新激活了团队的创新力。
- 模型反超:Gemini 3 Pro 如今展现出后来居上的态势,不仅在性能上反超 GPT-5.1,市场占有率也稳步攀升。攻守之势异也,现在压力来到了 OpenAI 一方。
归根结底,AI 时代的核心竞争点依然是谁能做出最强的大模型。
如果 Gemini 弱,Google 的生态优势无从发挥;一旦 Gemini 领先,Google 强大的全栈整合能力就会瞬间爆发,形成降维打击。
最后我想说,英伟达是算力时代的‘卖水人’,而 Google 是全栈 AI 的‘领航员’。它们都是伟大的公司,对于投资者来说,与其在非此即彼的零和博弈中焦虑,不如看到它们各自不可替代的价值——这两者都值得你们同时拥有。
#AI产业 #大模型 #AI基础设施 #GPU #Gemini #TPU #JAX #XLA #CUDA #谷歌 #英伟达 November 11, 2025
我が友、セレニティ氏による $NVDA と $GOOGL らライバル達についての分析👀
"Nvidia( $NVDA )は、2026年度第3四半期の売上として570.1億ドル(前年比+62.5%)という驚異的な数字を発表した。
さらに、第4四半期のガイダンスは650億ドル以上(市場予想を30億ドル以上上回る)。そして2026年暦年までにBlackwell/Rubin関連で5000億ドル以上の売上を見込んでいる。
それにもかかわらず、同社株は12%下落した。
今、$NVDAは「強気の買い」なのか? これが答えだ。
GoogleのTPUプログラムは、Nvidia GPUに対する最初の本格的な競合として浮上しており、Anthropicは100万個以上のTPUチップをコミット、Metaも数十億ドル規模のTPU購入に向けた高度な交渉を行っていると報じられている。ウォーレン・バフェットも最近40億ドル以上を$GOOGLに投じており、技術企業に保守的なバークシャーとしては極めて異例だ。
記録的な好決算にもかかわらず、Nvidia株はここ10営業日のうち6日下落し、10月29日の過去最高値207.04ドル(時価総額5.03兆ドルに一時到達)から約12〜15%下に位置している。
アナリストの反応は圧倒的に強気で、軒並み目標株価を引き上げている。
•Evercore ISI:261 → 352ドル
•Bank of America:235 → 275ドル
•Citigroup:220 → 270ドル
•Goldman Sachs:240 → 250ドル
•Morgan Stanley:220 → 235ドル
しかし、ここで重要な「1兆ドル級の問い」はこれだ:ハイパースケーラー各社によるカスタムシリコンの台頭は、NVIDIAのAI支配力を弱めるのか?
AMDが主に「NVIDIAの在庫不足時の受け皿」であるのとは違い、GoogleのTPUプログラムは全く異なる競争構造を持つ。
TPU v7 Ironwoodは、NVIDIA Blackwellと初めて性能面で並ぶ非NVIDIAアクセラレータであり、FP8で4.6ペタフロップス(B200は4.5ペタフロップス)、192GBのHBM3eメモリを搭載する。
Ironwoodのアーキテクチャは大きく異なる。NVIDIAの最大クラスタ構成は72 GPU(NVL72)だが、TPU Ironwoodは9,216チップのポッドまでスケールする。
顧客採用は重要かつ急拡大している:
•Anthropicは100万個以上のTPUチップを「数十億ドル」規模でコミットし、1GWの計算能力が稼働予定。
•Metaは2026年にGoogle CloudからTPU容量を借りる最終段階の交渉を進めており、2027年には自社データセンター向けにハード購入を計画。
•AppleはApple Intelligenceの基盤モデルをすべてTPU上で訓練しており、サーバーモデルでは8192個のTPUv4チップを使用。
•MidjourneyはGPUからTPUに切り替え、推論コストを65%削減(月200万ドル → 70万ドル)。
状況はニュアンスがある。TPUは大規模推論において、現時点で最大4倍のコスパで優位に立つ。一方、トレーニングではNVIDIAが明確な優位性を持つ。
高度に最適化された推論タスクでは、TPUアーキテクチャがNVIDIAの汎用GPUより効率的なケースが当面続くかもしれない。
しかし、次世代Nvidia GPUは多くの推論領域でTPUを再び上回ると予想している(GPT5 → Gemini3 → Opus4.5 のようにLLM同士が追い越し合うのと同じ現象)。
現状、Google TPU、AWS Trainium、Meta MTIA、Microsoft Maiaといった各社のカスタムチップは、NVIDIAへの依存を減らすために拡大している。しかし、それらの累積効果で、ハイパースケーラーがNvidiaの支配力を本当に削ぐのか?
答え:いいえ。まだその段階ではない。
少なくとも今後2年間、Nvidiaの支配は確保されている。それ以降は完全に予測の領域だ。
単純に数字を見ると、2026年までの5000億ドル超の受注残があり、Nvidiaは依然としてAIの基盤インフラ企業であることが第3四半期の結果から明白だ。
しかし市場は、3年以上先の「カスタムチップによる長期的な競争不確実性」をすでに織り込み始めているようだ。
Nvidiaは供給能力が完全に売り切れており、次世代チップでは(汎用性を保ったまま)TPUの推論性能を上回る可能性が高い。とはいえ、カスタムシリコンの脅威と44倍のPERという評価面の重さは確かに逆風である。
それでも、今の恐怖による下落局面は、中期的には強い押し目買いの機会に見える。少なくとも向こう2年の業績と受注残が非常に強力だからだ。
覚えておくべきことはただ一つ。
NVIDIAがAIワークロードの「業界第一選択」であり続ける限り、$NVDAは強い買いであり、TPUやAMD GPUはNVIDIAの供給不足時に需要ギャップを埋める存在にとどまる。
Nvidiaは受注残が満杯で、AI需要は減速していない。" November 11, 2025
Ryzen 7 9800X3D…?マジか、動作不良で返品できるって最高じゃん。羨ましいなぁ。
[動作保証] AMD Ryzen 7 9800X3D, グリス, グリスガード
https://t.co/KG7rjFysK7 November 11, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。





