GPT-5 トレンド
0post
2025.11.26 13:00
:0% :0% (40代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
Gemini3, Nano Banana Pro登場で, 先月時点で私がTBSの以下番組で「OpenAIは危うい.Googleが勝つ」としてたのが注目(特に投資家層?)されてるようです
実際は公には以下記事で2024年OpenAI絶頂期からずっとGoogle有利とみてます
長い(私のX史上最長)ですが根拠, OpenAI vs Googleの展望を書いてみます
先月のTBS動画:https://t.co/kgWcyTOTWK
2024年6月の記事:https://t.co/4HEhA4IJQa
参考のため、私がクローズドな投資家レクなどで使う資料で理解の助けになりそうなものも貼っておきます。
※以下はどちらかというと非研究者向けなので、研究的には「当たり前では」と思われることや、ちょっと省略しすぎな点もあります。
まず、現在の生成AI開発に関して、性能向上の根本原理、研究者のドグマ的なものは以下の二つです。基本的には現在のAI開発はこの二つを押さえれば大体の理解ができると思います。両者とも出てきたのは約5年前ですが、細かい技術の発展はあれど、大部分はこの説に則って発展しています。
①スケーリング則
https://t.co/WKl3kTzcX5
②SuttonのThe Bitter Lesson
https://t.co/esHtiJAcH9
①のスケーリング則は2020年に出てきた説で、AIの性能は1)学習データの量、2)学習の計算量(=GPUの投入量)、3)AIのモデルサイズ(ニューラルネットワークのパラメータ数)でほぼ決まってしまうという説です。この3つを「同時に」上げ続けることが重要なのですが、1と3はある程度研究者の方で任意に決められる一方、2のGPUはほぼお金の問題になります。よって、スケーリング則以降のAI開発は基本的にお金を持っている機関が有利という考えが固まりました。現在のChatGPTなどを含む主要な生成AIは一つ作るのに、少なく見積もってもスカイツリーを一本立てるくらい(数百億)、実際には研究の試行錯誤も含めると普通に数千億から数兆かかるくらいのコストがかかりますが、これの大部分はGPUなどの計算リソース調達になります。
②のThe Bitter Lessonは、研究というよりはRichard Suttonという研究者個人の考えなのですが、Suttonは現在のAI界の長老的な人物で、生成AI開発の主要技術(そして私の専門)でもある強化学習の事実上の祖かつ世界的な教科書(これは私達の翻訳書があるのでぜひ!)の執筆者、さらにわれわれの分野のノーベル賞に相当するチューリング賞の受賞者でもあるので、重みが違います。
これは端的にいうと、「歴史的に、AIの発展は、人間の細かい工夫よりも、ムーアの法則によって加速的に発展する計算機のハードの恩恵をフルに受けられるものの方がよい。つまりシンプルで汎用的なアルゴリズムを用い、計算機パワーに任せてAIを学習させた方が成功する。」ということを言っています。
①と②をまとめると、とにかく現状のAIの性能改善には、GPUのような計算リソースを膨大に動員しなければならない。逆に言えばそれだけの割と単純なことで性能上昇はある程度約束されるフェーズでもある、ということになります。
これはやや議論を単純化しすぎている部分があり、実際には各研究機関とも細かいノウハウなどを積み重ねていたり、後述のようにスケーリングが行き詰まることもあるのですが、それでも昨今のAI発展の大半はこれで説明できます。最近一般のニュースでもよく耳にするようになった異常とも言えるインフラ投資とAIバブル、NVIDIAの天下、半導体関連の輸出制限などの政治的事象も、大元を辿ればこれらの説に辿り着くと思います。
以下、この二つの説を前提に話を進めます。
公にはともかく私が個人的に「OpenAIではなくGoogleが最終的には有利」と判断したのはかなり昔で、2023年の夏時点です。2023年6月に、研究者界隈ではかなり話題になった、OpenAIのGPT-4に関するリーク怪文書騒動がありました。まだGoogleが初代Geminiすら出してなかった時期です。(この時期から生成AIを追っている人であれば、GPT-4のアーキテクチャがMoEであることが初めて明らかになったアレ、と言えば伝わるかと思います)
ChatGPTの登場からGPT-4と来てあれほどの性能(当時の感覚で言うと、ほぼ錬金術かオーパーツの類)を見せられた直後の数ヶ月は、さすがに生成AI開発に関する「OpenAIの秘伝のタレ説」を考えており、OpenAIの優位は揺らがないと考えていました。論文では公開されていない、既存研究から相当逸脱した特殊技術(=秘伝のタレ)がOpenAIにはあって、それが漏れない限りは他の機関がどれだけお金をかけようが、まず追いつくのは不可能だと思っていたのです。しかし、あのリーク文書の結論は、OpenAIに特別の技術があったわけではなく、あくまで既存技術の組み合わせとスケーリングでGPT-4は実現されており、特に秘伝のタレ的なものは存在しないというものでした。その後、2023年12月のGemini初代が微妙だったので、ちょっと揺らぐこともあったのですが、基本的には2023年から私の考えは「最終的にGoogleが勝つだろう」です。
つまり、「スケーリングに必要なお金を持っており、実際にそのAIスケーリングレースに参加する経営上の意思決定と、それを実行する研究者が存在する」という最重要の前提について、OpenAIとGoogleが両方とも同じであれば、勝負が着くのはそれ以外の要素が原因であり、Googleの方が多くの勝ちにつながる強みを持っているだろう、というのが私の見立てです。
次に、AI開発競争の性質についてです。
普通のITサービスは先行者有利なのですが、どうもAI開発競争については「先行者不利」となっている部分があります。先行者が頑張ってAIを開発しても、その優位性を保っている部分でAIから利益を得ることはほとんどの場合はできず、むしろ自分たちが発展させたAI技術により、後発事業者が追いついてきてユーザーが流出してしまうということがずっと起きているように思われます。
先ほどのスケーリング則により、最先端のAIというのはとても大きなニューラルネットワークの塊で、学習時のみならず、運用コストも膨大です。普通のITサービスは、一旦サービスが完成してしまえば、ユーザーが増えることによるコスト増加は大したことがないのですが、最先端の生成AIは単なる個別ユーザーの「ありがとうございます」「どういたしまして」というチャットですら、膨大な電力コストがかかる金食い虫です。3ドル払って1ドル稼ぐと揶揄されているように、基本的にはユーザーが増えれば増えるほど赤字です。「先端生成AIを開発し、純粋に生成AIを使ったプロダクトから利益を挙げ続ける」というのは、現状まず不可能です。仮に最先端のAIを提供している間に獲得したユーザーが固定ユーザーになってくれれば先行者有利の構図となり、その開発・運営コストも報われるのですが、現状の生成AIサービスを選ぶ基準は純粋に性能であるため、他の機関が性能で上回った瞬間に大きなユーザー流出が起きます。現状の生成AIサービスはSNSのように先行者のネットワーク効果が働かないため、常に膨大なコストをかけて性能向上レースをしなければユーザー維持ができません。しかも後発勢は、先行者が敷いた研究のレールに乗っかって低コストで追いつくことができます。
生成AI開発競争では以上の、
・スケーリング則などの存在により、基本的には札束戦争
・生成AIサービスは現状お金にならない
・生成AI開発の先行者有利は原則存在しない
と言う大前提を理解しておくと、読み解きやすいかと思います。
(繰り返しですがこれは一般向けの説明で、実際に現場で開発している開発者は、このような文章では表現できないほどの努力をしています。)
OpenAIが生成AI開発において(先週まで)リードを保っていた源泉となる強みは、とにかく以下に集約されると思います。
・スケーリングの重要性に最初に気付き、自己回帰型LLMという単なる「言語の穴埋め問題がとても上手なニューラルネットワーク」(GPTのこと)に兆レベルの予算と、数年という(AI界隈の基準では)気が遠くなるような時間を全ベットするという狂気を先行してやり、ノウハウ、人材の貯金があった
・極めてストーリー作りや世論形成がうまく、「もうすぐ人のすべての知的活動ができるAGIが実現する。それを実現する技術を持っているのはOpenAIのみである」という雰囲気作りをして投資を呼び込んだ
前者については、スケーリングと生成AIという、リソース投下が正義であるという同じ技術土俵で戦うことになる以上、後発でも同レベルかそれ以上の予算をかけられる機関が他にいれば、基本的には時間経過とともにOpenAIと他の機関の差は縮みます。後者については、OpenAIがリードしている分には正当化されますが、一度別の組織に捲られると、特に投資家層に対するストーリーの維持が難しくなります。
一方のGoogleの強みは以下だと思います。
・投資マネーに頼る必要なく、生成AI開発と応用アプリケーションの赤字があったとしても、別事業のキャッシュで相殺して半永久的に自走できる
・生成AIのインフラ(TPU、クラウド事業)からAI開発、AIを応用するアプリケーション、大量のユーザーまですべてのアセットがすでに揃っており、各段階から取れるデータを生かして生成AIの性能向上ができる他、生成AIという成果物から搾り取れる利益を最大化できる
これらの強みは、生成AIのブーム以前から、AIとは関係なく存在する構造的なものであり、単に時間経過だけでは縮まらないものです。序盤はノウハウ不足でOpenAIに遅れをとることはあっても、これは単に経験の蓄積の大小なので、Googleの一流開発者であれば、あとは時間の問題かと思います。
(Googleの強みは他にももっとあるのですが、流石に長くなりすぎるので省略)
まとめると、
生成AIの性能は、基本的にスケーリング則を背景にAI学習のリソース投下の量に依存するが、これは両者であまり差がつかない。OpenAIは先行者ではあったが、AI開発競争の性質上、先行者利益はほとんどない。OpenAIの強みは時間経過とともに薄れるものである一方、Googleの強みは時間経過で解消されないものである。OpenAIは自走できず、かつストーリーを維持しない限り、投資マネーを呼び込めないが、一度捲られるとそれは難しい。一方、GoogleはAIとは別事業のキャッシュで自走でき、OpenAIに一時的に負けても、長期戦でも問題がない。ということになります。
では、OpenAIの勝利条件があるとすれば、それは以下のようなものになると思います。
・OpenAIが本当に先行してAGI開発に成功してしまう。このAGIにより、研究開発や肉体労働も含むすべての人間の活動を、人間を上回る生産性で代替できるようになる。このAGIであらゆる労働を行なって収益をあげ、かつそれ以降のAIの開発もAGIが担うことにより、AIがAIを開発するループに入り、他の研究機関が原理的に追いつけなくなる(OpenAIに関する基本的なストーリーはこれ)
・AGIとまではいかなくとも人間の研究力を上回るAIを開発して、研究開発の進捗が著しく他の機関を上回るようになる
・ネットワーク効果があり先行者有利の生成AIサービスを作り、そこから得られる収益から自走してAGI開発まで持っていく
・奇跡的な生成AIの省リソース化に成功し、現在の生成AIサービスからも収益が得られるようになる
・生成AI・スケーリング則、あるいは深層学習とは別パラダイムのAI技術レースに持ち込み技術を独占する(これは現在のAI研究の前提が崩れ去るので、OpenAI vs Googleどころの話ではない)
・Anthropicのように特定領域特化AIを作り、利用料金の高さを正当化できる価値を提供する
最近のOpenAIのSora SNSや、検索AI、ブラウザ開発などに、この辺の勝利条件を意識したものは表れているのですが、今のところ成功はしていないのではないかと思います。省リソース化に関しては、多分頑張ってはいてたまに性能ナーフがあるのはこれの一環かもしれないです。とはいえ、原則性能の高さレースをやっている時にこれをやるのはちょっと無理。最後のやつは、これをやった瞬間にAGIを作れる唯一のヒーローOpenAIの物語が崩れるのでできないと思います。
最後に今回のGemini3.0やNano Banana Pro(実際には二つは独立のモデルではなく、Nano Bananaの方はGemini3.0の画像出力機能のようですが)に関して研究上重要だったことは、事前学習のスケーリングがまだ有効であることが明らかになったことだと思います。
ここまでひたすらスケーリングを強調してきてアレですが、実際には2024年後半ごろから、データの枯渇によるスケーリングの停滞が指摘されていること、また今年前半に出たスケーリングの集大成で最大規模のモデルと思われるGPT-4.5が失敗したことで、単純なスケーリングは成り立たなくなったとされていました。その一方で、
去年9月に登場したOpenAIのo1やDeepSeekによって、学習が終わった後の推論時スケーリング(生成AIが考える時間を長くする、AIの思考過程を長く出力する)が主流となっていたのが最近です。
OpenAIはそれでもGPT-5開発中に事前学習スケーリングを頑張ろうとしたらしいのですが、結局どれだけリソースを投下しても性能が伸びないラインがあり、諦めたという報告があります。今回のGemini3.0に関しては、関係者の発言を見る限り、この事前学習のスケーリングがまだ有効であり、OpenAIが直面したスケーリングの限界を突破する方法を発見していることを示唆しています。
これはもしかしたら、単なるお金をかけたスケーリングを超えて、Googleの技術上の「秘伝のタレ」になる可能性もあり、上記で書いた以上の強みを今回Googleが手にした可能性もあると考えています。
本当はもっと技術的に細かいことも書きたいのですが、基本的な考えは以上となります。色々と書いたものの、基本的には両者が競争してもらうことが一番技術発展につながるとは思います! November 11, 2025
1RP
使えば使うほどNano Banana Proが恐ろしい性能だと実感する。感覚的にはGPT-4登場時の「なにをどうやったらこんなものが出来上がるのか?」という感覚に近く、何世代も先の技術が突然目の前に出てきた感すらある。
Gemini3.0も凄いんですが、それでもGPT-5とから何世代も進んだ感覚まではない。そもそも数ヶ月前のNano BananaでOpenAIを遥かに超えて、あの革ジャンCEOが興奮するレベルだったのに、短期間でさらにこれである。 November 11, 2025
Copilotによるこの一連の流れは鉄板ですね。gpt-5により推論とウェブサーチの組合せで最低限の先行技術調査ができるようになりました。そこから発明内容と先行技術文献から自社の提案書フォーマットに落とし込む下書き文章も自動生成できる。 https://t.co/t2pJBGJ9l5 November 11, 2025
✅僕も昔から同じ考えで、最初からGoogleの方が有利だけど、まだまだ勝負は決まらない。
✅NanoBananaを含むGeminiのマルチモーダル性能は凄いが、それ以外の性能はGPT-5.1と大差なく、GPTの方が勝っている部分もある。
✅今回の騒ぎもDeepSeekショックと同じで、大騒ぎしても皆すぐに忘れるだろう。 https://t.co/LSirPLDOIb November 11, 2025
ちょっと無茶ぶりかなと思いつつGPT-5.1 Thinkingに今日の読売新聞の連載記事を画像で読ませて評価させてみた。かなりリソースを使ってしまった^^; それはさておき何故朝日新聞と思ったのか(お昼休みが終わったので続きは後で遊ぶ)(覚えてたら)。 https://t.co/Mm7EuHFAAx November 11, 2025
Artificial Analysis 对 Claude Opus 4.5 的评测结果:智能水平大幅提升,和 GPT-5.1-high 并列第二,仅次于 Gemini 3 Pro。该模型支持思考和非思考模式,200K 上下文窗口,最大输出 64K。
以下为原文翻译:
Anthropic 新推出的 Claude Opus 4.5 在 Artificial Analysis Intelligence Index(人工智能分析智能指数)中排名第二,略微落后于 Google 的 Gemini 3 Pro,并与 OpenAI 的 GPT-5.1 (high) 并列。
Claude Opus 4.5 相比 Claude Sonnet 4.5(在 Artificial Analysis Intelligence Index 上 +7 分)和 Claude Opus 4.1(+11 分)实现了显著的智能提升,确立了其作为 @AnthropicAI 新旗舰模型的地位。Anthropic 大幅降低了 Claude Opus 4.5 的每 token 价格至每百万输入/输出 token 5美元/25美元。然而,与之前的 Claude Opus 4.1 模型相比,它在完成我们的 Intelligence Index 评估时多使用了 60% 的 token(48M vs. 30M)。这意味着运行我们的 Intelligence Index 评估的成本从 3.1k 美元大幅降低至 1.5k 美元,但降幅没有标价降幅所暗示的那么显著。尽管 Claude Opus 4.5 在完成我们的 Intelligence Index 时使用了多得多的 token,但该模型的成本仍明显高于其他模型,包括 Gemini 3 Pro (high)、GPT-5.1 (high) 和 Claude Sonnet 4.5 (Thinking),在所有模型中仅低于 Grok 4 (Reasoning)。
关键基准测试要点:
➤ Anthropic 最智能的模型:在推理模式下,Claude Opus 4.5 在 Artificial Analysis Intelligence Index 中得分为 70。这比 2025 年 9 月发布的 Claude Sonnet 4.5 (Thinking) 高出 7 分,比 Claude Opus 4.1 (Thinking) 高出 11 分。Claude Opus 4.5 现在是第二智能的模型。它领先于 Grok 4 (65) 和 Kimi K2 Thinking (67),与 GPT-5.1 (high, 70) 并列,仅落后于 Gemini 3 Pro (73)。Claude Opus 4.5 (Thinking) 在 CritPt(一项反映研究助理能力的前沿物理评估)中得分为 5%。它仅落后于 Gemini 3 Pro (9%),与 GPT-5.1 (high, 5%) 并列。
➤ 编码和代理任务提升最大:与 Claude Sonnet 4.5 (Thinking) 相比,最大的提升出现在编码、代理任务和长上下文推理方面,包括 LiveCodeBench (+16 p.p.)、Terminal-Bench Hard (+11 p.p.)、$\tau^2$-Bench Telecom (+12 p.p.)、AA-LCR (+8 p.p.) 和 Humanity's Last Exam (+11 p.p.)。Claude Opus 在 Artificial Analysis Intelligence Index 的所有 10 项基准测试中均取得了 Anthropic 迄今为止的最高分。它还在 Terminal-Bench Hard (44%) 中获得了所有模型中的最高分,并在 MMLU-Pro (90%) 上与 Gemini 3 Pro 并列。
➤ 知识与幻觉:在我们最近推出的衡量语言模型嵌入知识和幻觉的 AA-Omniscience Index 中,Claude Opus 4.5 以 10 分的成绩排名第二。它仅落后于 Gemini 3 Pro Preview (13),领先于 Claude Opus 4.1 (Thinking, 5) 和 GPT-5.1 (high, 2)。Claude Opus 4.5 (Thinking) 的准确率排名第二 (43%),幻觉率排名第四低 (58%),仅落后于 Claude Haiku (Thinking, 26%)、Claude Sonnet 4.5 (Thinking, 48%) 和 GPT-5.1 (high)。Claude Opus 4.5 继续展示了 Anthropic 在 AI 安全方面的领导地位,其幻觉率低于 Grok 4 和 Gemini 3 Pro 等其他部分前沿模型。
➤ 非推理性能:在非推理模式下,Claude Opus 4.5 在 Artificial Analysis Intelligence Index 中得分为 60,是最智能的非推理模型。它领先于 Qwen3 Max (55)、Kimi K2 0905 (50) 和 Claude Sonnet 4.5 (50)。
➤ Token 效率:Anthropic 继续展示出令人印象深刻的 token 效率。它在不显著增加 token 使用量的情况下提高了智能水平(与 Claude Sonnet 4.5 相比,评估时的最大推理预算为 64k token)。Claude Opus 4.5 使用 48M 输出 token 来运行 Artificial Analysis Intelligence Index。这低于其他前沿模型,例如 Gemini 3 Pro (high, 92M)、GPT-5.1 (high, 81M) 和 Grok 4 (Reasoning, 120M)。
➤ 定价:Anthropic 降低了 Claude Opus 4.5 的每 token 定价(相比 Claude Opus 4.1)。Claude Opus 4.5 的定价为每 1M 输入/输出 token 5美元/25美元(而 Claude Opus 4.1 为 15美元/75美元)。这使其定位更接近 Claude Sonnet 4.5(每 1M token 3美元/15美元),同时在思维模式下提供更高的智能。
关键模型详情:
➤ 上下文窗口:200K token
➤ 最大输出 token:64K token
➤ 可用性:Claude Opus 4.5 可通过 Anthropic 的 API、Google Vertex、Amazon Bedrock 和 Microsoft Azure 获取。Claude Opus 4.5 也可通过 Claude app 和 Claude Code 获取。 November 11, 2025
【検証】Claude Opus 4.5 vs GPT-5.1 vs Gemini 3 Pro
同じ指示で「農業ゲーム」を作らせてみたら...。
🥇Claude:天才エンジニア(デザインまで完璧)
🥈Gemini:お節介な先生(解説・気配り◎)
🥉GPT-5.1:堅実な大工(機能は動くが地味)
#AI #VibeCoding
👇詳細はブログで解説! November 11, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。




