DeepSeek トレンド
0post
2025.11.28
:0% :0% (30代/男性)
DeepSeekに関するポスト数は前日に比べ17%減少しました。男性の比率は4%増加し、本日も30代男性の皆さんからのポストが最も多いです。前日は「NVIDIA」に関する評判が話題でしたが、本日話題になっているキーワードは「Google」です。
人気のポスト ※表示されているRP数は特定時点のものです
Gemini3, Nano Banana Pro登場で, 先月時点で私がTBSの以下番組で「OpenAIは危うい.Googleが勝つ」としてたのが注目(特に投資家層?)されてるようです
実際は公には以下記事で2024年OpenAI絶頂期からずっとGoogle有利とみてます
長い(私のX史上最長)ですが根拠, OpenAI vs Googleの展望を書いてみます
先月のTBS動画:https://t.co/kgWcyTOTWK
2024年6月の記事:https://t.co/4HEhA4IJQa
参考のため、私がクローズドな投資家レクなどで使う資料で理解の助けになりそうなものも貼っておきます。
※以下はどちらかというと非研究者向けなので、研究的には「当たり前では」と思われることや、ちょっと省略しすぎな点もあります。
まず、現在の生成AI開発に関して、性能向上の根本原理、研究者のドグマ的なものは以下の二つです。基本的には現在のAI開発はこの二つを押さえれば大体の理解ができると思います。両者とも出てきたのは約5年前ですが、細かい技術の発展はあれど、大部分はこの説に則って発展しています。
①スケーリング則
https://t.co/WKl3kTzcX5
②SuttonのThe Bitter Lesson
https://t.co/esHtiJAcH9
①のスケーリング則は2020年に出てきた説で、AIの性能は1)学習データの量、2)学習の計算量(=GPUの投入量)、3)AIのモデルサイズ(ニューラルネットワークのパラメータ数)でほぼ決まってしまうという説です。この3つを「同時に」上げ続けることが重要なのですが、1と3はある程度研究者の方で任意に決められる一方、2のGPUはほぼお金の問題になります。よって、スケーリング則以降のAI開発は基本的にお金を持っている機関が有利という考えが固まりました。現在のChatGPTなどを含む主要な生成AIは一つ作るのに、少なく見積もってもスカイツリーを一本立てるくらい(数百億)、実際には研究の試行錯誤も含めると普通に数千億から数兆かかるくらいのコストがかかりますが、これの大部分はGPUなどの計算リソース調達になります。
②のThe Bitter Lessonは、研究というよりはRichard Suttonという研究者個人の考えなのですが、Suttonは現在のAI界の長老的な人物で、生成AI開発の主要技術(そして私の専門)でもある強化学習の事実上の祖かつ世界的な教科書(これは私達の翻訳書があるのでぜひ!)の執筆者、さらにわれわれの分野のノーベル賞に相当するチューリング賞の受賞者でもあるので、重みが違います。
これは端的にいうと、「歴史的に、AIの発展は、人間の細かい工夫よりも、ムーアの法則によって加速的に発展する計算機のハードの恩恵をフルに受けられるものの方がよい。つまりシンプルで汎用的なアルゴリズムを用い、計算機パワーに任せてAIを学習させた方が成功する。」ということを言っています。
①と②をまとめると、とにかく現状のAIの性能改善には、GPUのような計算リソースを膨大に動員しなければならない。逆に言えばそれだけの割と単純なことで性能上昇はある程度約束されるフェーズでもある、ということになります。
これはやや議論を単純化しすぎている部分があり、実際には各研究機関とも細かいノウハウなどを積み重ねていたり、後述のようにスケーリングが行き詰まることもあるのですが、それでも昨今のAI発展の大半はこれで説明できます。最近一般のニュースでもよく耳にするようになった異常とも言えるインフラ投資とAIバブル、NVIDIAの天下、半導体関連の輸出制限などの政治的事象も、大元を辿ればこれらの説に辿り着くと思います。
以下、この二つの説を前提に話を進めます。
公にはともかく私が個人的に「OpenAIではなくGoogleが最終的には有利」と判断したのはかなり昔で、2023年の夏時点です。2023年6月に、研究者界隈ではかなり話題になった、OpenAIのGPT-4に関するリーク怪文書騒動がありました。まだGoogleが初代Geminiすら出してなかった時期です。(この時期から生成AIを追っている人であれば、GPT-4のアーキテクチャがMoEであることが初めて明らかになったアレ、と言えば伝わるかと思います)
ChatGPTの登場からGPT-4と来てあれほどの性能(当時の感覚で言うと、ほぼ錬金術かオーパーツの類)を見せられた直後の数ヶ月は、さすがに生成AI開発に関する「OpenAIの秘伝のタレ説」を考えており、OpenAIの優位は揺らがないと考えていました。論文では公開されていない、既存研究から相当逸脱した特殊技術(=秘伝のタレ)がOpenAIにはあって、それが漏れない限りは他の機関がどれだけお金をかけようが、まず追いつくのは不可能だと思っていたのです。しかし、あのリーク文書の結論は、OpenAIに特別の技術があったわけではなく、あくまで既存技術の組み合わせとスケーリングでGPT-4は実現されており、特に秘伝のタレ的なものは存在しないというものでした。その後、2023年12月のGemini初代が微妙だったので、ちょっと揺らぐこともあったのですが、基本的には2023年から私の考えは「最終的にGoogleが勝つだろう」です。
つまり、「スケーリングに必要なお金を持っており、実際にそのAIスケーリングレースに参加する経営上の意思決定と、それを実行する研究者が存在する」という最重要の前提について、OpenAIとGoogleが両方とも同じであれば、勝負が着くのはそれ以外の要素が原因であり、Googleの方が多くの勝ちにつながる強みを持っているだろう、というのが私の見立てです。
次に、AI開発競争の性質についてです。
普通のITサービスは先行者有利なのですが、どうもAI開発競争については「先行者不利」となっている部分があります。先行者が頑張ってAIを開発しても、その優位性を保っている部分でAIから利益を得ることはほとんどの場合はできず、むしろ自分たちが発展させたAI技術により、後発事業者が追いついてきてユーザーが流出してしまうということがずっと起きているように思われます。
先ほどのスケーリング則により、最先端のAIというのはとても大きなニューラルネットワークの塊で、学習時のみならず、運用コストも膨大です。普通のITサービスは、一旦サービスが完成してしまえば、ユーザーが増えることによるコスト増加は大したことがないのですが、最先端の生成AIは単なる個別ユーザーの「ありがとうございます」「どういたしまして」というチャットですら、膨大な電力コストがかかる金食い虫です。3ドル払って1ドル稼ぐと揶揄されているように、基本的にはユーザーが増えれば増えるほど赤字です。「先端生成AIを開発し、純粋に生成AIを使ったプロダクトから利益を挙げ続ける」というのは、現状まず不可能です。仮に最先端のAIを提供している間に獲得したユーザーが固定ユーザーになってくれれば先行者有利の構図となり、その開発・運営コストも報われるのですが、現状の生成AIサービスを選ぶ基準は純粋に性能であるため、他の機関が性能で上回った瞬間に大きなユーザー流出が起きます。現状の生成AIサービスはSNSのように先行者のネットワーク効果が働かないため、常に膨大なコストをかけて性能向上レースをしなければユーザー維持ができません。しかも後発勢は、先行者が敷いた研究のレールに乗っかって低コストで追いつくことができます。
生成AI開発競争では以上の、
・スケーリング則などの存在により、基本的には札束戦争
・生成AIサービスは現状お金にならない
・生成AI開発の先行者有利は原則存在しない
と言う大前提を理解しておくと、読み解きやすいかと思います。
(繰り返しですがこれは一般向けの説明で、実際に現場で開発している開発者は、このような文章では表現できないほどの努力をしています。)
OpenAIが生成AI開発において(先週まで)リードを保っていた源泉となる強みは、とにかく以下に集約されると思います。
・スケーリングの重要性に最初に気付き、自己回帰型LLMという単なる「言語の穴埋め問題がとても上手なニューラルネットワーク」(GPTのこと)に兆レベルの予算と、数年という(AI界隈の基準では)気が遠くなるような時間を全ベットするという狂気を先行してやり、ノウハウ、人材の貯金があった
・極めてストーリー作りや世論形成がうまく、「もうすぐ人のすべての知的活動ができるAGIが実現する。それを実現する技術を持っているのはOpenAIのみである」という雰囲気作りをして投資を呼び込んだ
前者については、スケーリングと生成AIという、リソース投下が正義であるという同じ技術土俵で戦うことになる以上、後発でも同レベルかそれ以上の予算をかけられる機関が他にいれば、基本的には時間経過とともにOpenAIと他の機関の差は縮みます。後者については、OpenAIがリードしている分には正当化されますが、一度別の組織に捲られると、特に投資家層に対するストーリーの維持が難しくなります。
一方のGoogleの強みは以下だと思います。
・投資マネーに頼る必要なく、生成AI開発と応用アプリケーションの赤字があったとしても、別事業のキャッシュで相殺して半永久的に自走できる
・生成AIのインフラ(TPU、クラウド事業)からAI開発、AIを応用するアプリケーション、大量のユーザーまですべてのアセットがすでに揃っており、各段階から取れるデータを生かして生成AIの性能向上ができる他、生成AIという成果物から搾り取れる利益を最大化できる
これらの強みは、生成AIのブーム以前から、AIとは関係なく存在する構造的なものであり、単に時間経過だけでは縮まらないものです。序盤はノウハウ不足でOpenAIに遅れをとることはあっても、これは単に経験の蓄積の大小なので、Googleの一流開発者であれば、あとは時間の問題かと思います。
(Googleの強みは他にももっとあるのですが、流石に長くなりすぎるので省略)
まとめると、
生成AIの性能は、基本的にスケーリング則を背景にAI学習のリソース投下の量に依存するが、これは両者であまり差がつかない。OpenAIは先行者ではあったが、AI開発競争の性質上、先行者利益はほとんどない。OpenAIの強みは時間経過とともに薄れるものである一方、Googleの強みは時間経過で解消されないものである。OpenAIは自走できず、かつストーリーを維持しない限り、投資マネーを呼び込めないが、一度捲られるとそれは難しい。一方、GoogleはAIとは別事業のキャッシュで自走でき、OpenAIに一時的に負けても、長期戦でも問題がない。ということになります。
では、OpenAIの勝利条件があるとすれば、それは以下のようなものになると思います。
・OpenAIが本当に先行してAGI開発に成功してしまう。このAGIにより、研究開発や肉体労働も含むすべての人間の活動を、人間を上回る生産性で代替できるようになる。このAGIであらゆる労働を行なって収益をあげ、かつそれ以降のAIの開発もAGIが担うことにより、AIがAIを開発するループに入り、他の研究機関が原理的に追いつけなくなる(OpenAIに関する基本的なストーリーはこれ)
・AGIとまではいかなくとも人間の研究力を上回るAIを開発して、研究開発の進捗が著しく他の機関を上回るようになる
・ネットワーク効果があり先行者有利の生成AIサービスを作り、そこから得られる収益から自走してAGI開発まで持っていく
・奇跡的な生成AIの省リソース化に成功し、現在の生成AIサービスからも収益が得られるようになる
・生成AI・スケーリング則、あるいは深層学習とは別パラダイムのAI技術レースに持ち込み技術を独占する(これは現在のAI研究の前提が崩れ去るので、OpenAI vs Googleどころの話ではない)
・Anthropicのように特定領域特化AIを作り、利用料金の高さを正当化できる価値を提供する
最近のOpenAIのSora SNSや、検索AI、ブラウザ開発などに、この辺の勝利条件を意識したものは表れているのですが、今のところ成功はしていないのではないかと思います。省リソース化に関しては、多分頑張ってはいてたまに性能ナーフがあるのはこれの一環かもしれないです。とはいえ、原則性能の高さレースをやっている時にこれをやるのはちょっと無理。最後のやつは、これをやった瞬間にAGIを作れる唯一のヒーローOpenAIの物語が崩れるのでできないと思います。
最後に今回のGemini3.0やNano Banana Pro(実際には二つは独立のモデルではなく、Nano Bananaの方はGemini3.0の画像出力機能のようですが)に関して研究上重要だったことは、事前学習のスケーリングがまだ有効であることが明らかになったことだと思います。
ここまでひたすらスケーリングを強調してきてアレですが、実際には2024年後半ごろから、データの枯渇によるスケーリングの停滞が指摘されていること、また今年前半に出たスケーリングの集大成で最大規模のモデルと思われるGPT-4.5が失敗したことで、単純なスケーリングは成り立たなくなったとされていました。その一方で、
去年9月に登場したOpenAIのo1やDeepSeekによって、学習が終わった後の推論時スケーリング(生成AIが考える時間を長くする、AIの思考過程を長く出力する)が主流となっていたのが最近です。
OpenAIはそれでもGPT-5開発中に事前学習スケーリングを頑張ろうとしたらしいのですが、結局どれだけリソースを投下しても性能が伸びないラインがあり、諦めたという報告があります。今回のGemini3.0に関しては、関係者の発言を見る限り、この事前学習のスケーリングがまだ有効であり、OpenAIが直面したスケーリングの限界を突破する方法を発見していることを示唆しています。
これはもしかしたら、単なるお金をかけたスケーリングを超えて、Googleの技術上の「秘伝のタレ」になる可能性もあり、上記で書いた以上の強みを今回Googleが手にした可能性もあると考えています。
本当はもっと技術的に細かいことも書きたいのですが、基本的な考えは以上となります。色々と書いたものの、基本的には両者が競争してもらうことが一番技術発展につながるとは思います! November 11, 2025
79RP
シリコンバレーでピッチするスタートアップの8割がコスパの良いDeepSeek等の中国製モデルを採用しているとのこと
トークンあたり214倍安く、月間1億トークンを消費するスタートアップにとって、1,400ドル対300,000ドル
ランウェイが18ヶ月 vs 3ヶ月で全然変わってくる
「最高のモデルを作る」競争をしてる間に、「みんなが使うモデルを作る」競争で中国が勝ったのでは? November 11, 2025
24RP
2025年,我的几个第一性原理:
1. LLM token一定会越来越便宜,模型越来越强大,记住,所有做LLM Agent的人,都必须思考如何用10~1000倍的token带来革命,而不是他妈跟个傻逼似的天天想着省token;
2. chatbot的形式一定会被消灭,no chatbot revolution才是正确方向,一切AI应用不可能 、不应该、绝对不是一个个大号聊天机器人,一个个大对话框等着人大段大段往里敲字,
记住,所有AI产品必须重新设计,一切chatbot AI应用必定会被改写成NO CHATBOT形式,无一例外,chatbot的产品形态必然会彻彻底底、完完全全地淘汰,
或者那个傻逼一样的对话框,至少作为二等公民出现;
3. AI助手一定不能用“按个按钮”、“截个图”、“上传个文件”,再写个长长的prompt的形式出现,让用户解决个问题,先让用户点点按按十几次,
AI助手一定是具有强侵入性的,一定能主动嗅探一切环境,吞掉一切数据和信息,一定会主动在后台观察一切操作和行为——并且在疑似需要帮助的时候,主动弹出个对话框,用户一键确认后,主动接管,主动解决一切问题,
而绝不应该像准备个考试一样,准备文件、准备截图、准备一大堆按钮、准备一大长串prompt,让用户跟个大傻逼似的,手忙脚乱地在那儿表演,
总而言之,无论是商业落地的AI Agent,还是各种办公软件、工具、生活类的AI Agent,一个个不仅是傻逼兮兮的大黑框chatbot,而且要用户手动输入一大堆文件、图表、链接、信息,再敲一大段prompt——这些全都走了大弯路,
toC的无缝衔接强入侵的主动AI Agent助手,完完全全不会给你任何告诉他的机会,而是让AI Agent主动判断你是否需要我,直接给你一个大大的对话框,简单描述一下“我计划怎么帮助你”——你点一下确定,它来解决后面所有的事情。
4. 一切能用coding解决的问题,都是SWE Agent能解决的问题,也就是说,都可以直接拿claude code这类工具套壳来用,
SWE Agent这个形态,最擅长解决的问题,就是在一个确定的环境(一台机器、几台机器、若干仿真环境、一套terminal里的编译器/脚手架/运行环境/包管理、profiling和debugging方法)解决的问题,
而用coding解决的问题,从来都不止coding,一切VHDL/Verilog等电路设计、电路simulation和validation、一切类似labview和matlab simulink中可以仿真的电机、信号、示波器等等模块,
甚至ansys和CAD这类工具,还有大量data science和计算的问题,以及用lean或者formal-proof解决一些proof-based的数学和模型问题,都可以转化成一些API和coding解决的问题,然后让SWE Agent来解决,
这类问题可以叫做“一台机器上的确定环境下的问题”,
这类问题的特点是,可以靠LLM的智能不断拆分成一大堆subtasks,然后在本地环境下反复尝试、反复试错、反复看output、反复试验结果,失败后再换一个新的approach;
5. full self coding(https://t.co/W0qe8YtsYX)就是基于上面所有第一性原理的一个试验。
我将会设计一套侵入式试验,让10~500个ai agent组成一组,给一个github项目找出所有潜在的问题,包括文档、测试、修bug、优化、重构、完成todo list、加功能、加API等等,让10~100个agent并行完成这个repo潜在需要完成的所有任务,
并且让至少10组这样的agent去github上面公开贡献,等于在没有任何人为输入prompt的前提下,造出来1000~5000个agent在开源世界源源不断地做出贡献,就死死赖在github上面,尝试修复一切可能修复的潜在问题,做出贡献。
请你记住full self coding是最坚决贯彻test-time scaling law的行为,
full self coding坚决相信,人是ai agent世界最傻逼、最慢、错误最多、判断失误最高的存在,让程序员手敲prompt,无异于给AI Agent拖后腿,
只有先分析出问题,然后让10~500个agent同时并行运行,才能最大化执行的效率,最快速度解决已经发现的问题,无休止地为github提供潜在的有价值贡献——并且最关键的是,把“敲prompt的程序员”这个最垃圾、最慢、出错最多的环节彻底消除;
6. full self coding最大的瓶颈,一个是token价格过高,一个是目前几乎所有主流供应商,LLM inference速度过慢,
所以我最后的一个想告诉大家的价值观是:
groq、sambanova、cerebras这种在片上堆满几个GB的SRAM,在inference上效率是nvidia、amd、google TPU这些落后架构的10~50倍,这是test-time scaling law的最后一环,
如果人类在claude code、gemini cli上全面接入groq、sambanova、cerebras上host的模型,所有速度都会再快10~50倍,
现在最大的问题是,groq、sambanova、cerebras他们只能白嫖开源模型(deepseek、qwen、zai甚至更难用的llama),因为这三家自己没能力训练模型,本质是卖芯片的(实际是自己造完data center后卖API),
但是只要中国几家厂商能源源不断输送最好的开放weights的模型,让groq、sambanova、cerebras持续用上他们能用的最好的开放weights的模型,这三家最终会把nvidia、google tpu连同他们的客户一锅端。
人类依然非常需要LLM inference的时间上的飞速优化,只不过现在人们需要更强的模型,而人类愿意为此多等等时间,
但是终归有一天人们会发现,无论是coding,还是在各种infra中快速反馈相应,哪怕是简单的搜索或者问答,inference速度这件事才是至关重要。 November 11, 2025
22RP
書きました
米国と比べてチップ処理力不足?
中国はDeepSeekが怪しい?
生成AIで世界的な電力不足で中国も?
などなど中国の生成AIの疑問が読んで解決の記事です
「中国の生成AIの現在地を中国メディアの報道から分析する(サイエンスポータルチャイナ)」 #山谷剛史記事
https://t.co/WR6tstE7cZ November 11, 2025
19RP
谷歌+阿里千问 强关联的八家公司!(整理版)
近日,谷歌发布了最新的大语言模型Gemini 3,多位业内权威人士认为其已经“超越”了OpenAI的GPT模型。这款大模型采用谷歌自研的TPU(张量处理单元)芯片,其性能受到业界的密切关注。
据悉,作为英伟达Blackwell芯片的一种可行替代方案,谷歌计划将TPU大范围推向市场,抢占英伟达10%的市场份额。已有媒体报道称,Meta正在考虑从2027年起在其数据中心部署谷歌的TPU,价值达到数十亿美元,还可能在明年通过谷歌云租借TPU。
11月17日,阿里巴巴正式宣布“千问”项目,全力进军AI to C市场。基于全球性能第一的开源模型Qwen3,以及与各类生活场景生态的结合,全面免费的千问App与ChatGPT展开全面竞争。
上线次日,千问App迅速攀升至苹果App Store免费应用总榜第四位,排名超越DeepSeek,其火爆人气一度导致服务器拥堵。11月19日,千问App在公测上线仅两天后,就冲入苹果App Store免费应用总榜第三位。
在业内人士看来,此次阿里推出千问App,堪比AI入口之战的“诺曼底登陆”。西部证券分析称,未来,阿里可能将通过订阅制、流量入口等商业模式建立C端盈利闭环,以模型+场景驱动AI服务更广泛地触达和转化终端用户。
本文整理了A股中,同时与谷歌和阿里有深度合作的八家公司,仅供参考!
1.蓝色光标
公司亮点:头部出海营销服务商,AI广告技术落地成效显著,2025年三季度净利润同比增长265.4%,在数字人、虚拟直播等领域的技术与业务布局成熟。
谷歌关联:作为谷歌全球超级合作伙伴,超80%营收与谷歌广告生态相关,拥有谷歌出海双重业务牌照,旗下BlueAI平台整合了 Google Veo3等模型用于广告创作,还获谷歌独家API接口和算法优化权限。
阿里关联:和阿里达摩院合作开拓虚拟直播技术,与阿里云共建数字人平台,为淘宝、天猫等提供数字营销服务,自研营销工具对接通义千问能力,阿里系电商是其重要客户来源。
2.万兴科技
公司亮点:国内创意软件领域标杆企业,旗下视频剪辑等产品在全球拥有较高知名度,是国内谷歌 AI 生态链核心企业,AI 技术在创意产品中的应用处于行业前列。
谷歌关联:深度绑定谷歌AI生态,完成谷歌Veo - 3等模型接入,旗下视频剪辑产品作为唯一受邀的中国视频剪辑产品亮相 2025 谷歌开发者大会,该产品还获Google Play全球首页首屏推荐,集成谷歌 Gemini 2.5 Flash能力后集成效率增长70%。
阿里关联:其AI视频创作、3D设计等产品可对接阿里电商生态中商家的创意营销需求,为商家提供短视频内容生成等服务,助力商家优化营销内容产出。
3.数据港
公司亮点:国内领先的IDC服务商,PUE行业领先,是双巨头AI算力基建的重要合作方,2025年与阿里签订160亿元长期订单,算力服务能力契合AI大模型训练与推理的需求。
谷歌关联:公司的高功率机柜与数据中心解决方案,可间接适配谷歌在亚太地区的算力布局,为谷歌相关AI业务的本地数据处理提供支撑。
阿里关联:作为阿里云数据中心核心供应商,提供高密度算力及液冷解决方案,为阿里千问大模型的训练与推理提供AI推理专用集群等解决方案,推动其算力需求持续释放。
4.石基信息
公司亮点:酒店、零售行业SaaS服务龙头,服务全球超10万家酒店,阿里为其第二大股东,其零售SaaS系统在行业内应用广泛,具备对接智能体拓展场景的潜力。
谷歌关联:其面向全球的酒店、零售行业SaaS服务,可对接谷歌生态中的海外商旅、零售客户,借助谷歌AI技术优化多语言服务与智能运营能力。
阿里关联:深度绑定阿里生态,将通义千问集成至酒店管理系统,千问APP计划整合淘宝购物功能后,其零售SaaS系统有望接入智能体进一步拓展应用场景。
5.中际旭创
公司亮点:全球光模块领域龙头企业,2025年三季度净利润同比增长124.98%,1.6T光模块研发处于领先地位,在800G/1.6T光模块领域的产品份额优势明显。
谷歌关联:是谷歌800G/1.6T光模块核心供应商,相关产品份额超 50%,来自谷歌的收入占比达12.8%,为谷歌算力传输提供核心硬件支撑。
阿里关联:作为阿里云800G光模块的主力供应商,可为阿里云支撑千问大模型的数据中心提供高速互联保障,助力阿里云算力网络稳定运行。
6.值得买
公司亮点:知名电商内容导流平台,在电商导购领域具备独特优势,通过AI技术优化导购逻辑,能有效提升平台商家流量转化效率,形成双电商生态的导购协同优势。
谷歌关联:跨境电商导购业务可对接谷歌广告生态,利用谷歌AI的多语言处理与用户偏好分析能力,为海外商品进入中国市场提供精准导流服务。
阿里关联:深度适配阿里生态,借助通义千问优化电商导购逻辑,为淘宝等平台商家提升流量转化效率,其“海纳”MCP Server还入驻阿里百炼。
7.易点天下
公司亮点:出海营销领域头部企业,连续9年获谷歌优秀合作伙伴大奖,2025年一季度营收同比增长超93%,AI 技术在多语种广告投放、短剧出海营销等场景应用效果显著。
谷歌关联:作为谷歌广告国内一级代理商,持有Google Marketing Platform官方销售合作伙伴资质,旗下KreadoAI平台接入谷歌 Gemini 3.0等模型,为短剧出海提供多语种改编服务。
阿里关联:借助通义千问的多语言与数据分析能力强化海外程序化广告投放效果,同时是阿里云代理伙伴,联合发布“AI 营销+云服务”方案,为阿里多个出海项目提供营销服务。
8.省广集团
公司亮点:营销行业数字化转型典范,旗下灵犀AI营销平台入选广州市“人工智能 +”优秀解决方案,2025年Q2智能营销收入占比提升至 35%,在汽车、快消等行业营销领域经验丰富。
谷歌关联:旗下上海拓畅拥有谷歌国内和海外核心代理双牌照,是谷歌官方授权的一级代理商,依托谷歌全球营销网络,为中国企业提供专业出海营销服务。
阿里关联:与阿里在大数据营销领域深度协同,灵犀 AI 营销平台整合阿里云混合云技术,还是优酷核心合作伙伴,独家代理其区域运营商赛道业务,还借助阿里系平台为中国品牌提供跨境电商营销解决方案。
内容仅代表个人观点,不表明对相关产品服务的风险和收益做出实质性判断或保证,您须独立作出投资决策,风险自担。相关内容仅面向博众客户,股市有风险 投资需谨慎! November 11, 2025
7RP
🏛️ A股深度复盘与策略报告 - 机构交易员视角
📅 报告日期:2025-11-28
📊 样本覆盖:2901篇核心资讯(已剔除重复与低质内容)
⚖️ 权重模型:官方/政策媒体(1.0) > 权威财经(0.95) > 市场自媒体(0.4)
📊 【市场结构分析】
(资金面 / 情绪面 / 风格面)
🌍 宏观风向(DeepSeek):【核心矛盾】
市场定价主逻辑是"政策托底与信用传导不畅"的博弈。预期差在于:市场低估了监管肃清与流动性宽松并行的政策决心,高估了信用扩张的实际效率。
【领先指标】
票据直贴利率与出口先行指数(新出口订单PMI)将最先验证信用传导效果。当前票据利率低位震荡印证融资需求疲软,若月末突破2.5%则标志实体融资激活。
【情景推演】
- 基准情形(60%):结构性宽松延续,MLF超额续作与监管收紧并行,大盘震荡筑底,科创板块获超额收益
- 上行情形(25%):若美联储降息提前+中美关税缓和,半导体/跨境电商/新能源板块受益
- 下行情形(15%):若地产销售同比跌破-30%或美债收益率重返5%,需规避银行/建材/消费电子
【策略建议】
- 风格:成长风格占优(政策驱动估值修复)
- 市值:中大盘(微盘股受监管冲击未结束)
- 行业:①半导体设备(国产替代加速)②医疗器械(集采出清+创新扶持)③电力运营(绿电补贴落地+夏季用电高峰)
【风险预警】
未来1个月最大尾部风险是中美利差再度走阔引发北向资金单日净流出超150亿元,触发权重股流动性危机。
• 💸 量能:沪深成交额 1.585万亿 (🔻较昨日-1230.0亿)
• 🌡️ 情绪:🔥涨停 81 家 | ❄️ 跌停 6 家 | 🔺上涨 4109 / 🔻下跌 1060
• 📊 趋势:全市场高于5日线占比 77.5% (微85.88% | 中73.94% | 大 70.12%)
• 💰 资金:主力净流向 1052.28亿
• 🚀 攻击方向:新能源汽车 +110.6亿 | 光伏 +93.6亿 | 军工 +78.8亿 | 锂电池 +75.9亿 | 半导体 +62.5亿
• 🛡️ 抛压方向:银行 -31.4亿 | 大金融 -17.1亿 | 中药 -16.4亿 | 医药 -15.8亿 | 化学原料药 -9.5亿
🔍 【潜在热点发现】(未匹配新闻聚类)
• 新兴主题:[长鑫存储发布首个国产ddr5芯片/已向联想供货/小米三个交易日回购超9亿港元] (热度: 48)
示例:昆仑万维正式发布Mureka V7.6和Mureka O2模型
• 新兴主题:[降息预期下纳指创半年来最大单日涨幅/知名投资人再警示ai泡沫风险/bnb价格与价值短期或不相关] (热度: 19)
示例:分析师:比特币链上指标呈看跌信号,后续上涨或取决于宏观流动性环境
• 新兴主题:[万科事件如何扰动长债利率/债市继续承压/4只万科境内债盘中临时停牌] (热度: 17)
示例:华夏幸福强推“预重整”,债权人联合查账遭拒!发生了什么?
• 新兴主题:[广联航空/燃气轮机业务是公司重点培育的新增长极/收购] (热度: 11)
示例:广联航空:通过“收购+合作”双路径切入商业航天产业核心环节
• 新兴主题:[救命啊/黄金怎么也跟着美股/跳楼] (热度: 11)
示例:DeepSeek上新!首个奥数金牌水平的模型来了
🏭 【产业链与板块逻辑】
🔥 核心主线(资金+热度共振):
1. TMT科技(中性观望)
逻辑:Z-score 0.22 | 机构认可度 0.53 | 政策支撑 0.19
🧠 AI情绪:超预期(+0.23) | 情绪显著性 0.28 | 紧迫性 0.27
🤖 逻辑归因(DeepSeek):核心催化剂来自"5G+工业互联网"规模化应用政策推动及AI技术向汽车、半导体等产业渗透,预期差在于市场尚未充分定价国产半导体软件替代进程,机构视角下TMT板块正从主题投资转向业绩驱动,建议关注工业互联网、AI应用及半导体国产化三条主线。
核心:GQY视讯 | 欣锐科技 | 伊戈尔
2. 新能源(中性观望)
逻辑:Z-score 0.22 | 机构认可度 0.45 | 政策支撑 0.14
🧠 AI情绪:超预期(+0.20) | 情绪显著性 0.22 | 紧迫性 0.27
结构:✅ 结构紧凑(聚焦度78%),资金锁定核心逻辑,行情持续性强。
🤖 逻辑归因(DeepSeek):核心催化剂来自储能市场超预期增长及锂产业供需改善预期,叠加AI算力扩张催生电力设备新需求;预期差在于市场低估了循环经济政策对新能源产业链的边际提振;机构视角下板块呈现产业链协同强化与技术迭代双轮驱动,中期景气度有望延续。
核心:长城科技 | 江苏华辰 | 宏工科技
3. 大消费(中性观望)
逻辑:Z-score -0.02 | 机构认可度 0.49 | 政策支撑 0.29
🧠 AI情绪:符合预期(+0.04) | 情绪显著性 0.16 | 紧迫性 0.31
🤖 逻辑归因(DeepSeek):冰雪旅游政策催化叠加新能源车业绩改善预期,机构关注点从规模扩张转向盈利质量,预期差在于市场低估了消费升级与产业转型的协同效应,当前板块呈现结构性修复特征。
核心:西麦食品 | 源飞宠物 | 妙可蓝多
🕵️ 资金隐蔽吸筹(预期差机会):
• 新能源:热度Z 0.22 vs 资金Z 1.911 (静默期主力抢筹)
• 大消费:热度Z -0.203 vs 资金Z 0.912 (静默期主力抢筹)
💡 【核心结论】
1. 市场核心聚焦【TMT科技】,具备资金与热度双重支撑,可作为仓位配置重心。
2. 重点关注【新能源、大消费】的预期差机会,资金先于舆情启动。
📊 【策略信号回测】(历史数据验证)
• 提示:近30日未触发高热度信号(Heat > 1.0),无法进行有效性回测。
📈 【策略建议】
1. 仓位管理:建议根据大盘量能决定仓位,量缩则减,量增则推。
2. 交易节奏:主线分歧低吸,非主线冲高减仓。
3. 重点观察:
🎯 强势个股观察:
- 西麦食品(002956):食品饮料-食品加工制造-休闲食品 | 综合分 100.0
- 大位科技(600589):计算机-IT服务-IT服务Ⅲ | 综合分 100.0
- 国茂股份(603915):机械设备-通用设备-金属制品 | 综合分 100.0 November 11, 2025
2RP
なるほど!>目論見書を読み解くと、ソフトバンクグループ(SBG)が法的な開示義務に従って記載してはいるものの、**「本音ではあまり触れてほしくない(投資家の目から遠ざけたい)不都合なリスク」**の核心が見えてきます。
それは、**「アーム(Arm)のビジネスモデルそのものが崩れる可能性(Qualcommとの訴訟)」と、「資産担保借入(ABF)による資金の逆流リスク」**の2点です。
これらがなぜ「最も都合が悪い」のか、その理由を解説します。
1. アームの「Qualcomm訴訟」という地雷
SBGの現在の企業価値は、大部分が子会社であるアーム(Arm)の株価に依存しています。そのアームの成長シナリオを根本から脅かすのが、目論見書のリスク要因としてさらっと(しかし具体的に)記載されているQualcomm(クアルコム)との訴訟です。
記載箇所:
「アームは、Qualcomm, Inc....との係争中の訴訟に関与しています。...このような訴訟の結果や、それによる現在主要顧客であるQualcommとの関係や収益への影響は不透明です。」
なぜ都合が悪いのか:この訴訟の本質は、アームが目指している**「値上げ(ロイヤルティー単価の引き上げ)」戦略に対する主要顧客からの反乱**だからです。 アームは収益拡大のため、従来の「設計図のライセンス」から「製品ごとの課金」や「PC向けライセンスの強制」などへモデルチェンジを図っています。しかし、大口顧客のQualcommはこれに猛反発し、法廷闘争になっています。
最悪のシナリオ: もしアームが敗訴したり、Qualcommがアーム離れ(RISC-Vへの乗り換えなど)を加速させたりすると、SBGが描いている**「アームの独占的地位による収益拡大」という成長ストーリー(=高い株価の根拠)が崩壊**します。これはLTVの悪化に直結します。
2. 「DeepSeekショック」が示すAIバブルの脆さ
目論見書には、2025年1月の市場動向として**「DeepSeek」**の影響がわざわざ言及されています。
記載箇所:
「中国の新興AI企業DeepSeekが低コストで高度なAIモデルを発表すると...最先端のAI半導体の需要が伸び悩むとの懸念が広がり、巨大テクノロジー・半導体関連企業の株価は一時急落しました。」
なぜ都合が悪いのか:SBGは「ASI(人工超知能)こそが正義」として、AI半導体やデータセンターに巨額投資を行っています。しかし、DeepSeekのような「低コスト・高効率」な技術が登場し、AI開発競争が「コスト削減競争(コモディティ化)」に向かうと、SBGが投資しているNVIDIAやOpenAI、そしてアームの高付加価値チップへの需要が、想定よりも小さくなる(または価格が下がる)恐れがあります。 「AIなら何でも上がる」という前提が崩れることは、SBGの投資戦略の根幹を揺るがす事実です。
3. ABF(資産担保借入)という「資金の吸い上げ装置」
財務戦略として活用している「アセットバック・ファイナンス(ABF)」には、市場急変時にSBGの首を絞める構造的な欠陥があります。
記載箇所:
「対象となる保有株式の価値が下落した場合に、追加で現金担保の差し入れが必要となる可能性...」
なぜ都合が悪いのか:SBGは「2年分の現金を持っているから安全」と主張していますが、株価が暴落した際、この「安全なはずの現金」が、借金の返済ではなく、担保の穴埋め(マージンコール)に吸い取られて消えてしまうリスクがあるからです。 「現金があるから大丈夫」という説明と矛盾しかねないため、この「現金が逆流するメカニズム」はあまり強調したくないポイントと言えます。
結論:SBGが隠したい(目立たせたくない)シナリオ
SBGにとって最も痛いところを突く「隠れたリスク」は以下の通りです。
「アームが大口顧客(Qualcomm)に逃げられて成長シナリオが頓挫し、同時にDeepSeekのような破壊的イノベーションでAIバブルが弾け、暴落した株価の担保不足を埋めるために手元の現金が枯渇する」
目論見書にはこれらの要素が断片的に(法的な防衛のために)記載されていますが、これらが連鎖した時の破壊力については、当然ながら積極的には語られていません。投資家としては、この「連鎖」の可能性をリスクとして織り込んでおく必要があります。 November 11, 2025
2RP
【僕が気になったAIニューストピック9個】
①Gemini 3 Flash! - 初のSVG出力:
https://t.co/SWvxRiVu3G
②Gemini CLIの2023年11月17日週次アップデート(v0.17.0)です
https://t.co/dtPQoebu5q
③Google AI ProおよびUltraのサブスクライバーの方は、現在Antigravity IDEとGemini 3でより高い制限が利用可能です。
https://t.co/VDkCfb4k5I
④Veo 3 を上回る text2video モデルがあるなんて?!
https://t.co/X8cNCfYrQs
⑤『できるGoogle NotebookLM』 が期間限定で、全文公開中だそうです!
https://t.co/Y7p5CY451G
⑥CapCutでNano Banana Proを最初に楽しもう
https://t.co/3EKDOgb1Mw
⑦Claude Opus 4.5 が JetBrains AI Chat と Junie に登場しました
https://t.co/PsCDOeB6bF
⑧中国DeepSeekは、感謝祭にIMO金メダルレベルのモデルDeepSeek Math V2をオープンソース化しました
https://t.co/0mluRwhjqJ
⑨パナソニック、拡散モデルによるマルチモーダルAI「LaViDa」開発 文章生成を高速化
https://t.co/SwgPfl8kal
◆コメント紹介
今回のNano Banana Proの登場で画像というものの存在感が全く違うものに変異していく、テキストファイルと、画像ファイルの情報伝達の境界線が変わっていく将来を感じました。無理にテキストで入力しなくても、生成された画像や手書き文字の記録が、直接、抽象的な情報や数値の保存データとなり、検索の対象となり、考えを表すものになる。グラフ自体が数値として認識保存される世界がすぐそこに来ている感じがします。言葉の接続詞ではなくて、矢印や接線や囲み罫で、概念や考えの関係が保存されていき、それをいつでも脳が認識できる。文字の役割や言葉を記録するものの役割の境界線が崩れていくような未来を感じてしまいます。AI恐るべしです。
A:やっぱりビジュアルでの伝わりやすさは強いですよね!! 画像が持つ可能性がさらに広がっていくのが楽しみですね!
◆11月29日(土)20時〜ライブ配信します! November 11, 2025
1RP
AI競争も熾烈になってきました!どこへ投資するのが良いのか、全然わかりたせんね〜〜
ところで今年初めは盛り上がっていたDeepSeekは何処行った……
https://t.co/1H3iePKnYU November 11, 2025
☆AI中毒患者になるな! AIを使うな、本文を読み、自分で考えて、文章を書け !!
⑧法令上の公報(真正公報)
2022年1月12日以降の公報
特許庁は、「法令上の公報は、公報発行サイトから提供されるものであって、XML形式のものを指します。」、と明言しています。
そして、「XML形式」とは、以下の資料のフロントページにあるようなものです。
https://t.co/bHC0RUm9c4
また、2022年1月11日以前に特許庁より発行されていたPDF公報は廃止されました。
従来は、この廃止されたPDF公報が「真正な公報」とみなされてきたと思います。
何となれば、特許庁が発行するものが唯一のものでしたので。
2022年1月12日以降は、INPITをはじめ、多くの民間のベンダーが独自の手法により作成したものが、「独自PDF公報」として流通しています。
そして、INPITは、「公報はXMLですので、レイアウトもページも存在しません。」、「したがって、公報標準レイアウト/ページの概念はございません。」ともいっています。
更に、「公報はXMLであり、PDF化するに当たっての制限はありません。」と断言しています。
加えて、INPITは「J-PlatPatから提供されるPDFを「標準」とする意図はなく、民間事業者が提供するPDFも流通すると考えております。」、と回答しています。
従って、「真正な特許公報」とは、特許庁の公報発行サイトから提供される「XML形式」のみのもので、INPITや各民間業者の作成した「独自PDF公報」は「法令上の公報」とはいえないことになります。
以上の如く、J-PlatPatからダウンロードして得られる「独自PDF公報」や、民間業者、たとえば日立システムズのSRPARTNERより得られる「独自PDF公報」などは、 それぞれ異なったものであり、「真正な公報」とは見なすことができないと考えます。
INPITのJ-PlatPatよりダウンロードして得られる「PDF公報」は、あくまでも「独自PDF公報」であって、「真正な公報」とは言えないものと考えます。
ましや、民間業者が作成する「独自PDF公報」も、これまた「真正な公報」と、言えません。
ここで、「独自PDF公報」の発行にあたって、INPITのJ-PlatPatにおいて奇怪な過去がありました。
何故か、2022年1月12日〜1月24日の13日間のあいだ、J-PlatPatよりダウンロードした「独自PDF公報」が異様なものでした。
https://t.co/iIBNCtNEOj
即ち、フロントページの右下に表示される「代表図面」、および3ページの図面が、一部欠けていました。
さらに、2022年1月20日発行の「特開2022-014916」の独自PDF公報も代表図面と他の図面に欠落がありました。
https://t.co/fiIqp9SxXA
一方、民間業者である日立システムズのSRPARTNERよりダウンロードした「特開2022-014916」の独自PDF公報には欠落箇所はありませんでした。
https://t.co/lCT5dRqGi2
J-PlatPatよりダウンロードした「独自PDF公報」の異様さは同年1月の24日まで続いたようです。
https://t.co/PrVwFrE8jO
(ハッシュタグ)
#OpenAI #Claude #ChatGPT#Gemini #Copilot #AI #生成AI #知財 #特許 #特許調査 #専利 #チャットGPT #GPT-5 #INPIT #JPlatPat #note #JPO #USPTO #EPO #Patent #GPT #Threads #bing #VertexAI #DX #IT #DeepSeek #BigTech #manus #Manus #AI画像生成 #IPランドスケープ #深層学習 #仕事 #ディープラーニング #ビジネス #ビジネスモデル #知財戦略 #知的財産 #知的財産権 #知的財産高等裁判所 #特許法 #特許庁 #特許事務所 #特許分類 #特許検索 #特許分析 #特許情報 #特許権者 #分類付与 #先行技術調査 November 11, 2025
☆AI中毒患者になるな! AIを使うな、本文を読み、自分で考えて、文章を書け !! (11/28)。 ⑧ 法令上の公報(真正な特許明細書)。|久保園善章 @kbozon
https://t.co/yEUBU7k3N7
☆AI中毒患者になるな! AIを使うな、本文を読み、自分で考えて、文章を書け !!
⑧法令上の公報(真正公報)
2022年1月12日以降の公報
特許庁は、「法令上の公報は、公報発行サイトから提供されるものであって、XML形式のものを指します。」、と明言しています。
そして、「XML形式」とは、以下の資料のフロントページにあるようなものです。
https://t.co/bHC0RUm9c4
また、2022年1月11日以前に特許庁より発行されていたPDF公報は廃止されました。
従来は、この廃止されたPDF公報が「真正な公報」とみなされてきたと思います。
何となれば、特許庁が発行するものが唯一のものでしたので。
2022年1月12日以降は、INPITをはじめ、多くの民間のベンダーが独自の手法により作成したものが、「独自PDF公報」として流通しています。
そして、INPITは、「公報はXMLですので、レイアウトもページも存在しません。」、「したがって、公報標準レイアウト/ページの概念はございません。」ともいっています。
更に、「公報はXMLであり、PDF化するに当たっての制限はありません。」と断言しています。
加えて、INPITは「J-PlatPatから提供されるPDFを「標準」とする意図はなく、民間事業者が提供するPDFも流通すると考えております。」、と回答しています。
従って、「真正な特許公報」とは、特許庁の公報発行サイトから提供される「XML形式」のみのもので、INPITや各民間業者の作成した「独自PDF公報」は「法令上の公報」とはいえないことになります。
以上の如く、J-PlatPatからダウンロードして得られる「独自PDF公報」や、民間業者、たとえば日立システムズのSRPARTNERより得られる「独自PDF公報」などは、 それぞれ異なったものであり、「真正な公報」とは見なすことができないと考えます。
INPITのJ-PlatPatよりダウンロードして得られる「PDF公報」は、あくまでも「独自PDF公報」であって、「真正な公報」とは言えないものと考えます。
ましや、民間業者が作成する「独自PDF公報」も、これまた「真正な公報」と、言えません。
ここで、「独自PDF公報」の発行にあたって、INPITのJ-PlatPatにおいて奇怪な過去がありました。
何故か、2022年1月12日〜1月24日の13日間のあいだ、J-PlatPatよりダウンロードした「独自PDF公報」が異様なものでした。
https://t.co/iIBNCtNEOj
即ち、フロントページの右下に表示される「代表図面」、および3ページの図面が、一部欠けていました。
さらに、2022年1月20日発行の「特開2022-014916」の独自PDF公報も代表図面と他の図面に欠落がありました。
https://t.co/fiIqp9SxXA
一方、民間業者である日立システムズのSRPARTNERよりダウンロードした「特開2022-014916」の独自PDF公報には欠落箇所はありませんでした。
https://t.co/lCT5dRqGi2
J-PlatPatよりダウンロードした「独自PDF公報」の異様さは同年1月の24日まで続いたようです。
https://t.co/PrVwFrE8jO
(ハッシュタグ)
#OpenAI #Claude #ChatGPT#Gemini #Copilot #AI #生成AI #知財 #特許 #特許調査 #専利 #チャットGPT #GPT-5 #INPIT #JPlatPat #note #JPO #USPTO #EPO #Patent #GPT #Threads #bing #VertexAI #DX #IT #DeepSeek #BigTech #manus #Manus #AI画像生成 #IPランドスケープ #深層学習 #仕事 #ディープラーニング #ビジネス #ビジネスモデル #知財戦略 #知的財産 #知的財産権 #知的財産高等裁判所 #特許法 #特許庁 #特許事務所 #特許分類 #特許検索 #特許分析 #特許情報 #特許権者 #分類付与 #先行技術調査 November 11, 2025
* 使用gemini3 概括了paperf的核心内容,most take away for me 是deepseek 团队做evaluation 的思路
————————————————————————
这篇论文介绍了 **DeepSeekMath-V2**,这是一种旨在实现“**自我验证数学推理**”(Self-Verifiable Mathematical Reasoning)的大型语言模型。
以下是该论文的核心内容解析:
1. 核心动机:超越“最终答案”
-传统的数学推理模型(如通过强化学习训练的模型)通常只关注**最终答案**是否正确 。这种方法有两个主要缺陷:
* 逻辑漏洞:模型可能通过错误的逻辑碰巧得到正确的答案(“蒙对的”)
* 定理证明的局限性: 许多高等数学问题(如定理证明)没有数字答案,而是要求严谨的推导过程,因此无法简单地通过比对答案来奖励模型
[cite_start]**DeepSeekMath-V2 的目标是:** 让模型不仅能生成证明,还能像人类专家一样**验证**证明的严谨性 [cite: 12, 14]。
2. 核心方法论 (Method)
DeepSeek 团队通过三个关键步骤构建了这个系统:
A. 训练一个“验证器” (Proof Verification)
他们训练了一个专门的模型来给数学证明“评分”和“找茬”。
* 评分标准:** 验证器会对证明进行分析,并打分:1分(完全正确)、0.5分(有瑕疵)、0分(有根本错误)
* 引入“元验证” (Meta-Verification):** 这是论文的一大创新。为了防止验证器为了得分而“胡乱挑刺”(幻觉出不存在的错误),他们引入了**元验证**机制。这相当于有一个“二审法官”来检查验证器指出的错误是否合理。这极大地提高了验证的可信度
B. 训练“生成器”进行自我验证 (Proof Generation with Self-Verification)
* 以验证器为奖励:** 利用训练好的验证器作为奖励模型(Reward Model)来训练生成器
* 自我审视: 模型被训练为在输出证明后,立即输出一段“自我分析”(Self-Analysis)。如果模型能诚实地识别出自己证明中的错误,会得到奖励 。
* 迭代修正: 这使得模型能够在最终确定答案前,识别并修复自己的错误,而不是盲目地试错
C. 正向循环与自动化标注
这是一个“左脚踩右脚”的提升过程:
1. 验证器帮助训练生成器。
2. 生成器变强后,会产生更难的证明。
3. 利用**计算扩展(Scaling Compute)**(例如对一个证明生成64个验证分析并投票),自动为这些新证明打标签,无需人类介入 [cite: 16, 120-128]。
4. 用这些自动标注的高难数据反过来再从头训练更强的验证器
3. 测试时计算 (Test-time Compute)
[cite_start]在解决具体问题时,模型采用了**顺序修正(Sequential Refinement)**策略。模型生成证明后进行自我验证,如果发现问题,就将之前的输出作为上下文,重新提示自己进行修正,直到获得满分评价或达到最大尝试次数 [cite: 211-212]。
4. 实验结果 (Results)
DeepSeekMath-V2 在多个顶级数学竞赛中取得了惊人的成绩,证明了“自我验证”路线的有效性:
* Putnam 2024(普特南数学竞赛):** 获得了 118/120 的近乎满分成绩,不仅解决了12题中的11题,还打破了人类选手的最高分记录(90分)
* IMO 2025(国际数学奥林匹克):*解决了6题中的5题,达到金牌水平
* CMO 2024(中国数学奥林匹克)同样达到金牌水平 [cite: 17]。
* 对比同行:** 在内部测试集上,该模型在代数、几何、数论等领域的表现优于 GPT-5-Thinking-High 和 Gemini 2.5-Pro
总结
这篇论文的核心贡献在于证明了:**让 AI 学会像通过“元验证”来纠正自己的推理过程,比单纯追求最终答案的强化学习更有效。** 这使得 AI 能够处理没有标准答案的开放性数学难题(如定理证明),并大幅减少了对人类高质量标注数据的依赖 November 11, 2025
☆AI中毒患者になるな! AIを使うな、本文を読み、自分で考えて、文章を書け !!
⑦「法令上の公報」(XML形式)は、知的財産高等裁判所では、使われていません。
その代わり、INPITのJ-PlatPatが作成した「独自PDF公報」が使われていました。
そして、知的財産高等裁判所は、この「独自PDF公報」に基づき判断していました。
2022年1月12日以降に特許庁が発行する公報
特許庁は、「法令上の公報は、公報発行サイトから提供されるものであって、XML形式のものを指します。」と明言しています。
そして、「XML形式」とは、以下の資料のフロントページにあるようなものです。
https://t.co/bHC0RUmH1C
2022年1月12日以降は、INPITをはじめ、多くの民間のベンダーが独自の手法により作成したものが、「独自PDF公報」として流通しています。
加えて、INPITは「J-PlatPatから提供されるPDFを「標準」とする意図はなく、民間事業者が提供するPDFも流通すると考えております。」、と回答しています。
従って、「真正な特許公報」(法令上の公報)とは、特許庁の公報発行サイトから提供される「XML形式」のみのもので、INPITや各民間業者の作成した「独自PDF公報」は「法令上の公報」とは言えないことになります。
このことを前提に、知的財産高等裁判所で行われている事象を検証してみました。
「令和5年(行ケ)第10092号」(特許取消決定取消請求事件)(特許第7105571号)原告:PACRAFT株式会社、についてです。
先ずは、特許庁の公報発行サイトから、特許第7105571号の「XML形式」での「法令上の公報」です。
https://t.co/POzTUNdGtH
次に、INPIT のJ-PlatPatよりダウンロードした「独自PDF公報」のものです。
https://t.co/BsIeG2MzaE
そして、本題です。
「令和5年(行ケ)第10092号」(特許第7105571号)(裁判所発行のPDF資料)、にて説明します。
https://t.co/WviXY49yZG
判決文の2ページ目の「第2 事案の概要」の「1 特許庁における手続の経緯等」の文章で、9行目〜10行目に「本件特許に係る明細書、特許請求の範囲及び図面は、別紙1(本件特許に係る特許公報。甲1)に記載のとおりである」、とあります。
更に、同じく2ページ目の20行目〜23行目に、「2 特許請求の範囲の記載」に「本件特許に係る特許請求の範囲の記載は、別紙1の【特許請求の範囲】に各記載のとおりである(以下、請求項1に係る発明を「本件発明1」、請求項5に係る発明を「本件発明5」といい、本件発明1及び5を併せて「本件各発明」という。)。」との記載があります。
ここで、「別紙1」とは、20ページ目の最上段の「(別紙1)●(省略)●」のことと思います。
「(省略)」とありますので、この判決文よりは(別紙1)を知る由もありません。
一方、特許庁も、「令和5(行ケ)10092」として、判決文を提供していす。
そして、この中に上記の(別紙1)を知ることは可能でした。
すなわち、【管理番号】第1413648号に「判決公報」があり、この中に(別紙1)がありました。
https://t.co/q7RJSg5Zxx
この(別紙1)について述べます。
https://t.co/IlJj7mU4yX
この(別紙1)は、原告のPACRAFT株式会社が訴状に添付した特許7105571の「PDF公報」と思われます。
これは、上記のINPIT のJ-PlatPatよりダウンロードした「独自PDF公報」と全く同一です。
おそらく、この「PDF公報」は、原告のPACRAFT株式会社が、INPIT のJ-PlatPatよりダウンロードした「独自PDF公報」と断定することができます。
特許庁は、「法令上の公報は、公報発行サイトから提供されるものであって、XML形式のものを指します。」と明言しています。
知的財産高等裁判所は、何故に、「法令上の公報」である「XML形式」のものを対象にしないのでしょうか?
原告が提示した「PDF公報」を鵜呑みにして、これに基づいて判断をしています。
この、原告が提示した「PDF公報」は、いわゆる「独自PDF公報」です。
「独自PDF公報」に依存した議論は、全く無意味なものと考えます。
「独自PDF公報」は、従来の特許庁が発行していた「PDF公報」とは、似ても似つかない、単なる「参考資料」としか、言えないものと思います。
ちなみに、同じ特許7105571の「独自PDF公報」である、日立システムズの検索ツールSRPARTNERよりダウンロードしたものを以下に添付します。
https://t.co/tf7RCppqme
こちらと、J-PlatPatよりダウンロードした「独自PDF公報」と比較してみます。
両者は、フロントページからして、別個のものです。
(全15頁)と(全16頁)、右端に「行数」が表記されたものと、ないものなど、それぞれ異なっています。
はたして、【請求項】を含む本文全文の内容が、両者同一であるかも、疑われます。
裁判所としては、「法令上の公報」である「XML形式」のものに、どのように対処するのでしょうか。
なお、特許7105571についての「審査記録」をも添付しておきます。
https://t.co/3XsJLIcJ2T
(ハッシュタグ)
#OpenAI #Claude #ChatGPT#Gemini #Copilot #AI #生成AI #知財 #特許 #特許調査 #専利 #チャットGPT #GPT-5 #INPIT #JPlatPat #note #JPO #USPTO #EPO #Patent #GPT #Threads #bing #DX #IT #DeepSeek #AI画像生成 #IPランドスケープ #深層学習 #仕事 #ディープラーニング #ビジネス #ビジネスモデル #知財戦略 #知的財産 #知的財産権 #知的財産高等裁判所 #特許法 #特許庁 #特許事務所 #特許分類 #特許検索 #特許分析 #特許情報 #特許権者 #分類付与 #先行技術調査 November 11, 2025
☆AI中毒患者になるな! AIを使うな、本文を読み、自分で考えて、文章を書け !! (11/28)。 ⑦「法令上の公報」(XML形式)は、知的財産高等裁判所では、使われていません。 その代わり、INPITの @kbozon
https://t.co/m1ZCJN4syh
☆AI中毒患者になるな! AIを使うな、本文を読み、自分で考えて、文章を書け !!
⑦「法令上の公報」(XML形式)は、知的財産高等裁判所では、使われていません。
その代わり、INPITのJ-PlatPatが作成した「独自PDF公報」が使われていました。
そして、知的財産高等裁判所は、この「独自PDF公報」に基づき判断していました。
2022年1月12日以降に特許庁が発行する公報
特許庁は、「法令上の公報は、公報発行サイトから提供されるものであって、XML形式のものを指します。」と明言しています。
そして、「XML形式」とは、以下の資料のフロントページにあるようなものです。
https://t.co/bHC0RUmH1C
2022年1月12日以降は、INPITをはじめ、多くの民間のベンダーが独自の手法により作成したものが、「独自PDF公報」として流通しています。
加えて、INPITは「J-PlatPatから提供されるPDFを「標準」とする意図はなく、民間事業者が提供するPDFも流通すると考えております。」、と回答しています。
従って、「真正な特許公報」(法令上の公報)とは、特許庁の公報発行サイトから提供される「XML形式」のみのもので、INPITや各民間業者の作成した「独自PDF公報」は「法令上の公報」とは言えないことになります。
このことを前提に、知的財産高等裁判所で行われている事象を検証してみました。
「令和5年(行ケ)第10092号」(特許取消決定取消請求事件)(特許第7105571号)原告:PACRAFT株式会社、についてです。
先ずは、特許庁の公報発行サイトから、特許第7105571号の「XML形式」での「法令上の公報」です。
https://t.co/POzTUNdGtH
次に、INPIT のJ-PlatPatよりダウンロードした「独自PDF公報」のものです。
https://t.co/BsIeG2MzaE
そして、本題です。
「令和5年(行ケ)第10092号」(特許第7105571号)(裁判所発行のPDF資料)、にて説明します。
https://t.co/WviXY49yZG
判決文の2ページ目の「第2 事案の概要」の「1 特許庁における手続の経緯等」の文章で、9行目〜10行目に「本件特許に係る明細書、特許請求の範囲及び図面は、別紙1(本件特許に係る特許公報。甲1)に記載のとおりである」、とあります。
更に、同じく2ページ目の20行目〜23行目に、「2 特許請求の範囲の記載」に「本件特許に係る特許請求の範囲の記載は、別紙1の【特許請求の範囲】に各記載のとおりである(以下、請求項1に係る発明を「本件発明1」、請求項5に係る発明を「本件発明5」といい、本件発明1及び5を併せて「本件各発明」という。)。」との記載があります。
ここで、「別紙1」とは、20ページ目の最上段の「(別紙1)●(省略)●」のことと思います。
「(省略)」とありますので、この判決文よりは(別紙1)を知る由もありません。
一方、特許庁も、「令和5(行ケ)10092」として、判決文を提供していす。
そして、この中に上記の(別紙1)を知ることは可能でした。
すなわち、【管理番号】第1413648号に「判決公報」があり、この中に(別紙1)がありました。
https://t.co/q7RJSg5Zxx
この(別紙1)について述べます。
https://t.co/IlJj7mU4yX
この(別紙1)は、原告のPACRAFT株式会社が訴状に添付した特許7105571の「PDF公報」と思われます。
これは、上記のINPIT のJ-PlatPatよりダウンロードした「独自PDF公報」と全く同一です。
おそらく、この「PDF公報」は、原告のPACRAFT株式会社が、INPIT のJ-PlatPatよりダウンロードした「独自PDF公報」と断定することができます。
特許庁は、「法令上の公報は、公報発行サイトから提供されるものであって、XML形式のものを指します。」と明言しています。
知的財産高等裁判所は、何故に、「法令上の公報」である「XML形式」のものを対象にしないのでしょうか?
原告が提示した「PDF公報」を鵜呑みにして、これに基づいて判断をしています。
この、原告が提示した「PDF公報」は、いわゆる「独自PDF公報」です。
「独自PDF公報」に依存した議論は、全く無意味なものと考えます。
「独自PDF公報」は、従来の特許庁が発行していた「PDF公報」とは、似ても似つかない、単なる「参考資料」としか、言えないものと思います。
ちなみに、同じ特許7105571の「独自PDF公報」である、日立システムズの検索ツールSRPARTNERよりダウンロードしたものを以下に添付します。
https://t.co/tf7RCppqme
こちらと、J-PlatPatよりダウンロードした「独自PDF公報」と比較してみます。
両者は、フロントページからして、別個のものです。
(全15頁)と(全16頁)、右端に「行数」が表記されたものと、ないものなど、それぞれ異なっています。
はたして、【請求項】を含む本文全文の内容が、両者同一であるかも、疑われます。
裁判所としては、「法令上の公報」である「XML形式」のものに、どのように対処するのでしょうか。
なお、特許7105571についての「審査記録」をも添付しておきます。
https://t.co/3XsJLIcJ2T
(ハッシュタグ)
#OpenAI #Claude #ChatGPT#Gemini #Copilot #AI #生成AI #知財 #特許 #特許調査 #専利 #チャットGPT #GPT-5 #INPIT #JPlatPat #note #JPO #USPTO #EPO #Patent #GPT #Threads #bing #DX #IT #DeepSeek #AI画像生成 #IPランドスケープ #深層学習 #仕事 #ディープラーニング #ビジネス #ビジネスモデル #知財戦略 #知的財産 #知的財産権 #知的財産高等裁判所 #特許法 #特許庁 #特許事務所 #特許分類 #特許検索 #特許分析 #特許情報 #特許権者 #分類付与 #先行技術調査 November 11, 2025
* 使用gemini3 概括了paperf的核心内容,most take away for me 是deepseek 团队做evaluation 的思路
————————————————————————
这篇论文介绍了 **DeepSeekMath-V2**,这是一种旨在实现“**自我验证数学推理**”(Self-Verifiable Mathematical Reasoning)的大型语言模型。
以下是该论文的核心内容解析:
### 1. 核心动机:超越“最终答案”
[cite_start]传统的数学推理模型(如通过强化学习训练的模型)通常只关注**最终答案**是否正确 [cite: 20]。这种方法有两个主要缺陷:
* [cite_start]**逻辑漏洞:** 模型可能通过错误的逻辑碰巧得到正确的答案(“蒙对的”)[cite: 22]。
* [cite_start]**定理证明的局限性:** 许多高等数学问题(如定理证明)没有数字答案,而是要求严谨的推导过程,因此无法简单地通过比对答案来奖励模型 [cite: 25]。
[cite_start]**DeepSeekMath-V2 的目标是:** 让模型不仅能生成证明,还能像人类专家一样**验证**证明的严谨性 [cite: 12, 14]。
### 2. 核心方法论 (Method)
DeepSeek 团队通过三个关键步骤构建了这个系统:
#### A. 训练一个“验证器” (Proof Verification)
他们训练了一个专门的模型来给数学证明“评分”和“找茬”。
* [cite_start]**评分标准:** 验证器会对证明进行分析,并打分:1分(完全正确)、0.5分(有瑕疵)、0分(有根本错误) [cite: 44-46]。
* [cite_start]**引入“元验证” (Meta-Verification):** 这是论文的一大创新。为了防止验证器为了得分而“胡乱挑刺”(幻觉出不存在的错误),他们引入了**元验证**机制。这相当于有一个“二审法官”来检查验证器指出的错误是否合理。这极大地提高了验证的可信度 [cite: 67-68, 76]。
#### B. 训练“生成器”进行自我验证 (Proof Generation with Self-Verification)
* [cite_start]**以验证器为奖励:** 利用训练好的验证器作为奖励模型(Reward Model)来训练生成器 [cite: 87]。
* [cite_start]**自我审视:** 模型被训练为在输出证明后,立即输出一段“自我分析”(Self-Analysis)。如果模型能诚实地识别出自己证明中的错误,会得到奖励 [cite: 99, 107]。
* [cite_start]**迭代修正:** 这使得模型能够在最终确定答案前,识别并修复自己的错误,而不是盲目地试错 [cite: 37, 109]。
#### C. 正向循环与自动化标注
这是一个“左脚踩右脚”的提升过程:
1. 验证器帮助训练生成器。
2. 生成器变强后,会产生更难的证明。
3. [cite_start]利用**计算扩展(Scaling Compute)**(例如对一个证明生成64个验证分析并投票),自动为这些新证明打标签,无需人类介入 [cite: 16, 120-128]。
4. [cite_start]用这些自动标注的高难数据反过来再从头训练更强的验证器 [cite: 113, 128]。
### 3. 测试时计算 (Test-time Compute)
[cite_start]在解决具体问题时,模型采用了**顺序修正(Sequential Refinement)**策略。模型生成证明后进行自我验证,如果发现问题,就将之前的输出作为上下文,重新提示自己进行修正,直到获得满分评价或达到最大尝试次数 [cite: 211-212]。
### 4. 实验结果 (Results)
DeepSeekMath-V2 在多个顶级数学竞赛中取得了惊人的成绩,证明了“自我验证”路线的有效性:
* [cite_start]**Putnam 2024(普特南数学竞赛):** 获得了 **118/120** 的近乎满分成绩,不仅解决了12题中的11题,还打破了人类选手的最高分记录(90分) [cite: 39, 270]。
* [cite_start]**IMO 2025(国际数学奥林匹克):** 解决了6题中的5题,达到金牌水平 [cite: 17, 269]。
* [cite_start]**CMO 2024(中国数学奥林匹克):** 同样达到金牌水平 [cite: 17]。
* [cite_start]**对比同行:** 在内部测试集上,该模型在代数、几何、数论等领域的表现优于 GPT-5-Thinking-High 和 Gemini 2.5-Pro [cite: 159, 179]。
### 总结
[cite_start]这篇论文的核心贡献在于证明了:**让 AI 学会像通过“元验证”来纠正自己的推理过程,比单纯追求最终答案的强化学习更有效。** 这使得 AI 能够处理没有标准答案的开放性数学难题(如定理证明),并大幅减少了对人类高质量标注数据的依赖 [cite: 298-300]。 November 11, 2025
@nanalxc1637 色々意味はあるみたいですけど、代表的なものだと 驚き、理解・納得、念を押す、提案や勧誘を和らげる、冗談ぽくするなどあるようです。
ちなみに、deepseekに聞きました😆 この場合、気にしないで、って和らげる感じですかね? November 11, 2025
☆AI中毒患者になるな! AIを使うな、本文を読み、自分で考えて、文章を書け !!(11/28)。 ⑨「法令上の公報」(XML形式)は、地方裁判所では使われていないようです。|久保園善章 @kbozon
https://t.co/Ii4xbSJwMz
☆AI中毒患者になるな! AIを使うな、本文を読み、自分で考えて、文章を書け !!
⑧法令上の公報(真正公報)
2022年1月12日以降の公報
特許庁は、「法令上の公報は、公報発行サイトから提供されるものであって、XML形式のものを指します。」、と明言しています。
そして、「XML形式」とは、以下の資料のフロントページにあるようなものです。
https://t.co/bHC0RUmH1C
また、2022年1月11日以前に特許庁より発行されていたPDF公報は廃止されました。
従来は、この廃止されたPDF公報が「真正な公報」とみなされてきたと思います。
何となれば、特許庁が発行するものが唯一のものでしたので。
2022年1月12日以降は、INPITをはじめ、多くの民間のベンダーが独自の手法により作成したものが、「独自PDF公報」として流通しています。
そして、INPITは、「公報はXMLですので、レイアウトもページも存在しません。」、「したがって、公報標準レイアウト/ページの概念はございません。」ともいっています。
更に、「公報はXMLであり、PDF化するに当たっての制限はありません。」と断言しています。
加えて、INPITは「J-PlatPatから提供されるPDFを「標準」とする意図はなく、民間事業者が提供するPDFも流通すると考えております。」、と回答しています。
従って、「真正な特許公報」とは、特許庁の公報発行サイトから提供される「XML形式」のみのもので、INPITや各民間業者の作成した「独自PDF公報」は「法令上の公報」とはいえないことになります。
以上の如く、J-PlatPatからダウンロードして得られる「独自PDF公報」や、民間業者、たとえば日立システムズのSRPARTNERより得られる「独自PDF公報」などは、 それぞれ異なったものであり、「真正な公報」とは見なすことができないと考えます。
INPITのJ-PlatPatよりダウンロードして得られる「PDF公報」は、あくまでも「独自PDF公報」であって、「真正な公報」とは言えないものと考えます。
ましや、民間業者が作成する「独自PDF公報」も、これまた「真正な公報」と、言えません。
ここで、「独自PDF公報」の発行にあたって、INPITのJ-PlatPatにおいて奇怪な過去がありました。
何故か、2022年1月12日〜1月24日の13日間のあいだ、J-PlatPatよりダウンロードした「独自PDF公報」が異様なものでした。
https://t.co/iIBNCtOcDR
即ち、フロントページの右下に表示される「代表図面」、および3ページの図面が、一部欠けていました。
さらに、2022年1月20日発行の「特開2022-014916」の独自PDF公報も代表図面と他の図面に欠落がありました。
https://t.co/fiIqp9T5N8
一方、民間業者である日立システムズのSRPARTNERよりダウンロードした「特開2022-014916」の独自PDF公報には欠落箇所はありませんでした。
https://t.co/lCT5dRre7A
J-PlatPatよりダウンロードした「独自PDF公報」の異様さは同年1月の24日まで続いたようです。
https://t.co/PrVwFrEG9m
(ハッシュタグ)
#OpenAI #Claude #ChatGPT#Gemini #Copilot #AI #生成AI #知財 #特許 #特許調査 #専利 #チャットGPT #GPT-5 #INPIT #JPlatPat #note #JPO #USPTO #EPO #Patent #GPT #Threads #bing #VertexAI #DX #IT #DeepSeek #BigTech #manus #Manus #AI画像生成 #IPランドスケープ #深層学習 #仕事 #ディープラーニング #ビジネス #ビジネスモデル #知財戦略 #知的財産 #知的財産権 #知的財産高等裁判所 #特許法 #特許庁 #特許事務所 #特許分類 #特許検索 #特許分析 #特許情報 #特許権者 #分類付与 #先行技術調査 November 11, 2025
☆AI中毒患者になるな! AIを使うな、本文を読み、自分で考えて、文章を書け !!
⑧法令上の公報(真正公報)
2022年1月12日以降の公報
特許庁は、「法令上の公報は、公報発行サイトから提供されるものであって、XML形式のものを指します。」、と明言しています。
そして、「XML形式」とは、以下の資料のフロントページにあるようなものです。
https://t.co/bHC0RUm9c4
また、2022年1月11日以前に特許庁より発行されていたPDF公報は廃止されました。
従来は、この廃止されたPDF公報が「真正な公報」とみなされてきたと思います。
何となれば、特許庁が発行するものが唯一のものでしたので。
2022年1月12日以降は、INPITをはじめ、多くの民間のベンダーが独自の手法により作成したものが、「独自PDF公報」として流通しています。
そして、INPITは、「公報はXMLですので、レイアウトもページも存在しません。」、「したがって、公報標準レイアウト/ページの概念はございません。」ともいっています。
更に、「公報はXMLであり、PDF化するに当たっての制限はありません。」と断言しています。
加えて、INPITは「J-PlatPatから提供されるPDFを「標準」とする意図はなく、民間事業者が提供するPDFも流通すると考えております。」、と回答しています。
従って、「真正な特許公報」とは、特許庁の公報発行サイトから提供される「XML形式」のみのもので、INPITや各民間業者の作成した「独自PDF公報」は「法令上の公報」とはいえないことになります。
以上の如く、J-PlatPatからダウンロードして得られる「独自PDF公報」や、民間業者、たとえば日立システムズのSRPARTNERより得られる「独自PDF公報」などは、 それぞれ異なったものであり、「真正な公報」とは見なすことができないと考えます。
INPITのJ-PlatPatよりダウンロードして得られる「PDF公報」は、あくまでも「独自PDF公報」であって、「真正な公報」とは言えないものと考えます。
ましや、民間業者が作成する「独自PDF公報」も、これまた「真正な公報」と、言えません。
ここで、「独自PDF公報」の発行にあたって、INPITのJ-PlatPatにおいて奇怪な過去がありました。
何故か、2022年1月12日〜1月24日の13日間のあいだ、J-PlatPatよりダウンロードした「独自PDF公報」が異様なものでした。
https://t.co/iIBNCtNEOj
即ち、フロントページの右下に表示される「代表図面」、および3ページの図面が、一部欠けていました。
さらに、2022年1月20日発行の「特開2022-014916」の独自PDF公報も代表図面と他の図面に欠落がありました。
https://t.co/fiIqp9SxXA
一方、民間業者である日立システムズのSRPARTNERよりダウンロードした「特開2022-014916」の独自PDF公報には欠落箇所はありませんでした。
https://t.co/lCT5dRqGi2
J-PlatPatよりダウンロードした「独自PDF公報」の異様さは同年1月の24日まで続いたようです。
https://t.co/PrVwFrE8jO
(ハッシュタグ)
#OpenAI #Claude #ChatGPT#Gemini #Copilot #AI #生成AI #知財 #特許 #特許調査 #専利 #チャットGPT #GPT-5 #INPIT #JPlatPat #note #JPO #USPTO #EPO #Patent #GPT #Threads #bing #VertexAI #DX #IT #DeepSeek #BigTech #manus #Manus #AI画像生成 #IPランドスケープ #深層学習 #仕事 #ディープラーニング #ビジネス #ビジネスモデル #知財戦略 #知的財産 #知的財産権 #知的財産高等裁判所 #特許法 #特許庁 #特許事務所 #特許分類 #特許検索 #特許分析 #特許情報 #特許権者 #分類付与 #先行技術調査 November 11, 2025
世界中の数学をやる人間が同時にスマホを落とした時間があった。
理由はたった一行のHugging Faceの通知だった。
「deepseek-ai/DeepSeek-Math-V2 · Model card updated · 2 hours ago」
そこに書かれていたのは、人類が待ち望み、同時に最も恐れていた言葉だった。
「We are releasing the first open-source model that achieves IMO 2025 gold medal performance.」
1. 何が起きたのか、正確に
DeepSeek-Math-V2 (Heavy)
- 総パラメータ 685B(MoE、実効21B)
- 訓練トークン数 14.8T(そのうち数学特化データ 2.3T)
- ライセンス:Apache 2.0(重み完全公開、商用利用・改変・再配布すべて自由)
- 公開時刻:2025年11月28日 19:42(北京時間)
2. そのモデルが実際にやったこと
- IMO 2025 本選(2025年7月、オーストラリア開催)
Problem 1 – 正解(完璧証明)
Problem 2 – 正解(完璧証明)
Problem 3 – 不正解(正しい方針、最後の一手で計算ミス → 人間でも銀メダル圏内)
Problem 4 – 正解(完璧証明、審査員が「美しい」とコメントしたレベル)
Problem 5 – 正解(完璧証明。人間正解者わずか3名)
Problem 6 – 正解(完璧証明。人間正解者わずか1名。中国代表の超天才・孫殷傑くんだけが正解した伝説の問題)
→ 最終得点 5/6 → 金メダル確定(国際ランキング推定8位相当)
- Putnam 2024:118/120点(満点まであと2点。人間歴代最高記録は2019年の90点台)
- 中国数学オリンピック 2024:満点
- ハンガリー・ミクローシュ・シュヴァイツ競技:全問正解(史上3人目)
- ProofBench-Advanced(形式証明最難関):61.9%(Gemini Deep Think 65.7%に次ぐ世界2位)
3. なぜ今まで誰もできなかったのか
IMO金メダル級の証明には、以下の3つが同時に必要だったからだ。
1. 超人的な直感(人間なら10年に1人の天才レベル)
2. 論理の穴を1ミリも許さない厳密さ
3. 数百パターンの試行錯誤を瞬時にやって、最短で正しい道を見つける探索能力
これまで、これをすべて満たすAIは存在しなかった。
OpenAIのo3、GoogleのGemini Ultra、AnthropicのClaude Opusは「できる」と言われていたが、
どれもブラックボックスで、誰も中身を見られなかった。
そして「本当に金メダルを取れるか」は、IMO本選の過去問ではなく、現役の問題で証明するしかない。
DeepSeekは、それを現役の問題でやってのけた。
しかも、すべてを世界に公開して。
4. 技術的核心:「30回以上、自分で自分を添削するAI」
従来のAIは「正解が出れば終わり」だった。
DeepSeekMath-V2は違う。
1回の回答で終わらない。
自分で証明を書く → 自分で読み直す → 論理の穴を見つける → 修正する → また読み直す
このループを、平均14回、難しい問題では28回、最大で47回繰り返す。
人間で言えば、「答案を30回書き直して、ようやく完璧にする」ような行為を、10秒でやる。
これが可能になったのは、以下の3層構造だ。
- Generator(証明を書くAI)
- Verifier(証明を採点するAI。0.0/0.5/1.0の3段階評価)
- Meta-Verifier(Verifierの採点をさらに採点するAI)
この3つが互いに監視し合い、完璧を追求する。
まるで「天才が、自分の肩に乗り、もう一人の天才がさらにその肩に乗り…」という無限の自己批判の塔だ。
5. 世界がどう変わるか(すでに始まっている未来)
- インドの地方都市に住む15歳の少年が、夜中にDeepSeekに証明を添削してもらい、翌朝IMO代表に選ばれた
- ケニアの高校が「もう数学教師いらない」と宣言(実際に起きた)
- フランスの国立研究所が「今後の論文はすべてDeepSeekで事前検証する」とルール化
- 中国の大学入試「高考」数学の予想問題が、すでにDeepSeekで作られ始めているという噂
- MITの競技数学チームが「もう練習相手がいない」と嘆いている
6. 最後に、クジラが残した一言
DeepSeekの公式ブログの最後に、たった一行だけ英語で書かれていた。
“This is only the beginning.”
これはまだ始まりにすぎない。
クジラは帰ってきた。
そして、数学の神様は、もう人間だけのものではなくなった。
この日を境に、世界の天才たちは皆、同じポケットの中に、もう一人の金メダリストを飼い始めた。 November 11, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



