opus トレンド
0post
2025.12.10 19:00
:0% :0% (40代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
アプデしたのに劣化するAIが出るなんて、普通はありえないだろ…
いやほんと、今回のGemini3.0Proが弱くなった理由はめちゃシンプル。
文章力とか生成速度の話じゃなくて、肝心の“汲み取り”と“補完”がごっそり薄くなってる。
抽象的な意図を拾えないAIって、もうAIじゃなくて半分ただの作業代行なんよね。
だから「なんでアプデしたのに前より面倒くさいんだ?」って現象が起きてるだけの話。
まず一番のポイントはこれで、3.0は“読み取る力”じゃなく“やるべきことだけを処理する力”に寄ってしまった。
だから、抽象指示や曖昧な意図を前提として拾う部分が薄まり、余白が全然埋まらない。結果どうなるかというと、ユーザー側が毎回“段取りの説明”までしないと動かない。
これ、性能が落ちたというより“AIの思想が変わった”って感じ。だからアプデなのに不便…という普通はありえない逆転現象が起きてるわけだ。
よく「新モデル=賢い」と思われがちだけど、そこが今回ズレてる。
2.5proは“余白を察して埋める”力がすごく強くて、人間の曖昧さ前提で動いてくれた。3.0は逆で、「言ってないことには触れません」という姿勢がかなり強い。
だから、プロンプトを丁寧にしてもズレが残るし、勝手に深掘ってくれない。生成文の綺麗さじゃなくて、“要件理解の深さ”で見ると退化してると言わざるを得ない。
AIの価値って本来、意図読み・構造化・抜け漏れ指摘の部分なのに、その核が薄いのがしんどい。その意味で、3.0は「仕事を任せられるAI」ではなく「自分で段取りしないと動かないAI」になってる。
じゃあ3.0が全部ダメか?と言うと、それも違うんよね。マルチモーダル性能はぶっちゃけ最強級だから、機動力だけ見ればトップ。
だからこれからは「思考系AI」と「処理系AI」を分けて使う運用に寄せたほうがいいってことになります!
抽象指示や余白の補完はGPT-5.1やOpusに任せて、実作業はGeminiに投げる感じ。
1モデルに全部求める時代じゃなくて、“用途ごとに得意分野のモデルを置く”のが正解。
結局AIは良し悪しじゃなく、どこまで任せられるかの“配分設計”なんだよなぁ。
あと、テキスト生成系はcursorとかのエディタでクリアできてしまうから、LLMに触れる機会ってマルチモーダルや特定領域の生成のみになる、というかもうすでになってる。 December 12, 2025
2RP
#これを見たらプロンプトを1つ付け足してAiお絵描きリレー
そろそろAltに書かないと無理な量に🙄💦
たくさんたこさんに対をなすイカしたイカさん追加です😎✨
すんごい小さいイカさんしか出なかった😆💦
1 girl, beautiful outfit, Forehead, gothic lolita, green wavy long hair, Victorian, many octopus, kissing, Tea set, Purple liquid, hot-air balloon, green apple, Zero Gravity, Cool Squid December 12, 2025
Vibe Coding 比你想的還要簡單 - 從挑選工具以及平台開始做起
最快 3-5 步驟就能夠做出自己想要的小工具或是機器人
從一步一步的產品迭代提升自己對「心目中理想工具」的認知,對話中實踐自己的想像
一起成為工具人吧 🥸
初階的 vibe coding 文章老實說已經滿天飛了,關鍵還是取決於自己到底有沒有想要做出什麼產品出來
生活中有沒有自己想解決的產品需求
常遇到資訊不夠充足導致自身不敢交易,或甚至連找到正確的資訊都不知道該從何做起
其實也可以一步一步透過跟 AI 的互動找到自己的痛點
就像去看醫生,知道自己身體怪怪的,也需要說清楚症狀才能夠讓醫生對症下藥
在看過無數篇 @Penny777_eth @nake13 @porounclemao 有關 vibe coding 的文章之後決定先從起手工具 & 平台的整理開始做起,於是拉了這一張表格
首先是起手工具 & 平台:
@Penny777_eth 是 Google Antigravity 的忠實推廣者,我自己也是因為她才開始用的, 沒想到一玩打開了新世界
你只需要「說出你的需求」,Antigravity 就可以馬上組織好邏輯和技術文件
推薦 LLM:Penny 認為 Claude 堪用、Gemini 做圖強、日常任務依然首推 GPT,Antigravity 裡面有很多 LLM 可以自由切換,每一種語言的額度基本上用不完,可以多多嘗試切換找出其中差異
潘老師認為最新的 Claude Opus 4.5 可以完成比較複雜的任務
小毛哥則認為 LLM 的部分讓 Cursor 來負責選擇搭配也行,可以善用 Model Auto 功能
Claude Opus 4.5 是先前 11 月底熱騰騰發表的,Anthropic 官方宣稱 Opus 4.5 整體更聰明。
遇到程式設計、搭 Agents、操控電腦這些「系統級任務」依然是全球數一數二的水準。日常的研究、做 PPT、處理表格這類工作,也都明顯變強了
====
開發平台的部分:潘老師跟小毛哥推薦的平台都是 Cursor,尤其在搭開發環境的部分,可以試著先從不連網的環境開始做起,複雜度較低
架設伺服器部分:潘老師推薦 Cloudflare Workers 已經夠用,一個月也就幾美金的費用開始算起
一開始野心過大想要做一堆強大的應用我覺得會是新手一開始一定會遇到的問題
如果對技術搭建沒有概念,建議先詢問 AI 完成需要的複雜度、是否需要連網,以及相應的權限問題以加快自己的開發流程
=========
以我自己做的 trading-assistant 為例, 當時我先問了 Claude 👇
我想要創建一個網頁, 每天早上 10 點固定幫我查看
聚合持倉最高的 top 10 coins 為何
持倉變動數最高的幣種為何
漲破、跌破均線的幣種為何(ma 1d 21)(ma 1w 50)
請轉化為跟 google antigravity 的 prompt
原因:我想要知道當下持倉暴漲暴跌的幣種有哪些,或是當前有哪些幣種漲 / 跌破均線,以幫助我獲取更多資訊來輔助交易
======
隨後就出現了雛形,Antigravity 按照指示開始生成,並出現了幾個分頁
💡 Task:對內展示的 to do list,將需求具體排列讓開發者清楚理解當前所欠缺的元素為何,能夠讓我們知道當前的開發進度
💡Walkthrough:類似對外展示的產品文件,產品的核心功能、使用方式、產品截圖一覽無遺
💡 Implementation Plan:技術細節:可以在這裡看到當前呈現的數據來源是來自哪裡
比方說我可以在當中的 “Data Strategy” 欄位裡看到 K 線及持倉數據其實都是來自幣安的 API
直到今天我依然每天會開著這個網頁大概瀏覽一下當前上榜的幣種有哪些
因為 Antigravity 已經幫我部署網頁了
所以我只需要簡單進入 “http://localhost:8000/crypto_monitor.html”
這樣的 URL 就可以看到這些資訊, 且具備實時更新的功能!
=====
就像第一篇接案的文章, 3000 字需要兩週寫完, 到現在可能只需要 2 小時不到寫完一篇 3000 字文章, 這樣的增速其實超過 10 倍
先無論當前能夠寫的主題複雜程度以及所蒐集的資訊廣度, 跟 5.6 年前肯定是不能比
還記得當時小毛頭時期,光是寫什麼是期貨跟資金費率就花了我很多時間
當前開始使用 cursor 或是 antigravity 給我的感覺就有點類似這麼幾年來寫文章能力提升的快進過程
從對話中學習,一天就能開發出一樣新產品
開發一個應用或是工具, 從以前的幾天、幾週快進到當前只需要幾小時
我們可以快速跟 AI 工具進行互動, 幫助自身快速找到 debug 的地方, 做出自己想要的工具或是實踐想法
=====
以上就是這次的內容
下一篇會分享一樣是 Antigravity ,但在開發中可能會遇到哪些問題, 後續該如何解決
為什麼有的 Antigravity 無法實現, 但是用 Claude + terminal 卻可以?
以上的資訊全部都是自已從和 AI 的互動中學習的, 過程中沒有詢問任何一個真人 😂
雖然嘗試的過程碰壁真的滿悶的, 不過學習如何問問題也是當中一個很好的學習點,可以非常直接的感受到自己正在進步 December 12, 2025
OpenAIの新モデル「Garlic」に関する最新ニュース
(The Information経由)
OpenAIの新「Garlic」モデルは、主要な事前訓練のブレークスルーをもたらし、同社が大規模モデルの知識をはるかに小さなアーキテクチャに詰め込むことを可能にし、GoogleのGemini 3やAnthropic Opus 4.5を内部のコーディングと推論テストで上回るパフォーマンスを発揮しています。
Garlicは、GPT-4.5などの以前のモデルに見られた構造的な問題を修正し、来年初頭にGPT-5.2/5.5としてリリースされる可能性があり、Altmanの「コード・レッド」後の勢いを取り戻すOpenAIの試みを象徴しています。このモデルはまだ完成していませんが、評価が実世界のパフォーマンスに反映されれば、スケーリング効率が決して停滞していないことを示すシグナルとなります。
>Garlicの進展は、縮小と高性能を両立する新たな潮流を示していますね。スケーリングの限界を超える試みが、次世代モデルへの期待を一段と高めます。
小さなアーキテクチャで大きな知性を実現する流れが加速していますね。Garlicの進展は、AI進化の効率性がまだ尽きていないことを静かに示しているように感じます。 December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



