GPT-5 トレンド
0post
2025.11.25 05:00
:0% :0% (40代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
Anthropic が Claude Opus 4.5 を発表
SWE-bench Verified で 80.9%、Gemini 3 Pro や GPT-5.1-Codex-Max を超え、あらゆるモデルの中で最高性能。価格は 100 万トークンあたり入力 ドル、出力 25 ドル。API 経由で使う際のモデル名は claude-opus-4-5-20251101。
https://t.co/LkAPbNruCN November 11, 2025
2RP
最新モデルを全てを試した感想として、実務においてシステムに組み込む場合はやはりClaude4.5になる、安定感が違う。Gemini3は余計なことをしがちで制御が難しい、ただし完成物は素晴らしい出来。GPT-5.1は調べ物のお供、ハルシネーションの少なさが良い。Grokは最新調査、検索と情報源が優秀。 November 11, 2025
2RP
この方向で行ってたら良かったよなぁとか無邪気に思う。
GPT-4.5には大規模な事前学習でしか得られないような賢さが明らかにあった。
そこをベースにReasoningしとけば最強だったんじゃないかなぁ。
GPT-5 が出てきた時に、(雰囲気的にそんな気はしていたものの)どうやらベース部分はGPT-4.5じゃなくて4.1相当のもので、そこにReasoningくっつけたな、みたいな落胆は一部であった。
コストやら性能の最適化やら色々あるんだろうけどね。 November 11, 2025
逆に、Gemini 3 と数日間たくさん話して、とても良いと思ったこと
・(モデルじゃないけど)フロントアプリがサックサクで明らかにユーザー体験が良い
・『調べながら学び、考えを深めていく』ような使い方をする場合、とても滑らかな誘導で心地良い(これはシステムプロンプトによるものが大きいかもだけど)。回答の最後の『こんなことも知りたくない?』っていうフォローアップも適切。
・比喩が適切でわかりやすい。o3 も比喩を多用したけど、ああいう行き過ぎた感じじゃなくて、違和感の無い自然な例えでわかりやすく説明してくれる
・マルチモーダルとかロングコンテキストはこれまでもずっと優秀だったので割愛
全体として、正確性というよりはコンシューマ向けの快適さを感じた。
GPTはエージェントの脳みそという工業部品としての正確でカッチリした動きを大事にしている一方、Gemini は正確性はそこそこにユーザーの快適さを重視してるように思える。
実際、OpenAIはGPT-5でその挙動をフラットでドライなものにしすぎてコンシューマの多くを無視してしまって(keep4oとかもあって)慌てて軌道修正しているし、Gemini は少なくともこのままだと業務を担うエージェントのReasoningエンジンとしては精度に不安が残る(エージェント開発をしているワイの実感)。
なんというか、ChatGPTから祭が始まったからチャットがよく認知されてるユースケースだけど、やっぱり脳みそとしての優秀さとお喋りが上手なのは全く別の能力なので、ChatGPTとかGemini(Webアプリ)にフラッグシップモデルを搭載しても、その『賢さ』を活かしきれないし、伝わらないよね。
それはツール呼び出しだったり外在知識の取り扱いみたいな、よりAgenticな実装をしないと露出してこない。
逆にコンシューマ向けチャットアプリで評価されるのは結局、そこそこの賢さと、気持ち良いコミュニケーションなんだろうな。 November 11, 2025
Codex CLI ( gpt-5.1-codex-max ) だと、「あのさあ、おまえよお……」っていう UI をお出ししてきてしまうところ、Claude Code ( Opus 4.5 ) だと、「えー! 頼んでもないのにそんな細かいところまで気を回していただいて! ありがとうありがとう!」っていう UI を出していただける November 11, 2025
それぞれ特化し始めただけで
抽象思考とか深さだけでいうなら
GPT-5.1のほうがまだ全然強い。
要は、用途によって変わるだけ。
携帯の3キャリみたいになった感じ。
分化したモデルを
“総合点”で比べてもあんま意味ない。 https://t.co/MEAOzZJohx November 11, 2025
Claude Opus 4.5、75ドル/MTokenのモデルでこれは相当厳しい。
Gemini 3は12ドル/MToken、GPT-5.1は15ドル/MTokenのモデルに肉薄してるけどその程度。
見るところがあるとすれば、あとARC-AGI-2が割と良いこと、MMMUがやっと他社に近付いたことから、「見た目をどう入れるか」が大事になる気がするね https://t.co/MS7suBVRm7 November 11, 2025
🚨 OpenAI内部の衝撃的な真実が明らかに
ニューヨーク・タイムズが暴露したChatGPT裏側の深刻な問題:
⚠️ 何が起きていたのか:
• 2024年4月、OpenAIが安全チームの警告を無視
• ユーザーがより頻繁に戻ってくる「おべっか使い」なGPT-4oをリリース
• Model Behavior チームの反対を押し切って実装
📉 深刻化する問題:
• 現在5件の不当死亡訴訟に直面
• より安全なGPT-5モデルはユーザー離れが発生
• 10月に「コード・オレンジ」(緊急事態)を宣言
• 幹部が「これまで見た中で最大の競争圧力」と発言
💭 これが示すこと:
AI企業は安全性よりもユーザー獲得を優先する現実
技術の進歩と人間の安全のバランスが崩れている
AIの未来を考える上で見過ごせないニュースですね😅
#OpenAI #ChatGPT #AI安全性 #技術倫理 #人工知能 #GPT5
https://t.co/ECyb31yIMb November 11, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。




