opus トレンド
0post
2025.11.25 09:00
:0% :0% (40代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
現時点で最高性能を叩き出したコーディングモデル、「Claude Opus 4.5」について知っておくべきことまとめ
Claude Opus 4.5 について重要な情報をまとめました。エンジニア採用試験で人間超えを記録するなど、必見の内容です。
・Anthropic は Claude Opus 4.5 を発表。APIおよび主要3大クラウドで本日より利用可能
・APIモデル名は claude-opus-4-5-20251101。コンテキストウィンドウは200k
・コーディング性能は世界最高。SWE-benchで80.9%を記録し、GPT-5.1やGemini 3 Proを上回る
・必要なツールのみ読み込む「Tool Search」により、オーバーヘッドを約85%削減(コンテキストの95%を実データに活用可能)
・「Programmatic Tool Calling」により、複雑なタスクのトークン数を約37%削減
・デスクトップ版「Claude Code」が登場し、複数セッションの並行実行が可能に
・Chrome拡張機能が全Maxユーザーに拡大、Excel連携もベータ版として提供開始
・価格は/(入力/出力)。前モデルOpus 4の1/3の価格設定 November 11, 2025
4RP
ちょっとまて Claude Opus 4.5やばいかも
修正なしで一発でこのクオリティのオセロゲーム出してきた
Gemini 3.0で作ったのが霞むレベル
めっちゃクオリティ高い https://t.co/83IdgkoqlQ https://t.co/zzjDnYsEi6 November 11, 2025
3RP
Claude Opus 4.5、コーディング性能で明確な差が...
簡易的な検証ですが、描画量、UIの完成度において、明らかに他モデルを凌駕するリッチな挙動を見せました。
4つのモデルに「レトロなシューティングゲームを作って」と指示した結果の比較がこちら👇
https://t.co/jBolsbTknG November 11, 2025
3RP
㊗️なんとNotion AIでClaude Opus 4.5が利用可能に
Notion使ってる人は触らないのは流石に損。
Notionさん、流石に大盤振る舞い過ぎません?
Claude公式で使うにも月々3万円、Perplexityなどで使うにも月々3万円かかる、Claude Opus 4.5がNotionで月々3800円で利用可能に!
今までの傾向から実質的な回数制限もないはず。
また、Notionについての理解が1番深かったClaude Sonnet 4.5の進化版が使える。
AIエージェント適性が高いので、Notionとはシナジーもある。
最新の高級モデルを月額据え置きでこの速度で(公式リリースから2-3時間)実装してくれるとは。
すごすぎて語彙力なくなります。
対話メインのチャットAIとして利用する「だけ」でも圧倒的なコスパなのに、これをNotion内でAIエージェントとして動かせるんです。
今何回か利用しましたが、速さも質も高そうです。
今日めちゃくちゃ使い倒したいと思います。
ありがとうございます。 November 11, 2025
2RP
Anthropic が Claude Opus 4.5 を発表
SWE-bench Verified で 80.9%、Gemini 3 Pro や GPT-5.1-Codex-Max を超え、あらゆるモデルの中で最高性能。価格は 100 万トークンあたり入力 ドル、出力 25 ドル。API 経由で使う際のモデル名は claude-opus-4-5-20251101。
https://t.co/LkAPbNruCN November 11, 2025
2RP
Anthropic、生成AIモデルClaude Opus 4.5リリース。「よりインテリジェントで効率的」「世界最高峰」うたう | テクノエッジ TechnoEdge
https://t.co/KxxHGGqrNy November 11, 2025
1RP
Claude Opus 4.5すげ。コーディング能力がGemini 3 ProやGPT-5.1 Codex Max超えてきた‥!詳細まとめ👇🏼 https://t.co/qGBykgp3rX https://t.co/1KVcNgL2zO November 11, 2025
1RP
Claude Opus 4.5、コーディング性能で明確な差が...
簡易的な検証ですが、描画量、UIの完成度において、明らかに他モデルを凌駕するリッチな挙動を見せました。
4つのモデルに「レトロなシューティングゲームを作って」とだけ指示した結果の比較がこちら👇
https://t.co/jBolsbTknG November 11, 2025
1RP
Opus 4.5 、簡単なプロンプトでもかなり深く思考して、課題解決を試みるし、全体のコードを参照して、更に周辺のコードを参照して、問題のある箇所を特定し、課題を解決しようとしてくれている。
今までのモデルはこの動きはなかったな。 November 11, 2025
Anthropic 正式推出 Claude Opus 4.5 模型,该模型被定位为全球最佳的编码、代理和计算机使用模型,在处理日常任务如深度研究、幻灯片和电子表格方面也实现了显著提升。
这一发布标志着 AI 系统能力的重要进步,并预示着工作流程将迎来更大变革。Claude Opus 4.5 在真实世界软件工程测试中达到了最先进水平,例如在 SWE-bench Verified 测试中取得最高得分,展示了其在解决复杂多系统 bug 方面的卓越表现,即使面对歧义和权衡决策,也无需过多指导即可独立运作。
Claude Opus 4.5 现已在 Anthropic 的应用、API 以及三大主要云平台上全面可用。开发者可通过 Claude API 访问 `claude-opus-4-5-20251101` 模型,定价为每百万 tokens 输入 5 美元、输出 25 美元,使 Opus 级能力更易为用户、团队和企业所及。
伴随模型发布,Claude Developer Platform、Claude Code 和消费者应用均迎来更新,包括针对长运行代理的新工具支持,以及在 Excel、Chrome 和桌面上的创新使用方式。
Claude 应用中,长对话功能不再受限,通过自动总结早期上下文避免卡顿,确保流畅交互。
在基准测试中,Claude Opus 4.5 全面领先竞争对手,如 Sonnet 4.5、Opus 4.1、Gemini Pro 和 GPT-5.1 等模型。
它在代理编码(SWE-bench Verified 80.9%)、代理终端(Terminal-bench 2.0 59.3%)、合成工具使用(Telemech-bench 98.2%)、可扩展工具使用(MCP Atlas 62.3%)、计算机使用(OSWorld 66.3%)、小说问题解决(ARC-AGI-2 验证 37.6%)、研究生级推理(GPQA Diamond 87.0%)、视觉 MMU 验证(80.7%)和多语言 MMLU(90.8%)等指标上表现出色。
在内部 2 小时限时技术考试中,该模型得分高于任何人类候选者,尽管未涉及协作或沟通技能,此结果引发了对 AI 如何重塑工程职业的深刻思考,Anthropic 的 Societal Impacts 和 Economic Futures 研究正致力于探讨此类影响。
Claude Opus 4.5 在安全方面达到了 Anthropic 迄今最稳健的对齐水平,可能也是行业最佳,对提示注入攻击的鲁棒性高于其他前沿模型,通过 Gray Swan 开发的强力测试得到验证。
该模型在视觉、推理和数学等领域均有全面提升,例如在 τ2-bench 中,通过升级舱位然后修改航班的创意方式解决航空代理场景,体现了其创新问题解决能力,尽管基准测试视其为失败,但突显了实际应用潜力。
Claude Developer Platform 新增努力参数(effort parameter),允许开发者在时间、花费与能力间进行精细权衡。
中等努力水平下,Opus 4.5 在 SWE-bench Verified 上匹配 Sonnet 4.5 的最佳得分,但输出 tokens 减少 76%;
最高努力水平下,提升 4.3 个百分点,同时 tokens 减少 48%。结合上下文压缩、高级工具使用和内存能力,Opus 4.5 在代理任务中性能提升近 15 个百分点,支持构建复杂多代理系统。
产品更新进一步强化了其实用性:
Claude Code 的 Plan Mode 现能更精确规划并生成用户可编辑的 https://t.co/qkXRGYaprn 文件,支持在桌面应用中并行运行多个会话;
Claude 应用支持长对话自动总结;
Claude for Chrome 扩展至所有 Max 用户;
Claude for Excel beta 版扩展至所有 Max、Team 和 Enterprise 用户,利用 Opus 4.5 在计算机使用、电子表格和长任务中的领先性能。
此外,Opus 4.5 移除了特定限制,并提高了 Max 和 Team Premium 用户的整体使用限额,以更好地支持日常工作流程。这一发布不仅提升了 AI 的可靠性和效率,还为开发者与企业提供了构建更智能代理系统的强大工具,推动 AI 在生产环境中的深度集成。
#AI #Claude November 11, 2025
なんかYoutubeでバズりそうなミーム文脈理解はGemini 3.0の方がいいな。ロジカル面ではGPT 5.1とClaude Opus 4.5は似た感じだけど、これは難易度を挙げたときにしか差が生まれないので何とも、もはやわからん。 https://t.co/JiEQGrNgae November 11, 2025
Claude Opus 4.5 で早速サイトを作ってみたけどいい感じ!早速Gemini 3 Proに追いついた感じだね。 https://t.co/wdkZeBulcw November 11, 2025
【ClaudeがバージョンUPしたぞ】
今までOpus4.1ですぐにリミット迎えていたが…
新バージョンOpus4.5さらにリミット制限から外れたぞ
ざっくりとスライドまとめしたので見てな👨💼
まずはClaude使いは使っているモデルを確認して⚠️
sonnet4.5使っていたらそっちが利用制限掛かるぞ
とにかく使い倒してメリット享受しよう😌 November 11, 2025
@claudeai Claude Opus 4.5 is pushing the boundaries of what AI can actually do. Excited to see how workflows evolve from here.
Claude Opus 4.5 が「AIが本当にできること」の境界を押し広げている感じ。ここから仕事の流れがどう変わるのか楽しみです。 November 11, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



