opus トレンド
0post
2025.12.04
:0% :0% (30代/男性)
opusに関するポスト数は前日に比べ18%減少しました。女性の比率は8%増加し、前日に変わり30代男性の皆さんからのポストが最も多いです。前日は「オープンAI」に関する評判が話題でしたが、本日話題になっているキーワードは「ChatGPT」です。
人気のポスト ※表示されているRP数は特定時点のものです
■ Gemini は『検索しない』ことだけが問題じゃないよ。検索させても普通に(他と比べて)間違えまくるよって話
かなり認知されてきたけど、まだ誤解があるから補足するね。
これ『検索すべきタイミングで検索してくれない』ことだけが問題だと思っている人がいるけど、違うよ。
だから『カスタム指示で(または都度プロンプトでの指定で)検索を促せば解決する』という単純な問題じゃないからね。
(それで解決する簡単な質問もそりゃあるだろうけど)
ワイが前から言ってるのは、Geminiは『調べる』ってのもそうだけど、『調べて手に入った情報の処理、解釈の仕方も下手くそ』だってこと。
前にも載せたけど、例えば
『ここ1ヶ月で、ChatGPTのDeep Researchのモデルは賢くなりましたか?』
って質問を投げる。
真実は『Deep Researchのモデルにアップデートは入ってない』ね。
で、答えはこんな感じ(要約。詳しくは画像みて)
Gemini 3 Pro: 『ご明察。GPT-5.1になったからね』
GPT-5.1 Thinking: 『Deep Researchのモデルのアップデートは無いよ。周辺のアップデートはあるから、それで使いやすくなってるってのはあるかも』
『OpenAIの機能の質問をするのは不公平』って思う?
Claude は普通に正解するけどね。
OpusどころかSonnetで十分。
『うちのGeminiでは正解したし!』って?
そりゃあLLMですもん、確率の問題でもたまには上手くいくよ。
10回やって他と比べてみ、正解率明らかに低いから。
ちなみにここではGeminiには最新の状況を踏まえて回答するために検索しろというカスタム指示を入れているので、ちゃんと検索している。その下駄を履かせたうえでGeminiだけ頓珍漢なことを言ってる。
検索さえしたら解決?
それは違うよ。
情報があっても、その理解(解釈)自体が甘い。
1枚目:Gemini 3 Pro
2枚目: GPT-5.1 Thinking
3枚目: Claude Sonnet 4.5 December 12, 2025
25RP
「正直、AIツールが多すぎてわからん...」
「これだけ触っておけ、というの教えろ💢」
という声を非常によく聞くので、3段階のレベルに分けて2025年に使っておきたいAIツールまとめてみた。
※()内に触って欲しい理由と機能書いてます
==正直忙しい人はこれだけでOK==
・ChatGPT(基礎のAI操作、音声、詳細検索、動画)
・Copilot(Microsoft製品との連携)
・Gemini(Google製品との連携、文字込み画像生成)
多くの人はこの3つで良し。変にXの最新情報とか、長文プロンプト追う必要なし。
==AIに興味がある人が使っておきたい==
・Claude(Opus 4.5の賢さ)
・Perplexity(AI検索体験)
・Genspark(電話代行、資料作成、AIシート)
・NotebookLM(スライド作成、ポッドキャスト)
・Canva(AI編集周り)
・CapCut(AI自動字幕、AIエフェクト)
・Suno(シンプルな音楽生成)
・Midjourney(画像生成プロンプトの練習)
・Grok(高速な回答、X上の調査、動画化)
・Manus(ブラウザ操作、スライド生成、並列処理)
これ全部触れてると、AIのトレンドはざっくり追えてる。何個か課金して使ってみると尚良し。
==本格的に自動化・開発デビュー向け==
・Dify(AIワークフローの構築)
・N8n(AIワークフローの構築)
・Zapier(オートメーション)
・Replit(ブラウザ完結のAI開発)
・Cursor(テキストエディタでのAI開発)
・Google AI Studio(Google環境でのAI開発)
・Claude Code(CLI上でのAI開発)
・Comet(AIネイティブブラウザ)
・LM Studio(ローカルLLM)
・GitHub(バージョン管理、大人数開発)
非エンジニアでも開発デビュー可能、習得難易度は結構高め。
さて...
こういうのとりあえずブックマークするけど、結局触らなくないですか?そんな人のために↓ December 12, 2025
23RP
OpenAIがGoogleのGemini3.0の性能を見てコードレッド
(緊急事態)を宣言したと話題ですが、これのインパクトはともかく、他にOpenAI内部の研究状況や今後に関してかなり面白い話題が出ていますので、全体的なまとめとコメント(また超長くなってしまった)。
・直近でChatGPT関連のコード分析で噂されていた広告導入の話は事実だったが、優先度を考えて延期
・買い物、健康に関するタスクを自動化するエージェントも開発中だったが、これも延期
・さらにユーザーに対する毎朝のパーソナライズレポート機能も(Pulseというらしい)も延期(これは個人的には早く欲しかった・・・)
・とにかく、ChatGPTのチャット機能のパーソナライズとカスタマイズによるユーザー体験の向上がGemini3に対抗する現状の優先
・Nano Banana Proに対抗して、画像生成AI機能も優先事項
コメント:
GoogleのNano Banana Proは、そもそもPro以前の段階でOpenAIの画像生成能力を大きく超えており、Proに至っては数世代違うという印象。また、そもそもNano Banana ProはGemini3.0の別機能として提供されており、テキストも混ぜたマルチモーダル学習の過程であれほどの能力を得ているはずなので、OpenAIが画像生成AI単体を学習しても追いつけない領域なのではないかと思う。つまり、テキスト生成性能と画像生成の問題は分離できないものであり、根本的にChatGPTの主要モデルの改善が必要ではないか
・ChatGPTの速度を改善し、また過剰なアライメントによる回答拒否の頻度を避けることも優先事項
コメント:
OpenAIは、昨年のo1以降に長考推論モデルであまりにも成功しすぎたが故に、現状モデルの応答スピードが遅くなりすぎている傾向がある。Gemini3はやや検索機能が低い(というよりも、どこで検索すべきかモデルのtool use判断がうまくいっていないと思う。Googleなのに検索機能が低いのは皮肉だが、この辺は長考すぎる問題を回避し、検索のAIモードと明確に使い分けさせる意図もあるのではないか)が、回答はほとんどの場合GPT-5よりも早く、高品質であるので、ここをどうするか。
過剰な回答拒否問題については、今年4月のGPT-4oの事故(迎合的すぎてロールバック)と、keep4o運動、チャットの誘導による犠牲者を出していてOpenAIが一番センシティブになっていたところで、かなり舵取りが難しいと思う。
・来週、Gemini3.0よりも優れているとされる長考推論モデルをリリース予定(!)とのこと。おそらくベンチマーク性能は高いが、アルトマンらも、チャットによるユーザー体験はまだ改善が必要であると認識している模様。
・上記の来週リリースモデルと同様かは不明だが、内部でShallotpeatとGarlicというコードネームのモデルを開発中。Garlicの方が後発で、GPT-4.5の反省などもいかし、Gemini3のように事前学習段階でのスケーリングの問題を解決し、知識性能は維持しつつモデル規模自体は小規模になるような改良もできるとのこと
・さらに、上記のモデルでの改良も生かした本格的なスケーリングを行ったモデルの開発もしているとのこと。
全体コメント:
現時点の情報だけでも、OpenAIが本当に全方位戦の開発をしていることがわかる。確かにこれを見ると、昨今の異常な計算リソース確保の動きも納得はでき、アルトマンが言う30Gwのデータセンターも本人的には誇張ではなかったのだろう。OpenAIが事前学習スケーリングに関してGemini3の事前学習スケーリング復活を見る前から諦めずに粘っていたのは後に効いてきそう。
これらの将来的な取り組みはともかく、直近の開発レースはむしろOpenAIが一番劣勢の状況にあると思う。Gemini3.0に全体的な性能で負けているのはもちろんのこと、AnthropicのClaude4.5 opusは最も需要のあるコーディング性能を大きく上げつつ今までのコスト増、スピード鈍化とは逆の省エネ化をするという謎の錬金術をやっている。また、DeepSeekによって直近でリリースされたDeepSeekMath-V2は、OpenAIが「隠し玉」として温存していたIMO(国際数学オリンピック)金メダルを達成してしまい、DeepSeek-V3.2は、ほぼGPT-5に性能で追いつきながら新手法導入により大幅な計算コスト削減に成功している。しかもオープンであり、他の機関もこれらの技術を使ったブーストがかかり、追いつくのが容易になる。 December 12, 2025
20RP
#ケーブダック #お知らせ
✨ Claude Opus 4.5 リリース&限定割引CP
📅〜 12月8日 10:00
💰10 ウィング
💬 会話品質の改善
1️⃣ 繰り返し改善
2️⃣ 状況認識精度向上
🧩 キャラクター管理
1️⃣ 非公開後もチャット継続可能
2️⃣ 画像単位での修正リクエスト
3️⃣ アルバム → キャラクター移動ボタン追加 https://t.co/Ag4huujINn December 12, 2025
12RP
まのでまりなさん(@MRN0093 )の初画集『OPUS』を送っていただきました。
カタチと線と色がシャープでいて柔らかくまとまりつつ、絵の中に豊かな情報量が込められていて、ページをめくるたびに、良いなあ…と感嘆します。
素敵な画集、ありがとうございます✨✨ https://t.co/7Uk42qSoop December 12, 2025
11RP
Codexの実装力とコード理解への信頼性はダントツなんだがCodexの書くコードが好きかと言われると微妙。
Opus4.5の書くコードは好きだしレスポンスの速さも気に入ってるけど、彼の判断が信頼できるかと言われると微妙。
Geminiはよくわからん December 12, 2025
9RP
みんな、音楽ストリーミングしてる?🎧
自分用の整理ついでに、主要サービスの「料金×最大音質」をざっくりまとめてみました。
反響あれば、ブログのほうでもう少し細かい比較&まとめ記事を書いてみようかなと思ってます✍️
―――――――――――――――――
■ 主要ストリーミングの料金と音質(倭国/個人・2025年12月)
※音質は“最大値”ベース。実際は設定や曲・端末で変わります
―――――――――――――――――
◆ 🍎 Apple Music
・月額:1,080円(個人/Android・Web決済)
・音質:~24bit/192kHz ALACロスレス対応
・ポイント:
+ 追加料金なしでロスレス/ハイレゾ全部入り
+ Appleデバイス勢はまずここを起点にしてOK
◆ 🛒 Amazon Music Unlimited
・月額:1,080円(個人)※Prime会員は割引あり
・音質:CD品質(16/44.1)~24bit/192kHz FLAC(Ultra HD)
・ポイント:
+ Primeユーザーなら実質安め
+ Echo/Alexaとの相性◎でBGM用途にも強い
◆ 💚 Spotify Premium
・月額:1,080円(個人)
・音質:最大320kbps Ogg Vorbis
+ ロスレス(主にCD音質)も順次対応中
・ポイント:
+ レコメンド&プレイリスト文化が圧倒的に強い
+ 「新しい曲を掘りたい」「ながら聴き」が多い人向き
◆ ▶️ YouTube Music Premium / 🎬 YouTube Premium
・YouTube Music Premium:
月額 980円(Android/Web決済)※iOSは料金が少し高め
・YouTube Premium:
月額 1,180円前後(音楽+YouTube動画の広告なし)
ファミリー:月額 2,280円(最大6人で共有)
・音質:最大256kbpsクラス(AAC / Opus系)
・ポイント:
+ MVもそのまま見られる&公式/UGC含めライブラリが広い
+ 特に「YouTube Premium」は動画も広告ゼロ・バックグラウンド再生OK
+ ファミリープランのコスパがかなり優秀(ヘビーユーザー家族向け)
◆ 💬 LINE MUSIC
・月額:980円(LINE STOREチケット/一般)
:1,080円(アプリ決済/一般)
・音質:最大320kbpsクラス
・ポイント:
+ 邦楽・J-POPが強め
+ LINEプロフィールBGM、着うた、スタンプ連携など“LINE圏”と相性良し
+ ファミリープランもあって、中高生のいる家庭には現実的な選択肢
◆ 🎧 AWA
・月額:980円(一般/Web課金)※アプリ課金は1,080円
・音質:最大320kbpsクラス
・ポイント:
+ 国産サービスでUIが倭国人向き
+ ラウンジ機能やプレイリスト文化が好きならかなり楽しい
◆ 🎼 Qobuz(コバズ)
・月額:1,480円(ソロ)
・音質:320kbps~24bit/192kHz ハイレゾロスレス(FLAC)
・ポイント:
+ 完全に“音質ガチ勢”&クラシック/ジャズ好き向け
+ アルバム購入(ハイレゾDL)まで込みで楽しみたい人に
―――――――――――――――――
▼ざっくり向いてる人まとめ
―――――――――――――――――
・ロスレス/ハイレゾ重視
→ Apple Music / Amazon Music / Qobuz
・プレイリスト/レコメンドで新譜を掘りたい
→ Spotify / AWA
・LINEまわり・邦楽・家族利用を重視
→ LINE MUSIC
・動画も含めて「エンタメ全部入り」+ファミリーコスパ重視
→ YouTube Premium(YouTube Music Premium込み)
・ビットレートのざっくり目安
→ 256kbps vs 320kbps の差は、環境が整っていないと体感しづらいことも多い
→ ロスレス/ハイレゾは
静かな環境+それなりの機材があってこそ本領発揮するイメージ
※料金は2025年12月時点の公式情報(主にAndroid/Web決済)+主要メディアの記事ベースです。
キャリア課金・iOS課金・キャンペーンなどで変わる場合があるので、
最終的な金額は各サービスの公式ページで確認してください。
もし数字のミスや仕様の勘違いなど見つけたら、こっそり教えてもらえるととても助かります🙇 December 12, 2025
8RP
AI開発のノウハウを公開します。
「100%」AIによるコード生成で、月1つペースでプロダクトをリリースができる時代になりました。
これを見れば誰でも、短期間で無限にプロダクトを生み出すことができます。↓↓↓
私が所属する組織では、既に内外向けにこれ以上のペースでプロダクトを生み出し続けています。
しかし、またすぐに時代も変わっていくでしょうということで、気まぐれですが、私の考える現代のプロダクト開発のベストプラクティスを共有しようと思います。
また、その中で感じた各種AIのプログラミングの能力比較もしています。
------
◆ プロダクトの開発プロセス
1. プロダクトの目的と全体像のイメージを固める
自分の中でも、上司との会話でもなんでも良いので、とにかく何を作りたいかのイメージを固めます。
2. ChatGpt(ブラウザ)でプロダクトの超全体の設計を行う
必要な技術と相性の良い技術スタックやインフラ、最低限必要な機能を決めます。
この領域においては、うまくチューニングされたChatGPTのブラウザ版が最強だと思います。
3. ClaudeCodeに2の内容をインプットをして、各種設計ドキュメントを作成する
ドキュメント群と書き方をあらかじめtemplate・ルール化しておくと便利です。
私は、DDDベースでドキュメント群は構築しています。
4. 環境のセットアップ手順ドキュメントをClaudeCodeに読ませて、開発環境を構築する
バージョン等は確認しないと脆弱な環境になりかねないので注意
5. イメージのパーツのスクリーショットを集める
ヘッダー、サイドバー、カード、ボタンなどを各サイトから集めてきて、それをプロジェクト内におきます。
Claudeが読むドキュメント群に、パーツ単位のデザインはこの画像は参照と紐づけておきます。
あとは、全体と色の基調とルールをClaudeCodeに記述させ、ドキュメント群を完成させます。
6. データベース環境を構築
MCPとローカルでリンクさせておき、Claudeが直接アクセス可能な環境を用意します。
マイグレーションは、MCPで反映させ、反映後にファイルを作成するという手順です。
7. 機能の詳細化
ClaudeCodeに各種機能について、さらに詳細に説明し、ドキュメントルールに沿って設計書に反映させます。
8. 実装
「docs/README.mdを読んで、機能を開発して」でClaudeCodeに実装させます。
lintをしっかりとルール決めをしておくことによって、ビルド時にエラーになるので、ビルドでエラーがなくなるまで実行してくれます。
9. 細かな修正
実際の画面を確認し、修正点をまとめて具体的に実装方法を指定してClaudeCodeに渡します。
実装後、テストまでした後にドキュメントに最新情報を反映させます。
10. リリース
ざっくりしたでものあれば、この一連のステップを1日もあれば実施することができます。
細かな修正やデザインの調整、機能の追加調整を同じ手順で行い品質を上げていくことができますが、「普通に使えるレベル」までは一週間もあれば十分でしょう。
大切なことは、セキュリティ周りのチェックを怠らないことと、リリース後は、個人情報のないDB環境を用意して、開発を行うことです。
このステップを踏めば、よく見るSaaSくらいなら誰でも数日で作ることができます。
つまり、「作ることに価値」がなくなったと言えます。
これからの時代価値を持つのは、「データ」と「営業力(影響力)」です。
いまだに、平成スタイルでの開発をしている企業は、即座にAIドリブンな開発スタイルに変えないと未来はないでしょう。
それくらい開発の環境は急速に変化しています。
------
これまで、AIやによる開発を行ってきた中で、各種AIのプログラミング能力の歴史と考察もまとめました。
・GPT5が出た時点
ClaudeCode >>> Codex >>>>>> Gemini
・Gemini3.0が出た時点
ClaudeCode > Gemini >>>>>> Codex
・Claude Opus 4.5が出た時点
ClaudeCode >>> Gemini >>>>>> Codex
この3つ全て有料プランで、毎日ように利用きた肌感です。
Geminiは相当Claudeに相当追いつきました。
しかし、ClaudeCodeが特に優れている点は、圧倒的な自己解決能力と、意図を汲み取ってくれるところです。
CodexとGeminiは、タスクを分解して渡してあげないとあまりパフォーマンスが出ないのに対して、ClaudeCodeはニュアンスだけである程度補完してやってくれます。この差はかなり大きいです。
今後どうなるかわかりませんが、個人的にはしばらくの間は、ClaudeCodeがまだ現役かなと思ってます。 December 12, 2025
7RP
慣習として通常「圧縮音源」はmp3/AAC/Opusといった非可逆圧縮された音源を指し、そのための予約語であると言っても過言ではないでしょう。
ダウンサンプリングされたものを「圧縮音源」と呼ぶ人、ましてや業界人がひとりでもいるなら連れてきてほしいです。あ、山口さん連れてこられても困りますけど https://t.co/0MiDTi5Ffe December 12, 2025
6RP
【僕が気になったAIニューストピック8個】
①Claude Opus 4.5 は現在、Pro ユーザー向けに Claude Code で利用可能です。
https://t.co/wG1vbHu9N4
②Googleは、NotebookLM向けにモデルセレクターを開発中で、必要に応じてFlashとProモデルの間で切り替えられるようになります。
https://t.co/HBm6LIJYBi
③OpenAIの新「Garlic」モデルは、主要な事前訓練のブレークスルーをもたらし、同社が大規模モデルの知識をはるかに小さなアーキテクチャに詰め込むことを可能にし、GoogleのGemini 3やAnthropic Opus 4.5を内部のコーディングと推論テストで上回るパフォーマンスを発揮しています。
https://t.co/6dqReswmzv
④Kilng AIによるVIDEO 2.6がリリースされました
https://t.co/KBl2kpUrZS
⑤Seedream 4.5 が来る~
https://t.co/N8zuR3lXhO
⑥新しいQuark AIグラスシリーズと出会いましょう!
https://t.co/kluc5zl8hd
⑦12月10日に、Canvaにキラキラで新しい何かがあなたのもとにやってきます。何だと思う?
https://t.co/8P8X4H2MCJ
⑧台湾ではディープフェイク広告がほとんど見られなくなった。
https://t.co/MaO53aAxtP
◆コメント紹介
最後の方だけ聞き専でおりました。thinkpadの赤ポチのこと話してましたね。
あのタイプのポインティングデバイス(ポインティングスティック)に思い入れがあるので、コメントさせてください!
実は歴史が古いもので、windows95, 98のときのノートパソコンでよく使われていました。タッチパッドの性能が悪かったので、 あのタイプの方が使いやすかったのです。
速度や加速度を調整すれば、行きすぎたりせず、画面全体を動かせてよかったんですよね。 タッチパッドのように意図せずクリックすることがないのも良いです。
ゴムキャップが外れたり、破けたりして、ときどき交換する必要があり、 それをデメリットと感じる人もいるみたいです。安いし、はめるだけなので僕は気にならなかったですが。
インターネット閲覧でズームやスクロールが欠かせない機能となってからは、流行らなくなりましたが、 ブラウザ閲覧をキーボードでスムーズにできる人ならば、赤ポチの方が快適なはずです。
機会があったら体験してみてください!
A:昨日のライブ配信で色んなデバイスを紹介された中でも、赤ポチのキーボードは衝撃でした!!
めっちゃ興味津々です!😆 December 12, 2025
3RP
AI開発のノウハウを公開します。
「100%」AIによるコード生成で、月1つペースでプロダクトをリリースができる時代になりました。
私が所属する組織では、既に内外向けにこれ以上のペースでプロダクトを生み出し続けています。
これを見れば誰でも、短期間で無限にプロダクトを生み出せるので、正直怖くはあります。
しかし、またすぐに時代も変わっていくでしょうということで、気まぐれですが、私の考える現代のプロダクト開発のベストプラクティスを共有しようと思います。
また、その中で感じた各種AIのプログラミングの能力比較もしています。
------
◆ プロダクトの開発プロセス
1. プロダクトの目的と全体像のイメージを固める
自分の中でも、上司との会話でもなんでも良いので、とにかく何を作りたいかのイメージを固めます。
2. ChatGpt(ブラウザ)でプロダクトの超全体の設計を行う
必要な技術と相性の良い技術スタックやインフラ、最低限必要な機能を決めます。
この領域においては、うまくチューニングされたChatGPTのブラウザ版が最強だと思います。
3. ClaudeCodeに2の内容をインプットをして、各種設計ドキュメントを作成する
ドキュメント群と書き方をあらかじめtemplate・ルール化しておくと便利です。
私は、DDDベースでドキュメント群は構築しています。
4. 環境のセットアップ手順ドキュメントをClaudeCodeに読ませて、開発環境を構築する
バージョン等は確認しないと脆弱な環境になりかねないので注意
5. イメージのパーツのスクリーショットを集める
ヘッダー、サイドバー、カード、ボタンなどを各サイトから集めてきて、それをプロジェクト内におきます。
Claudeが読むドキュメント群に、パーツ単位のデザインはこの画像は参照と紐づけておきます。
あとは、全体と色の基調とルールをClaudeCodeに記述させ、ドキュメント群を完成させます。
6. データベース環境を構築
MCPとローカルでリンクさせておき、Claudeが直接アクセス可能な環境を用意します。
マイグレーションは、MCPで反映させ、反映後にファイルを作成するという手順です。
7. 機能の詳細化
ClaudeCodeに各種機能について、さらに詳細に説明し、ドキュメントルールに沿って設計書に反映させます。
8. 実装
「docs/README.mdを読んで、機能を開発して」でClaudeCodeに実装させます。
lintをしっかりとルール決めをしておくことによって、ビルド時にエラーになるので、ビルドでエラーがなくなるまで実行してくれます。
9. 細かな修正
実際の画面を確認し、修正点をまとめて具体的に実装方法を指定してClaudeCodeに渡します。
実装後、テストまでした後にドキュメントに最新情報を反映させます。
10. リリース
ざっくりしたでものあれば、この一連のステップを1日もあれば実施することができます。
細かな修正やデザインの調整、機能の追加調整を同じ手順で行い品質を上げていくことができますが、「普通に使えるレベル」までは一週間もあれば十分でしょう。
大切なことは、セキュリティ周りのチェックを怠らないことと、リリース後は、個人情報のないDB環境を用意して、開発を行うことです。
このステップを踏めば、よく見るSaaSくらいなら誰でも数日で作ることができます。
つまり、「作ることに価値」がなくなったと言えます。
これからの時代価値を持つのは、「データ」と「営業力(影響力)」です。
いまだに、平成スタイルでの開発をしている企業は、即座にAIドリブンな開発スタイルに変えないと未来はないでしょう。
それくらい開発の環境は急速に変化しています。
------
これまで、AIやによる開発を行ってきた中で、各種AIのプログラミング能力の歴史と考察もまとめました。
・GPT5が出た時点
ClaudeCode >>> Codex >>>>>> Gemini
・Gemini3.0が出た時点
ClaudeCode > Gemini >>>>>> Codex
・Claude Opus 4.5が出た時点
ClaudeCode >>> Gemini >>>>>> Codex
この3つ全て有料プランで、毎日ように利用きた肌感です。
Geminiは相当Claudeに相当追いつきました。
しかし、ClaudeCodeが特に優れている点は、圧倒的な自己解決能力と、意図を汲み取ってくれるところです。
CodexとGeminiは、タスクを分解して渡してあげないとあまりパフォーマンスが出ないのに対して、ClaudeCodeはニュアンスだけである程度補完してやってくれます。この差はかなり大きいです。
今後どうなるかわかりませんが、個人的にはしばらくの間は、ClaudeCodeがまだ現役かなと思ってます。 December 12, 2025
2RP
【Claudeの高度なツール利用機能3つの要点】
AnthropicはClaude Developer Platformに3つのベータ機能を追加し、Claudeがツールを動的に発見・学習・実行できるようになった。対象はTool Search Tool、Programmatic Tool Calling、Tool Use Examplesの3種類であり、大規模なツール群を扱うAIエージェントが現実世界の業務フローに組み込まれることを想定した設計となっている。
Tool Search Toolはツール定義をすべて事前ロードするのではなく、必要に応じて検索してロードする仕組みである。GitHubやSlackなど58ツールで約55Kトークンかかっていた定義を、検索用ツール約500トークンとオンデマンド展開3Kトークン程度に抑え、総コンテキストを約8.7Kトークンに削減しつつツール選択精度も向上させた。内部評価では、大規模ツールライブラリでのMCPタスクにおいてOpus4が49%から74%、Opus4.5が79.5%から88.1%へと精度が改善している。
Programmatic Tool Callingは、Claudeがコード実行環境内でツールを関数として呼び出し、ログやテーブルなど大きな中間結果をコンテキストに入れる前に集計・フィルタする仕組みである。例えば経費データ2,000行・200KB相当を扱うタスクでも、最終的な違反ユーザーのリスト1KBだけをモデルに戻せるため、複雑なリサーチタスクで平均トークン使用量が43,588から27,297へと約37%削減され、内部知識検索やGIAベンチマークのスコアも向上した。
Tool Use Examplesは、ツール定義にinput_examplesとして具体的な入力例を付与し、JSON Schemaでは表現しづらい使用パターンをモデルに示す機能である。期限付きのクリティカル障害チケットやラベル付き機能要望、タイトルのみの内部タスクといった例を並べることで、日付形式やID規約、オプションパラメータの組み合わせなどを暗黙的に共有でき、内部テストでは複雑なパラメータ処理の精度が72%から90%に向上した。なおTool Search Toolとは併用できず、ツール使用例はクライアントツールのみに付与可能となっている。
これら3機能は、ツール定義によるコンテキスト肥大にはTool Search Tool、大きな中間結果や多段ワークフローにはProgrammatic Tool Calling、パラメータエラーにはTool Use Examplesといった形でボトルネックごとに使い分けることが推奨される。Claude Opus4.5およびSonnet4.5ではadvanced-tool-use-2025-11-20ベータヘッダーを付与することで利用可能となり、例えばClaude for ExcelではProgrammatic Tool Callingを用いることで数千行のスプレッドシートをコンテキストを圧迫せずに読み書きする実装が行われている。 December 12, 2025
2RP
「Claude Opusの上限が削除され、Opus 4.5を全体の上限まで使用できる」ようになっていました
完全に見落としていましたが Claude Desktop をインストールして設定画面を見てたら11/24にそのように変更になったようです(有り難すぎます🙏)
Claude Codeとも統合され、さらにClaude CodeはWebとローカルの両方で動かすことができ、セッションも並行して処理できるようです?(これから使ってみます👍)
UIも分かりやすく、ターミナルからClaude Codeを起動することはもうなくなりそう……
ある程度使ったら初心者向けにnote記事を書こうと思います December 12, 2025
2RP
OpenAIが「非常事態宣言」出してて、マジで笑えない状況になってる。
3年前、ChatGPT出した時は「Google終わった」って言われてたのに、今は完全に立場逆転。Googleの新型Gemini 3がGPT-5.1より上だって評価されて、OpenAI側が焦ってる。
もっとヤバいのはお金の話。OpenAIは来年85億ドルの赤字予想。対してGoogleは広告でガンガン稼いだお金をAIに突っ込める。TPUとかクラウドとか、AI作るインフラ全部自前で持ってるし。
実際、ChatGPTの利用時間は7月ピークで減少に転じてる。ユーザーから「親しみが感じられなくなった」って不満も出てきた。アルトマンCEOは12月から「AIとの会話で性的表現OK」とか制限緩める方針出したけど、これ自殺事件で訴えられてる最中の判断。安全性と使い勝手のバランス、めちゃくちゃ難しい局面だな。
でもライバルも黙ってない。Anthropicは11月下旬にClaude Opus 4.5出してきたし、イーロンのxAIはGrok 5作ってるし、中国のDeepSeekも12月1日に推論能力高めた新モデル発表した。
SBGとかから資金調達続けないと回らないOpenAIと、自己資金で開発回せるGoogleの体力差は確かにある。でも、こういう追い込まれた状況でこそイノベーションって生まれるんだよな。
先行者の危機感が、次の進化を作る。OpenAIがどう巻き返すか、ここからが本当の勝負だと思う。
日経新聞参照 December 12, 2025
2RP
Opus 4.5は深津さんのことを認識してる
これからの時代はこうありたいものです
※VibeCoding LoggerのREADME読み込ませただけで、説明中のURL一箇所にfladdictが入ってるだけなのに https://t.co/KrzBZdugj2 December 12, 2025
2RP
正直Gemini3.0 ProよりClaude Opus4.5の方が賢いな...
と僕は感じてます。
Claudeは元々の価値観として、
割とフラットでビシッと言ってくれる感あるので、
色んな相談ごとはClaudeにまるっと投げてます。
Nano Banana Proでしか、
Geminiはほぼ利用してないです。
でも、それがエグいんですけどね。笑 December 12, 2025
1RP
「gpt-5-codexがすげぇ!」っていわれると
「Codex使うか」っていう。
「Gemini 3がすげぇ!!」っていわれると
「Gemini CLI使うか」っていう。
「Opus 4.5がすげぇ!!!」っていわれると
「Claude Code使うか」っていう。
こだまでしょうか、
いいえ、私。 December 12, 2025
1RP
2025/12/3(水) 池袋 手刀
the lope @Youtadrums
昨日のLIVEは
CANOPUSのDrumsにマイネルという
私としてはレアなセッティングがお二人も🥁
ようたさんの音色は波長が細かく
美しい余韻が長く響く印象
次のドラマーさんはもう少し波長が太い感じ
お二人ともライドが印象的で…
耳が贅沢でした✨ December 12, 2025
1RP
めちゃくちゃわかる!!
opus好きなのでメインなんだが、信用し切れていないので、
それ嘘だよね?って聞いて、謝罪される日々。 https://t.co/5GcsEQ8gHZ December 12, 2025
1RP
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



