1
佐久間由衣写真集 sonnet
0post
2025.12.06 08:00
:0% :0% (50代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
PFNから、材料科学などのシミュレーションを用いた長期の解析タスクを実行できるコーディングエージェント PARC を発表しました。末尾に実行動画、スレッドに論文があります。
PARCは100ステップを超えるような研究計画・実行・検証・考察を行い、数十時間規模のシミュレーションを複数同時に走らせ、結果を自動で検証します。
PARCはマルチエージェント構成であり、プランナーと複数のワーカーからなります。まずプランナーが実行計画を立て、人の承認を受けた後、自動実行に移ります。自動実行は複数のステップに分割され、各ステップ内では自己検証と、外部エージェントによる検証と修正によって途中実行結果を何重にも検証しながら進めていきます。
LLM自体の性能向上がある中でも、現時点ではこうしたマルチエージェントシステムは必須で、それを使わない場合は今回のような長期タスクは不可能dした(今回のケーススタディはClaude Sonnet 4.5で行っています)。
ケーススタディでは、論文などで報告されているシミュレーションを使った解析を再現できるかを調べ、それを専門家が検証する形でその有効性や課題を調べました。
具体的には、固体電解質におけるリチウム拡散の推定、超合金の偏析機構の解析、電場をかけた非平衡シミュレーション、および汎用性を確かめるため同じシステムでのKaggleタスク実行を行いました。これらではシミュレーションの実験設定が誤っている場合でも、PARCが自動で検証し間違いを発見できることを確認しました。
一方、電場をかけた非平衡シミュレーションの場合は、途中の重要な計算に誤りがあり、誤った最終結果が導かれることが判明しました。ただし、このときも研究者がその部分だけを修正すれば全体は正しく動作することも確認しました。このようにPARCは中間計算や実行結果を逐次レポートするため、研究者が正確に介入できる点も大きな利点です。
今後も全体の最適化をAIがしつつ人が適切に介入できるシステム設計が重要になると考えられます。 December 12, 2025
Pro(20ドル)プランでもClaude CodeでOpus 4.5が使えるようになったようだ。
これは嬉しい。
ただ、あっという間に5時間制限のリミット到達するだろう。
Good news–Claude Opus 4.5, the best model in the world for coding, is now available in Claude Code for Pro users. Opus 4.5 performs exceptionally well at complex, real-world coding problems.
To get started with Opus 4.5 in Claude Code:
Update Claude Code (run `claude update`)
Select Opus 4.5 using /model
We recommend using Opus for your most challenging problems, like building detailed implementation plans with Plan Mode, and using Sonnet for simpler execution tasks.
https://t.co/DHTyMuzbZ2 December 12, 2025
えーsonnet egfx 550wジャンクが激安で出てて心揺れた…
デスクトップ来ちゃったからいらないけど誰か買ってくれない?w
sonnet egfx breakaway box 550 ジャンク品 egpu
https://t.co/9gLtnfz26l December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



