GPT-5 トレンド
0post
2025.12.12
:0% :0% (30代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
GPT-5.2で驚いたのは長文読解性能がほぼ100%で、GPT-5.1の2倍近くに進化していること。
OpenAIの長文理解の実験で、文章が10万トークン以上あっても精度が100%から全く落ちないことが示された。
もはや長文理解の限界が消え、数十万語の契約書、専門書、レポート、何でも正確に分析可能になった👇 https://t.co/4B5skLIdEJ https://t.co/BUtvMhXIU9 December 12, 2025
228RP
■ GPT-5.2 に Nano Banana Pro のスライドを渡したら、普通に編集可能なpptxにしてくれた
レイアウト考えたり画像作るところだけ Nano Bnana でやって、そこから先の修正とかメンテは、pptx にして Copilot でやると超速いw
← パワポのスライド
→ 元の画像
こんな感じのプロンプトでやった。
---
添付の画像を、pptxの1枚のスライドで完全再現してください。
テキストは完全に編集可能な形にし、元の画像にある図やグラフは切り抜いて(クロップして)そのまま利用してください。 December 12, 2025
169RP
後からもうちょっと詳しく見てみますが、GPT-5.2、評価スコアや使用感的には、本来対抗を意識したGoogleのGemini3.0よりは、AnthropicのClaude 4.5 Opusに直撃しそう
Claudeはコーディング、エンプラ特化路線をとっているので、非特化のGPTに迫られるor超えられる状況が続くと、存在意義が怪しくなる。 https://t.co/EWzOGAbLfp December 12, 2025
65RP
■ GPT-5.2 Pro で Excel 作成。完全に業務で使えるレベル
まずは GPT-5.1 vs GPT-5.2 の比較 Excel ブックを作らせる。
完全に業務で使える品質やんwww
(Thinking でも十分な品質だった)
ふふふ、これは当然 m365 copilot にもくるよね、最高だね。 December 12, 2025
60RP
世界最強頭脳GPT-5.2 Proが考える「ChatGPTの性能を極限まで引き出すプロンプト」
︎ ︎ ︎ ︎ ︎ ︎ ︎ ︎ ︎ ︎
結局これよね。プロンプトっていろんな型があるんやが、GPT 5.2が考えても↓が一番重要なんよね。長々と書きたくなければ4枚目の短縮版だけでもいいかも
︎ ︎ ︎ ︎ ︎ ︎ ︎ ︎ ︎ ︎
性能を最大化するには
❶ 目的の 明確化
❷ 前提・制約の固定
❸ 出力形式の指定
❹ 不足情報の質問
❺ 自己検証
をプロンプトに組み込むのが重要やね。
具体的には下記
-----------------------------
### 背景・文脈
- 対象読者/利用者:【誰が使う?】
- 現状:【今どうなっている?】
- 理想状態:【どうなれば成功?】
- 関連資料(あれば貼る):【URL/文章/要点】
### 要件(必須)
- 出力言語:倭国語
- トーン:【丁寧/フランク/ビジネス/学術的】
- 制約:
- 文字数:【例)800〜1200字】
- 禁止事項:【例)専門用語は最小、断定しすぎない】
- 必須事項:【例)具体例を3つ、手順は番号付き】
- 判断基準(品質):【例)実行可能/網羅的/誤りが少ない/再現性】
### 進め方(重要)
1) まず「不足している情報」を最大【3】個まで質問してください(重要度順)。
- ただし、質問しなくても合理的に進められる場合は、仮定を置いて先に進めてください。
- 仮定は「仮定」と明記してください。
2) 次に、解決の方針を箇条書きで提示してください(5〜8行)。
3) その後に成果物を作成してください。
### 出力フォーマット(厳守)
次の見出しで出力してください:
1. 要約(3行)
2. 成果物(本編)
3. 追加提案(任意)
4. 検証(セルフチェック)
- 事実/推測の区別
- 抜け漏れ
- 反例/リスク
- 改善余地(次に聞くべきこと)
### 追加の注意
- わからないことは「わからない」と言い、確度を上げるための情報を提示してください。
- 必要なら、複数案(A/B)を出し、用途別に推奨を示してください。
-----------------------------
追加で「極限”に近づく上級オプション」
----------------------------
A. 自己改善ループ(品質が一段上がる)
- 最後に「改善版」をもう1回だけ生成してください。
- 改善版では、(1)冗長さ削減 (2)曖昧さ削減 (3)実行手順の具体化 を必ず行ってください。
B. 評価者ロールを追加(ミスが減る)
- あなたは「作成者」と「査読者」を兼ねます。
- まず作成者として出し、その後 査読者として“厳しめに”欠点を3つ指摘し、修正版を出してください。
C. 出力を“機械可読”にする(後で使いやすい)
- 成果物は Markdown で、見出し・表・チェックリストを活用してください。
可能なら最後にJSONでも要点を出してください(キー:summary, steps, risks, next_questions)。
D. 不確実性の扱いを明示(ハルシネーション対策)
- 断定が必要な箇所には「確度:高/中/低」を付けてください。
- 根拠が必要な箇所は「根拠が必要」と明記し、確認方法も提案してください。
----------------------------
とりま使ってみたい人は「ブクマ」をポチ December 12, 2025
58RP
OpenAIはGPT-5.2発表。Gemini 3 ProやClaude 4.5 Opusと比較し各種ベンチマークで飛躍。ARC-AGI 1/2でもSoTA。実際の経済的有用性を専門家と比較するGDPvalでは70%以上と専門家以上のパフォーンスを記録。SWE-bench Verifiedでは、GPT-5.2 Thinkingが80%で最高スコア。ハルシネーションも大幅に減り、ロングコンテキストベンチマークも飛躍。 December 12, 2025
50RP
サムアルトマン渾身のドヤツイート😇
他社のベンチマーク結果と比較した画像をアップするの珍しい(初?)。多くのベンチマークでGemini 3 Proを逆転。
ここに書いてないけど、GPT-5.2 ProはGoogleが発表したばかりのDeep Research Agentのスコアを超えているものも多い。
https://t.co/55JZFsReci https://t.co/WlDPzssBLs December 12, 2025
48RP
GPT-5.2のリリースを見て、AIはトレンドライン通りに進歩しているわけではないと気づいた。
Gemini 3 Proへの対応の早さを鑑みるに、多分OpenAIは内部で強力なモデルを隠し持ってた。
つまり、実際の進歩はもっと早く、単にトレンドライン通りになるように「リリースをコントロール」していたのだ。 https://t.co/t7Q5dixi7r December 12, 2025
46RP
ChatGPTが、GPT-5.2で予想を超えた圧倒的なベンチマークを出して来た。実際の使い勝手も素晴らしい。
なのにGemini 3.0が出た時の「OpenAIは終了」みたいに「Googleは終了」と騒ぐ人はいない。つまり、みんな「偉そうにしてた王者が倒される瞬間が見たかった」だけで、性能も中身も見てなかったよね。 https://t.co/DEBFK4nAJq December 12, 2025
43RP
おー!GPT-5.2に「セルの塗りつぶしによって"ChatGPT"と読めるピクセルアートを生成してexcelファイルとしてちょうだい」って言ったらサクッと作ってくれたw https://t.co/BOgnj781ap December 12, 2025
25RP
OpenAIが最新AI「GPT-5.2」を発表!
サム・アルトマン氏は、1月までに「コードレッド」から脱却すると予想している。
🔸日常業務に最適な最先端AIモデルが登場
OpenAIは、これまでで最も高度なAIモデル「GPT-5.2」を発表しました。
このモデルは、表計算の作成やプレゼン資料の構築、画像認識、コード作成、長文理解において従来より優れています。
木曜日からChatGPTチャットボットとAPIで利用可能になりました。
🔸競合他社との激しい開発競争が背景に
今回の発表は、OpenAIがGPT-5.1モデルを発表してから数週間後のことです。
競合のAnthropicとGoogleも先月新モデルを投入したため、OpenAIは「コードレッド」(緊急対応)を宣言してChatGPTの改善に全力を注ぎました。
主要テック企業は、最も広く使われるAIモデルを生み出すため、熾烈な競争を繰り広げています。
🔸3つのバージョンで多様なニーズに対応
GPT-5.2は「Instant」「Thinking」「Pro」の3バージョンで提供されます。
Instantは文章作成や情報検索が速く、Thinkingはコーディングや計画立案などの構造化作業が得意です。
Proは難しい質問に対して最も正確な回答を提供すると、OpenAIは説明しています。
🔸まとめ
OpenAIのサム・アルトマンCEOは、1月までにコードレッド体制から脱却できると期待を示しました。
現在、ChatGPTは毎週8億人以上が利用する世界最大級のAIサービスに成長しています。
5000億ドルの企業価値を正当化するため、OpenAIはGPTシリーズで未来を切り開こうとしているのです。
🔸参考
Sam Altman expects OpenAI to exit ‘code red’ by January after launch of GPT-5.2 model
https://t.co/nhKsVF5ON6 December 12, 2025
22RP
GPT-5.2に変わって、研究で得をする使い方は文章生成ではないと思いました。
原稿をチェックするときの弱点は、締切が近いほど見落としが増えることです。矛盾、言い過ぎ、用語の定義抜けが残ったまま出しがち。ここは根性では埋まりません。
GPT-5.2は、長い前提を持ったまま指示どおりにチェックを繰り返すのが安定しています。だから、赤入れを仕組みにできそうです。
やり方は以下です。
原稿(目的、主要アウトカムの定義、解析、結論)を貼る。
落とされるポイントをYes/Noのチェックリストにして出させる。
改稿したら、同じチェックリストで再判定する。
落ちた箇所だけ最小修正する。
これを上手く運用すると、推敲が気分や体力に左右されにくくなります。自分の原稿を守るためではなく、落とされる理由を先につぶすために使う。これが5.2で研究力が伸びる使い方だと感じました。
Yes/Noのお試しプロンプトを以下に置いておきます。 December 12, 2025
20RP
OpenAIのGPT-5.2、なんでこの時間でこんな5.1から性能上がってるのかよーわからんなあ。これが出来るなら5.1の時にやってくれ、という感じがする。「やべーからあわてて性能上げた」みたいなことが出来るもんじゃない気がするんだけど。5→5.1より開発期間ずっと短いよね。 December 12, 2025
19RP
OpenAI 发布了 GPT-5.2,“成人模式”将在明年第一季度推出。
OpenAI 刚刚推出了一款全新的 AI 模型,旨在大幅提升 ChatGPT 在编程、科学研究以及各类工作任务中的表现。这一动作紧随谷歌之后——几周前,谷歌母公司 Alphabet 推出了备受好评的 Gemini 3,一度让 OpenAI 被迫转入防守态势。
这款名为 GPT-5.2 的新模型不仅速度更快,在信息检索、写作和翻译方面也更加得心应手。OpenAI 在周四表示,该软件将提供三个不同版本。更重要的是,它被设计用来更好地模仿人类的推理过程 (即像人一样通过逻辑分析来解决问题),从而能够处理数学和编程等领域中那些更为复杂、篇幅更长的任务。
曾经,OpenAI 是 AI 研发领域无可争议的霸主,但现在它正面临着来自谷歌和 Anthropic 的新一轮猛烈冲击——这两家公司在过去几周内都发布了强大的新模型。尤其是谷歌的 Gemini 3,凭借其卓越的推理和编程能力赢得了广泛赞誉,并迅速登顶了 LMArena 和 Humanity’s Last Exam (“人类最后大考”,一个专门测试 AI 极限能力的权威评测集) 等备受瞩目的 AI 排行榜。
就在本月早些时候,OpenAI 首席执行官 Sam Altman 在一份公司备忘录中宣布进入“红色代码” (Code Red,通常指公司面临生死存亡危机时的最高紧急状态),并要求重新调配内部资源,全力加速 ChatGPT 的改进。这一指令让人不禁联想到三年前的戏剧性一幕:当时 ChatGPT 刚刚问世,谷歌也曾因感到巨大威胁而发布过类似的“红色代码”。
凭借 GPT-5.2,OpenAI 正试图吸引更多的企业客户并提升收入。这至关重要,因为该公司已承诺投入超过 1 万亿美元用于基础设施建设,以支撑 AI 的持续发展。为了实现这一目标,OpenAI 表示新模型旨在“为人们释放更多的经济价值”,具体的改进包括更高效地创建电子表格、制作演示文稿,以及编写代码。
GPT-5.2 将于本周四开始向付费用户推送。
今年 8 月,OpenAI 发布了备受期待的 GPT-5,但市场反应褒贬不一,有人质疑它并未带来革命性的突破。随后的 11 月,OpenAI 又推出了升级版 5.1,但这波更新很快就被谷歌更强大的 Gemini 3 抢去了风头。
在周四接受 CNBC 采访时,Altman 说道:“Gemini 3 对我们各项数据指标的冲击,其实比我们担心的要小。”他还表示,预计 OpenAI 将在明年 1 月结束“红色代码”状态,并且届时公司将处于“非常强势的地位”。
此外,OpenAI 还透露已开始部署一种能预测用户年龄的软件,旨在更好地管控 ChatGPT 对 18 岁以下用户的回应方式。在周四的媒体简报会上,OpenAI 应用业务首席执行官 Fidji Simo 表示,公司希望在推出“成人模式”之前先上线这一年龄识别功能。此前 Altman 曾提到,“成人模式”可能会允许“经过验证的成年人访问色情文学等内容”。
Simo 表示,“成人模式”将在明年第一季度推出。
新闻来源:https://t.co/WD8iGZ01np December 12, 2025
19RP
長年、サム・アルトマンの書くポエムから、その時の彼の心理状態を分析し続けてる自分の見解。
今回のは、革新的なイノベーションが起きた時や、最新モデルに大きな手応えがあった時の文章ではなく、今までの延長線上の地道なアーキテクチャの改善とチューニングの努力で達成した時に書く文章。
ちなみに、この統合的なアプローチでAIモデルの性能とUXを両立する地道なノウハウこそが、他の陣営が盗んで真似できないOpenAIの秘密のレシピなんだけど、これに気づいてる人は少ない。
そして10年の区切りという日に、この振り返りの文章を自信を持って出すためには、この日までにGeminiをベンチマークで圧倒的に超えて王者の地位を奪還している必要があった。当然そのためにGPT-5.2を前倒しでリリースしたわけじゃなく、レッドアラートの直接的な理由は、短期間にGemini 3.0を超えてみせることを投資家に求められたからだと思うけどね。
数ヶ月後、新しいスケール学習で育てられたGPT-6をリリースするまでの期間では、ベンチマークでまた抜き返されることもあると思う。でも、次は細かいチューニングで慌てて抜き返したりせず、淡々とAGIに至るためのアーキテクチャの上で、スケール学習手法のイノベーションを追求した新モデルを作って行くんじゃないかな。そして、その手法自体もおそらくは上手くいく目処がついている。そんな心境が文章の行間から見えて来た。
なので、今回のブログを読んで、わりとOpenAIの1、2年先までの未来には安心している自分がいます。 December 12, 2025
18RP
openai 发布了gpt5.2
巨大的能力提升,再次证明scaling law前面没有墙,ai经济没有泡沫。
个人认为最好的评论是下面这一篇(节选):
“一年前,在 ARC-AGI-1 上达到 88% 准确率,估计每任务成本约 4500 美元。今天达到 90.5%,只需 11.64 美元。
12 个月内成本降低了 390 倍。看看那个排行榜。效率前沿几乎每几周就被重画一次。
GPT-5.2 Pro、Grok 4、Gemini 3 Deep Think、Claude Opus 4.5,全都沿着从左下到右上的对角线层层叠加,每一个新模型都让前任的性价比瞬间过时。
大多数人还没搞懂这个基准的意义有多大。
François Chollet 在 2019 年专门设计了 ARC-AGI,就是为了对抗暴力堆算力的路子。他的核心论点是:大语言模型只会死记硬背训练数据,遇到全新抽象推理任务会彻底崩盘。
所以测试的每道题都是独一无二的、网上从未在网上出现过的,需要从极少样本中真正泛化。人类轻松做到 95%。多年来,最强的 AI 系统连 5% 都摸不到。
2020 年 Kaggle 比赛最高才 20%。到 2023 年也才 33%。GPT-3 直接提示得分 0%。AI 研究圈基本接受了“ARC-AGI 证明单纯 scaling 走不通”的结论,Chollet 本人说达到人类水平“还得很多年”。
然后 2024 年 12 月,OpenAI 的 o3-preview 在高算力模式下干到 87.5%,首次突破人类基准线 85%。但模型每道题要尝试 1024 次,每次写出大约 137 页推理,成本估算在 3000~30000 美元/任务不等。
仅仅 11 个月后,GPT-5.2 Pro 以 90.5% 准确率、11.64 美元/任务的价格出现。
这波成本崩盘的数字说明了一切。。。我们在过去几个月里悄悄跨过了“AI 推理比人类便宜”的那条线,大部分人都没注意到。
效率提升完全没有减速,反而在复利式增长。
ARC-AGI-1 彻底沦陷之后会怎样?Chollet 已经在 2025 年 3 月放出了 ARC-AGI-2,专为当前推理系统设计得更难。
人类依然接近 100%,当前前沿模型只有 10-45%。但即使在这个更难的基准上,人与 AI 的差距也已经从“根本能力鸿沟”变成了“成本优化问题”。
那个原本要证明 AI 无法泛化的基准。。。ai一年实现了 390 倍效率提升。” December 12, 2025
18RP
GPT-5.2のスライド作成能力が驚異的。
ついに読み込ませたPDF論文中の図表に対して、ハルシネーションがほとんどなく画像認識 → 画像抽出 → 図表付きのpptxを出力できるようになってしまう。
Claude Opus 4.5 は、図表つきのpptxは出力できるけど、ここまで精度は良くなかったし、大量のtoken消費が課題だった。
論文の要約スライドについてはGPT-5.2がGemini 3.0 pro、nano banana、Claude Opus 4.5を超えている。
論文抄読会、どうすんだろう。
https://t.co/6O8BYxObDw December 12, 2025
18RP
GPT-5.2はかなり性能が上がったみたいだね。
ThinkingですらGemini 3 Proを上回る項目が多いみたいだからGPT-5.2 pro なら全く相手にならないね!
1ヵ月でここまで改善できるのはすごい。 https://t.co/TdmuwBzxBd December 12, 2025
17RP
GPT-5.2 pro、また小説が上手くなってる。
これ、プロが書いたって言っても通るんじゃない?
俗に言うPage-turner。面白くてページをめくる手が止まらない。所々破綻はあるけど、カフカ的に解釈すれば文学的とも言える。最終ページはリプ欄。 https://t.co/6DQF4NcCog https://t.co/O9kmqB0BxD December 12, 2025
15RP
📢 OpenAI の最新モデル GPT-5.2 がリリースされ、API でもご利用いただけるようになっています!
プロンプティングガイドも公開されていますので、利用される場合はぜひご一読ください👉 https://t.co/JMHjoDMvpR https://t.co/5gig4vUacl December 12, 2025
14RP
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。





