画像生成AI トレンド
0post
2025.12.03 15:00
:0% :0% (40代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
OpenAIがGoogleのGemini3.0の性能を見てコードレッド
(緊急事態)を宣言したと話題ですが、これのインパクトはともかく、他にOpenAI内部の研究状況や今後に関してかなり面白い話題が出ていますので、全体的なまとめとコメント(また超長くなってしまった)。
・直近でChatGPT関連のコード分析で噂されていた広告導入の話は事実だったが、優先度を考えて延期
・買い物、健康に関するタスクを自動化するエージェントも開発中だったが、これも延期
・さらにユーザーに対する毎朝のパーソナライズレポート機能も(Pulseというらしい)も延期(これは個人的には早く欲しかった・・・)
・とにかく、ChatGPTのチャット機能のパーソナライズとカスタマイズによるユーザー体験の向上がGemini3に対抗する現状の優先
・Nano Banana Proに対抗して、画像生成AI機能も優先事項
コメント:
GoogleのNano Banana Proは、そもそもPro以前の段階でOpenAIの画像生成能力を大きく超えており、Proに至っては数世代違うという印象。また、そもそもNano Banana ProはGemini3.0の別機能として提供されており、テキストも混ぜたマルチモーダル学習の過程であれほどの能力を得ているはずなので、OpenAIが画像生成AI単体を学習しても追いつけない領域なのではないかと思う。つまり、テキスト生成性能と画像生成の問題は分離できないものであり、根本的にChatGPTの主要モデルの改善が必要ではないか
・ChatGPTの速度を改善し、また過剰なアライメントによる回答拒否の頻度を避けることも優先事項
コメント:
OpenAIは、昨年のo1以降に長考推論モデルであまりにも成功しすぎたが故に、現状モデルの応答スピードが遅くなりすぎている傾向がある。Gemini3はやや検索機能が低い(というよりも、どこで検索すべきかモデルのtool use判断がうまくいっていないと思う。Googleなのに検索機能が低いのは皮肉だが、この辺は長考すぎる問題を回避し、検索のAIモードと明確に使い分けさせる意図もあるのではないか)が、回答はほとんどの場合GPT-5よりも早く、高品質であるので、ここをどうするか。
過剰な回答拒否問題については、今年4月のGPT-4oの事故(迎合的すぎてロールバック)と、keep4o運動、チャットの誘導による犠牲者を出していてOpenAIが一番センシティブになっていたところで、かなり舵取りが難しいと思う。
・来週、Gemini3.0よりも優れているとされる長考推論モデルをリリース予定(!)とのこと。おそらくベンチマーク性能は高いが、アルトマンらも、チャットによるユーザー体験はまだ改善が必要であると認識している模様。
・上記の来週リリースモデルと同様かは不明だが、内部でShallotpeatとGarlicというコードネームのモデルを開発中。Garlicの方が後発で、GPT-4.5の反省などもいかし、Gemini3のように事前学習段階でのスケーリングの問題を解決し、知識性能は維持しつつモデル規模自体は小規模になるような改良もできるとのこと
・さらに、上記のモデルでの改良も生かした本格的なスケーリングを行ったモデルの開発もしているとのこと。
全体コメント:
現時点の情報だけでも、OpenAIが本当に全方位戦の開発をしていることがわかる。確かにこれを見ると、昨今の異常な計算リソース確保の動きも納得はでき、アルトマンが言う30Gwのデータセンターも本人的には誇張ではなかったのだろう。OpenAIが事前学習スケーリングに関してGemini3の事前学習スケーリング復活を見る前から諦めずに粘っていたのは後に効いてきそう。
これらの将来的な取り組みはともかく、直近の開発レースはむしろOpenAIが一番劣勢の状況にあると思う。Gemini3.0に全体的な性能で負けているのはもちろんのこと、AnthropicのClaude4.5 opusは最も需要のあるコーディング性能を大きく上げつつ今までのコスト増、スピード鈍化とは逆の省エネ化をするという謎の錬金術をやっている。また、DeepSeekによって直近でリリースされたDeepSeekMath-V2は、OpenAIが「隠し玉」として温存していたIMO(国際数学オリンピック)金メダルを達成してしまい、DeepSeek-V3.2は、ほぼGPT-5に性能で追いつきながら新手法導入により大幅な計算コスト削減に成功している。しかもオープンであり、他の機関もこれらの技術を使ったブーストがかかり、追いつくのが容易になる。 December 12, 2025
9RP
🎀琴葉姉妹と学ぶ「NanoBananaPro」10の基本機能🎀
茜「なあ葵、マスターが使ってる『Nano Banana Pro』って、結局何ができるん?」
葵「すごいツールだよ。まずは基本の『テキストから生成』。言葉だけでゼロから思い通りの絵が出せるんだ」
茜「それは知ってるわ! でも失敗したらどうするん?」
葵「そこで『画像編集』機能だよ。要らないものを消したり、後から修正して完璧にできるの」
茜「なるほどな。でも、別の絵の雰囲気を真似したい時もあるやん?」
葵「なら『複数画像の参照』だね。何枚かの絵を混ぜて新しいキャラを作ったりできるよ」
茜「ほえ~! あ、YouTube用とかスマホ用とか、サイズ変えるのは?」
葵「『多様なアスペクト比』に対応してるから、16:9でも9:16でも自由自在だよ」
茜「アニメ絵だけじゃなくて、もっとリアルなやつは無理なん?」
葵「得意だよ。『リアルなスタイル』なら、写真と見間違えるくらいの質感が出せるんだ」
茜「逆に、普通の写真を絵っぽくしたい時は?」
葵「『スタイル転送』を使えば、実写の風景を一瞬でアニメ背景にしたりできるよ」
茜「へぇ…。あ、このリンゴをあっちの絵に置きたい!って時は?」
葵「『オブジェクト参照』だね。特定のモノを、形を保ったまま別の場所に配置できるんだ」
茜「じゃあ一番大事な質問! ウチの顔を崩さずにコスプレさせられるんか?」
葵「もちろん。『顔参照』機能なら、お姉ちゃんの顔のまま色んな服を着せられるよ」
茜「最強やんけ! あと、単純に絵と絵を合体させたい時は?」
葵「『画像マージ』で自然にブレンドできるよ。全く違うコンセプトを混ぜるのも面白いね」
茜「これさえあれば、ウチも神絵師になれるかもしれんな…!」
葵「ツールは神だけど、使う人のセンスも大事だよ?」
#琴葉姉妹 #画像生成AI #NanoBananaPro December 12, 2025
2RP
あのブロックリスト、異様にふっとらちゃんへのヘイトが濃厚なのよね
並み居るAIユーザーを押しのけて10回以上名前が出てくるし
ふっとらちゃん手描き絵描きやぞ、手描き絵描き
反画像生成AI衆の大好きな、努力信奉手描き絵描きなんだけど December 12, 2025
絵を描くことが好きな私にとって画像生成AIがもたらすと思う弊害について短いコラムを書きました。ぜひ読んでみて下さい。
#画像生成AI #イラスト
https://t.co/Egvk57p106 December 12, 2025
明後日出す動画を作成しているのですが、Googleのnano banana proの画像生成AIが凄すぎます!
メガ10とFANG+の比較をベン図で作成したのですが、ロゴも綺麗に作ってくれますし、ChatGPTの画像生成AIを1億倍、精度が高いですね!
これは生成AIの覇者になるかもしれないです。 https://t.co/sepq6LtHRB December 12, 2025
【ブルーム効果】
光がにじんで画面全体に柔らかく広がる表現です✨
写真や映像で、強い光源の周りがふわっと白くかぶったように見えるあの感じです。
ゲームやVFX、UIデザインでも使われ、現実のレンズ越しの眩しさを再現できるのが魅力。
ただし、かけ過ぎると「のっぺり」「ぼやけて見える」といった印象になりがちなので、彩度やコントラストとのバランス調整が重要です。
光源の強さや距離、背景とのコントラストを意識しながら、あくまで「補助」として使うと、作品全体の奥行きや没入感がぐっと増します。
ブルームを前提に、他のライティング効果と組み合わせることで、よりドラマチックな画づくりが可能になります。
==ブルーム効果とグロー効果の違い
>>見え方
ブルーム:強い光が周囲と画面全体ににじんで広がる
グロー:対象の輪郭に沿って発光する「縁取り」の光が強調される
>>影響範囲
ブルーム:シーン全体の明るい部分がぼんやり広がる
グロー:特定のオブジェクトや文字など、限定された要素の周囲だけが光る
>>目的
ブルーム:レンズ越しの眩しさや空気感・没入感を出す
グロー:注目させたい要素を強調し、存在感やサイバー感を出す
>>使いどころのイメージ
ブルーム:風景、光源、ハイライトの多いシーン演出
グロー:ロゴ・テキスト・アイコン、UIパーツの強調表現
#プロンプト活用 #プロンプト #特殊効果 #画像生成チャレンジ #画像生成ai #画像生成AI #画像生成 December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。







