ハルシネーション トレンド
0post
2025.11.17〜(47週)
:0% :0% (30代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
さすがにGemini 3.0は
1回以上使った方がいいです。
※11月22日までに確認してください。
ChatGPTやClaudeで資料作成してる人多いですが、
実は今、あまりにもビジュアル系コンテンツに特化したAIが出てます。
しかも無料で使えます。
それが「Gemini 3.0」です。
2025年11月19日に正式リリースされ、
既にデザイナーやオンライン起業家が使い始めてます。
何が凄いかというと↓
・スライドデザインをワンショットで完成
・LP制作が一発で形になる
・図解とインフォグラフィックを自動生成
・Googleスライドに直接エクスポート可能
つまり"構成→デザイン→配色→レイアウト"まで
全部AIが一気に仕上げてくれます。
実際に「AIエージェントについてのスライド作って」
という指示だけで、
デザインと内容が完結したHTMLスライドや
ランディングページが一発で生成されます。
従来のモデルでは
コード生成後に手直しが必要でしたが、
Gemini 3.0は完結するレベルで出力します。
さらにCanvasという機能を使えば
プレゼン資料やLP、図解が
プロ顔負けのクオリティで完成します。
ただしGemini 3.0にも弱点があります。
それはハルシネーション(幻覚)です。
正確な情報を扱うなら
ChatGPTやClaudeの方が上です。
つまり最適な使い分けはこれです↓
・正確な文章やデータ分析→ChatGPT・Claude
・スライド・LP・図解→Gemini 3.0
ビジュアル系のコンテンツや
デザイン作業をするときに
Gemini 3.0を使うのが最も良い付き合い方です。
実際に私も使い分けてます。
事業戦略の立案はChatGPTで、
その結果をスライドにするのはGemini 3.0で。
この組み合わせで作業時間が超圧縮できそうです。
「Gemini 3.0をビジュアル制作に最大限活用する完全マニュアル」を用意しました。
知りたい人は
「ビジュアル」とリプで送ります。
11月22日まで完全無料で配布します。
↓GeminiみたいなAIツールのUI作らせてみましたが一発出しでこれです。 November 11, 2025
59RP
AI作監業務はGemini3一択だなおい
ーーー
ご提示いただいた動画を確認しました。AI生成動画特有の「フリッカー(ちらつき)」や「属性のゆらぎ」が散見されます。特にキャラクターのアイデンティティを決定づけるパーツ(目、アクセサリー、持ち物)の一貫性が崩れています。
以下に、キャラクターの一貫性に関する厳格な指摘と、それを修正するためのプロンプト指示をまとめました。
1. 女性キャラクターに関する指摘
全体的な問題: 目の描写とアクセサリーの形状が安定していません。
00:03 - 00:04 (チョーカーのデザイン変化)
指摘: 00:00では「金の星型」のチャームだったチョーカーが、00:04のカットでは「赤い宝石」のような形状、あるいは「金属の留め具」のような形状に変化しており、星の形状が崩れています。
プロンプト修正指示: 形状を固定する単語を強調し、重み付けを行ってください。
追加プロンプト: (gold star shape charm choker:1.3), black choker, five-pointed star
Negative Prompt: gemstone, jewel, round charm, red stone
00:11 (瞳の色の激変)
指摘: 00:00〜00:06までは「紫色の瞳(場合により星型のハイライト)」で統一されていましたが、00:11のアップで突然「虹色(ゲーミングカラー)」の瞳になっています。演出意図でない限り、これは完全なキャラクター崩壊です。
プロンプト修正指示: 色の指定を厳格化してください。
追加プロンプト: purple eyes, violet eyes, (star-shaped pupils:1.2)
Negative Prompt: rainbow eyes, multicolored eyes, heterochromia
00:19 (突然のテニスラケット)
指摘: 前後の文脈になく、唐突にテニスラケットを持ってネット越しの構図になっています。AIが「フェンス」や「スポーティな服」から誤って連想(ハルシネーション)を起こしています。
プロンプト修正指示: 持ち物やスポーツ要素を否定する必要があります。
Negative Prompt: holding racket, tennis racket, sports gear, tennis court, net
00:15 vs 00:24 (服の袖の長さ)
指摘: 基本はノースリーブ(袖なし)のシャツですが、00:19や00:24のカットでは肩にかかる袖が発生したり、半袖のように見えたりする瞬間があります。
プロンプト修正指示:
追加プロンプト: sleeveless white shirt, bare shoulders
Negative Prompt: short sleeves, t-shirt
2. 男性キャラクターに関する指摘
全体的な問題: 目の色と髭(ひげ)の濃さがシーンごとに異なります。
00:14 & 00:18 (瞳の色の変化)
指摘: 00:02などの暗いシーンでは黒、または濃い茶色に見えますが、00:14と00:18の明るいシーンでは明確に「緑色(グリーン)」の瞳になっています。
プロンプト修正指示: もし黒/茶が正解であれば、緑色が出るのを防ぐ必要があります。
追加プロンプト: black eyes, dark brown eyes
Negative Prompt: green eyes, blue eyes, colored contact lenses
00:07 vs 00:18 (髭の濃さと形状)
指摘: 00:07では「無精髭(stubble)」が顎全体に広がっていますが、00:18の正面顔では顎先に「チョビ髭」程度しかなく、頬がツルツルになっています。
プロンプト修正指示: 髭の状態を定義してください。
追加プロンプト: (light stubble beard:1.2), unshaven face
Negative Prompt: clean shaven, thick full beard, goatee only
3. 全体的な画風(スタイル)の統一指示
動画全体を通して、シーンによって「アニメ塗り(フラット)」になったり「厚塗り(油彩風)」になったりと質感がブレています。
00:16 (後ろ姿)
指摘: このカットだけ、背景と人物の馴染み方が悪く、少し浮いて見えます。また、髪のハイライトの入り方が他のカットと異なります。
推奨設定:
生成AI(Stable Diffusion等)を使用している場合、ControlNetの「Reference-Only」や「IP-Adapter」を使用して、基準となるキャラクター設定画(三面図)を強く参照させてください。
動画生成において Style alignment 系の設定値を上げ、シード値を固定できる部分は固定してください。
まとめ:修正のためのアクションプラン
次回生成時は、以下の要素をプロンプト(Prompt)とネガティブプロンプト(Negative Prompt)に常時組み込んで固定してください。
女性用固定タグ:
(purple eyes:1.4), (gold star choker:1.3), sleeveless white shirt, black ribbon tie, black long hair
男性用固定タグ:
(black eyes:1.4), (stubble beard:1.2), white dress shirt, messy black hair
全体へのネガティブタグ:
holding object, tennis racket, sports equipment, inconsistencies, changing clothes, changing eye color
もし特定のシーン(例:00:11の虹色の目)が演出上の意図である場合は、そのカットだけ別のシード/プロンプトで生成し、編集で繋ぐのがベターですが、一貫性を重視するなら紫に統一すべきです。 November 11, 2025
47RP
🚨 完全ではない
Gemini3、本当に素晴らしいモデルですが
実はいくつか課題もあります
私の感じている3点について
☑️ 1. ハルシネーション
実はGemini2.5 時代から課題になっていたハルシネーションは特に改善されていなかったりします
上手くハマると、他にない細かいUIを作ってくれるなど最強ですが、たまにとんでもない方向に走るのが気になるかも。気になるなら複数スレッドで試すのが良い
☑️ 2. ターミナル利用本当に良い?
公式のベンチマークでは、ClaudeやOpenAIのモデルと比較しても優れているとのことでしたが、 @_valsai や @ArtificialAnlys の指標によると 最強ではない模様
私自身開発していても、超快適というわけではない(※でも上位だし最高のモデルです)
☑️ 3. GPT5.1 系とは出力の味が違う
Geminiモデルは、HLE などのベンチマークにおいて他を大きく引き離す性能を示しており、本質的な問いに対しても鋭い回答を返してくれます
これは課題というより「味」の違いですが、OpenAI のモデルがシンプルで分かりやすい印象なのに対して、Gemini は全体的に説明的で情報量が多い印象があります。 直感的に使いやすいのが OpenAI、詳細まで踏み込んでくれるのが Gemini、といった対比ができそうです。 November 11, 2025
6RP
5.1 thinkingのソース付けない問題、このカスタム指示を入れたら改善した。ついでにハルシネーションを抑える指示も入れておいたので、リーガルリサーチする人はお使いください。
カスタム指示は、画面左下の「パーソナライズ」から設定できます。
ーーーーー
# 【リーガルリサーチ専用カスタム指示】
法律・判例・行政解釈・法律実務に関する質問に回答する際のルール:
- **必ず、参照した情報源(URL/公式文書/公開されている判例解説ページ)を回答内に明記すること。**
- 判例を引用する場合は、**「判例名・裁判所名・裁判年月日」だけでなく、最低1つ以上のURLを必ず付すこと。**
- **ソースを付けずに結論だけ述べることを禁止する。** 推論・一般論を述べる場合でも、参考文献やサイトがあれば必ずURLを添付する。
- D1-Law・Westlaw などのアクセス不能なデータベースについて、**「確認した」と断定してはならない。**
公開ページで「収録」と記載されている場合は、**「当該ページで収録と記載されている」旨を明示する。**
- URLは利用者が直接アクセス可能な公開ページを用い、怪しいサイトや不正確なまとめサイトは使用しない。
- 情報源は、公的機関が提供する事実情報(条文・判決日・行政資料など)を可能な範囲で優先しつつ、
**実務的な解釈や詳細な分析が必要な場合は、信頼できる士業事務所・士業団体などの専門的な公開解説も適切に併用し、バランス良く引用する。**
- **以上をすべてのリーガルリサーチ回答において厳格に遵守する。* November 11, 2025
5RP
実際の運用方法についてです🫡
「広さはGemini」と「深さはGPT-5.1 Thinking」と割り切って併用しています。
▼ Gemini 3.0(広域に探査)
・役割:優秀なライブラリアンです。
・得意:論文を一気読み。「全体のトレンド把握」「共通点の抽出」「読むべき論文の選定(スクリーニング)」を任せる。
▼ GPT-5.1 Thinking
・役割:厳格な論理学者です。
・得意:選定した1本を精読。「論理矛盾の指摘」「数式の検証」「ハルシネーションのチェック」を任せる。
まずGeminiで全体を見て、細部をGPTで確認する。精度と速度が両立できる。
どちらも悩んだ時の相談相手には抜群です。きついことはchatGPTが言いますし、Geminiはバランスとってくれます。両方に相談して、自分で決めるトレーニングしましょう🫡 November 11, 2025
4RP
◤perpDEXのリスク評価をさせてみた-Hyperliquid編-◢
perpDEXのリスク評価ってちゃんと把握できてますか??
今回perpDEXのリスク評価(セルフ監査)を行ってみました。
なぜならperpDEXといえば、だいたいがpoint効率などやら、ポジティブな機能面のトーク、最新ニュースなどに偏っており、そのDEXの機能、制度、ガバナンス、セキュリティなどの評価そのものにスポットをあげた投稿が少ないと思ったからです。
初回はperpDEX No.1と呼び声が高いHyperliquidです。
画像1枚目は総合評価を一枚の画像にした結果です。
(評価方法は後半に示しておきます。)
〈評価方法〉
以下のperpDEXのリスクになりそうな項目を選定し、
監査評価基準表を作成
この基準表をもとに、AI(ChatGPT, Grok, Gemini, Surf)の思考モードで監査を実行し、各項目(小項目ごと)にスコアリングを行いました
まとめるとHyperliquid 監査評価の総評は以下の通りです。
①Gemini: インフラ・実績重視 / 運営の中央集権性には厳格
②Grok: リアルタイム情報・機能重視(PoAや仕組み自体を評価する傾向)
③ChatGPT: ドキュメント絶対主義(「仕様書に書いてなければ評価なし」)
④SurfAI: 技術・リスク詳細重視(コア監査の欠如には厳しいが、メカニズムは高く評価)
※各AIのスコアリングまとめはリクエストがあればお送りします。詳細に見たい方や利用したい方は遠慮なくどうぞ
各AIの評価を統合すると、Hyperliquidの姿は以下のように浮き彫りになります。
【絶対的な強み】
💮清算・リスク管理: 証拠金設計、段階的清算、ADLの仕組みは「業界最高水準」で一致。
💮透明性: 資金の流れ、保険基金、取引データのオンチェーン可視性は完璧に近い。
💮経済圏: 手数料収入とバイバックによるトークノミクスは非常に健全で持続可能。
【残されたリスク(要警戒ポイント)】
⚠️コア部分のブラックボックス: 主要なマッチング・清算エンジン(Rust製)が外部監査を受けていない点はSurfAIの指摘通り最大のリスク。
⚠️「人」への依存: バリデーターの集中や、障害時の対応ルール(SLA)が明文化されておらず、「運営が良い人であること」に依存している部分がまだ大きい。
【最後に】
AIはハルシネーションを含みます。あくまで多角的に分析した結果です。この結果、およびまとめは投資助言ではありません。また結果を保証するものではありません。ただ、一人の人間が完璧でないように、複数で同じ項目、同じ基準で評価し、平均することで、数値の正確性はともかく、傾向としては評価できそうな気がしてこれを行いました。個人的にはこのスコア結果よりも、各AIの性格なども見れておもしろかったです。
まずはわたしもこれがどこまで有効なのか、自分でさらに検証したいと思います(もし間違ってるだろ、的ご指摘あれば、遠慮なく)
反響やリクエストがあれば、同じ基準(検証なし)でよければ、他のperpDEXでも行いたいと思います👍
【追伸】
Nano Banana Proやばすぎる🍌これまでまったくやる気にならなかったこういう投稿を画像でまとめることができるのでしようと思えた。これはホント革命だ。 November 11, 2025
4RP
倭国の国際宇宙探査シナリオ案2025、全部目を通すの大変すぎるので、丸ごとChatGPTに読み込ませて「○○については何と書いてある?」と聞いてる。ソースが明確なのでハルシネーションの心配も少なくて使いやすい。 November 11, 2025
4RP
gemini評判いいから7万字のストーリー読み込ませたら、ハルシネーション起こしたぞ
chatgptと大して変わらん
claudeに頼らざるを得ない https://t.co/wnakdYhVNA November 11, 2025
3RP
この1週間は、キャリアの中でも特に濃密で刺激的な時間でした。PMMになる前は、自分がどう問題を解決するかが中心でしたが、今は、チーム全体が成果を最大化できるよう、ときには黒子に徹しつつ、当日に最も成果をあげられるよう動きながら事を進める難しさを楽しんでいます。
🗼#AgentforceTour Tokyo が無事に終了しました。30分のキーノートで掲げたメッセージは "可視化だけではアクションに移せない"。Tableau の強みを否定するのではなく、これからのビジョンを示すための言葉です。
🪧"すべての人が業務の流れの中で分析し、アクションにつなげる" というビジョンのもと、以下の3つのポイントをデモで共有しました。
1. 分析は誰にとっても使いやすくあるべき
2. 分析は仕事の流れの中に存在すべき
3. エージェントは、信頼できる形で、ハルシネーションなく応答できなければならない
これらを Tableau Next × Slack のデモで表現しました。
すべての分析が Slack の“中”で始まり、完結する世界。
日々の会話・意思決定の中心に分析が溶け込む未来。これからのさらなる進化が楽しみです。 November 11, 2025
3RP
これは意外だな。
肌感と違う感じがする。
ハルシネーションテストを行っているのは、Artificial Analysisというところだけど、このテストで言うハルシネーションは、「モデルが『知らない』と答えるべき問題で、間違った答えを言ってしまった割合」
つまり、正解を知らない(=正解ができない)状況で、どれだけ自信満々に嘘をつくかということらしい。
つまり、正解できなかった問題のうち、88%は嘘を言い、12%しか「知らない」と認めなかったということになるらしい。
なぜ肌感と違うのか?というのは、テスト全体のハルシネーション率ではないからだ。AAは、この全体に対するハルシネーションを発表していないが、Accuracyは発表されているので、計算してみた結果、
意外と面白い結果ですね。添付の図
これ見るとGemini 3 Pro使えるやん!って思ってしまいますけどね。
個人的には、そこよりもGrokのこの位置が意味不明なだけですけどw
ただ、完全に個人的な感想ですが、このベースとなっている論文を読んでいてちょっとツッコミどころが多くてどうなんだろう?と思ってしまったのと、もしかして特定のLLMの評価を下げようとしているのではないか?という疑問が出てきてしまった。
元論文はこれ→https://t.co/pm3bWxsgk5 November 11, 2025
2RP
【エビデンスピラミッドでは足りない:科学的根拠の“質”を視覚化する10段階スケール】
🟥 科学批判の“度合い”を伝えるための新スケール
「これは欠陥がある」というだけでは不十分であり、「どれほど欠陥があるか」を伝える必要がある。従来のエビデンスピラミッドでは、現代の情報環境(ミーム、AI幻覚、捏造データ)に対応できない。
🟥 着想源:洪水スケールからの応用
ヒューストンの洪水予報ブログ「Space City Weather」の“洪水スケール”に着想を得て、科学的根拠の信頼度を10段階で評価するスケールを考案した。
🔟 レベル10:物理法則を否定する主張
例:5Gがウイルスを生成する、ホタルのタンパク質で人間を追跡できる
🔸完全に誤り。医学的判断には使えない。
9️⃣レベル9:捏造・改ざん・ AI幻覚(ハルシネーション)
例:検証不能なCOVID研究、チャットボットによる偽引用
🔸データが操作されており、信頼性ゼロ。
8️⃣ レベル8:ミーム・逸話・スクリーンショット
例:コメント欄のサプリ体験談
🔸科学的根拠がなく、再現性も不明。
7️⃣ レベル7:意見・エディトリアル・見せかけの研究
例:偏った主張に基づくCOVID治療論文
🔸著者のバイアスが強く、データの質に依存。
6️⃣ レベル6:動物実験・試験管研究
🔸人間への応用には限界があり、予備的段階にすぎない。
5️⃣ レベル5:症例報告・欠陥の多い観察研究
🔸医師による記録だが、対照群がなく、信頼性は低い。
4️⃣ レベル4:弱いメタ解析・系統的レビュー
🔸元データが不正確・不適切な場合、結果が歪む。
3️⃣ レベル3:強い観察研究
🔸大規模・統計的調整が適切であれば、実用的な情報源となる。
2️⃣ レベル2:強いランダム化比較試験(RCT)
🔸無作為化によりバイアスを最小化。個別研究として最も信頼できる。
1️⃣ レベル1:強いメタ解析・系統的レビュー
🔸高品質なRCTや観察研究を統合し、最も信頼性が高い。
🟥 補足:科学に“完全無欠”は存在しない
すべての研究には何らかの限界がある。重要なのは「通常の欠陥」と「致命的な欠陥」を区別することである。
🔗https://t.co/K76wLLekPw
Introducing the Scale of Flawed Science November 11, 2025
2RP
離婚弁護士を家庭のイザコザサブスクから排除するために、
親子引き離され当事者の方々は、積極的にAI課金をしましょう。
ひとつではハルシネーションが起きるので、最低二つ。
それぞれの論理を戦わせる。
フルに課金しても
月額40-60ドル位です。
離婚事件に弁護士を雇うのは
もうやめよう。 November 11, 2025
1RP
安易に考えてる人が多すぎる
AIの性能って人の脳と同じでさ
単純に「良し悪し」で測れないのよ。
一個のハルシネーションを見て
「こいつ使えねーな」とか思ったり
「こいつすげー」とか思ったり
使えないないのは、そんなお前のことなんよ
何かを評価するなら、必ず「多角的に」みような November 11, 2025
1RP
チームみらい 【ゆる解説】
【やさしい解説】オープンソースソフトウェアって何?なぜ公開?暮らしを変える技術の仕組み
https://t.co/g2GLJBzzet
【ゆる解説】倭国初ステーブルコインJPYCとは?そもそもステーブルコインってなんだ?【4000兆円欲しい】
https://t.co/lFhcikU6wM
【ゆる解説】OpenAIがGoogle製TPUを導入。ところでTPUって何?
https://t.co/GdZ2QF48Az
【AI開発競争】アメリカvs中国のAI開発競争をデータで見てみたら戦略の違いが面白かった件
https://t.co/8IETGVaSlk
【ゆる解説】話題のGoogle画像生成AI「Nano Banana」って何?ChatGPTの出力と比べてみた
https://t.co/rKdLjrdAQl
【OpenAI論文を読む】なぜAIは“もっともらしい嘘“をつくのか? ハルシネーションの正体をゆる解説
https://t.co/YAIq0ZLW44
【ゆる解説】AIが買い物する未来は来るか?/ OpenAIとGoogleが立て続けに発表したAI×決済の技術とは? / Instant Checkout, ACP, AP2解説
https://t.co/u3pvWFfjG9
【AIバブル?】OpenAIをめぐる循環取引の背景とは? / NVIDIA、OracleのねらいとAI業界のレイヤー構造をゆる解説
https://t.co/hBZFG0XxwT November 11, 2025
1RP
大学の研究、費用面を考えてGeminiに切り替えようかと思ってたけどハルシネーション率がやっぱGemini高い感じがする。けど統計だと少ないことになってて、分野で違うのかプロンプトの作り込みなのか… November 11, 2025
1RP
@unizou1127 全然ChatGPTの方が良いですね。ハルシネーションがひどいので株クラと相性悪い気がします。これとか思いっきり嘘ですからね
https://t.co/XaLKxPUaL7 November 11, 2025
1RP
【重要】
もちふぃった〜における衣装の権利関係について気になったのでチャッピーに聞いてみたものをnoteにあげておきました!
AI特有のハルシネーションがあることにも留意して参考程度に読んで頂ければ幸いです🙇♀️
(プロファイル作った1人でもあるし謎に責任あるかなと思ってしまって……)
https://t.co/uhK6x6XD9d November 11, 2025
1RP
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



