GitHub トレンド
0post
2025.12.06 23:00
:0% :0% (40代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
RAG (とLLM) が、企業の知識管理や文書作成の自動化にどう役立つかを調査した、システマティックレビュー論文からメモ:
・結論として、企業でのRAG+LLM活用はまだ実験段階(とりあえず既存ツールで試してみたフェーズ)が多く、本格的な商用運用に到達している事例はかなり少ない
・使われているLLMは6〜7割がGPT系であり、最もよく使われるモデルの系統
・ベクトル検索にはFAISSやElasticsearchなどの一般的なフレームワークが8割以上で使われており、特別に凝った自作検索エンジンは多くない
・学術的な評価ではk-foldクロスバリデーションなどしっかりした手法がよく使われているが、本番運用を想定したリアルタイム検証はほとんど行われていない
・生成部分の評価は、計算コストの問題から単純なホールドアウト(学習用とテスト用に分けるだけ)で済ませている研究が多い
・リアルタイム連携、スケーラビリティ、監視など「プロダクション導入で一番大変なところ」をちゃんと扱っている研究は全体の15%未満
・研究の数は2020年以降に急増しており、RAG+LLMはかなり新しいトレンド
・多くの研究がクラウド上のインフラを前提としている。スケールしやすいが、プライバシーや規制との両立が課題
・金融や医療などの分野では、データ保護の観点からオンプレミスやハイブリッド構成を採用する研究も一定数存在
・使われているデータはGitHubなどの公開データが約半数を占めており、本当に企業内の機密文書で評価している研究はまだ少ない
・そのため、公開データで性能が高くても、実際の企業環境に持っていくとドメイン差やノイズで性能が落ちるリスクがある
・機械学習のパラダイムとしては、ほとんどの研究が教師あり学習に依存しており、ラベルが少ない現場向けの手法はまだ発展途上である
・古典的なアルゴリズム(ナイーブベイズやSVMなど)は、メイン処理というよりベースライン比較や補助タスク用として今も使われている
・RAGの構成としては、クエリごとに関連文書をまとめて渡すRAG-Sequenceと、トークン単位で動的に参照を変えるRAG-Tokenが主流
・ベクトル検索だけでなく、BM25のようなキーワード検索やナレッジグラフを組み合わせたハイブリッド型が、精度や説明性の面で有利
・評価指標はPrecision、Recall、Recall@K、ROUGE、BLEUなど技術的なスコアに偏っており、「ビジネスにどれだけ効いたか」を測る研究は少ない
・人手による評価やユーザスタディを行っている研究は2割弱しかなく、現場視点での使いやすさや信頼性が十分に検証されていない
・現実の業務に入れて、工数削減やエラー率改善などのビジネス指標まで測っている研究は全体の1〜2割程度
・一方で、そうした実運用系の研究では、回答時間の短縮や一次対応の自動化など、目に見える効果が出ている事例も報告されている
・大まかに言うと、オープンなLLMにRAGで社内知識をくっつける形が、現状の「定番アーキテクチャ」
・ただし、プライバシー保護、レイテンシ削減、コスト制御、継続学習など、実際の企業システムとして成立させるための要素がまだ十分に詰め切れていない
・ハルシネーションの制御や根拠提示の仕組みは重要課題として頻繁に挙げられているが、決定版といえる手法はまだない
・継続的に知識やモデルを更新し、ルールや製品の変更に追従させる「ライフサイクル設計」にまで踏み込んだ研究は少数である
・実務向けのメッセージとしては、モジュール化された設計、インデックスの継続更新、高速な近傍探索、人間評価+ビジネス指標の両方を見る評価枠組みが推奨
https://t.co/p8shpD1eSL December 12, 2025
1RP
まだそれで盛り上がってんの?
引用やリプされたらスコア◯◯倍!!は嘘やで。
「X最新アルゴリズムに対応した最新情報」ってポストみた。結論から言うと、前提は合ってる。が、解釈と根拠が怪しい。
↓現役SNSマーケ企業勤め
X専門家が解説する。(最後が重要)
例のポストに記載されている通り
本格的にXのアルゴリズムは
フォロワー重視の仕組みからAIマッチングにより
ポスト内容×興味関心に沿って
おすすめされる仕組みに変化している。
↓だから、
フォローだけされていても
・絡みがない
・ポストの質が悪い
・アクティブでない など、
マイナスな要因によって、
どんどん表示優先度が下がって
ポストが届いてない感じ。
まず、アルゴリズム自体の前提として
「後悔しない秒数を増やす」という
Xの重要指標に基づいて設計されている。
ユーザー体験の濃さの推定値が高い、
即ち…
「エンゲージメントする確立が高い」
とされるユーザーに表示する。
ここまでは
例のポストの主張は合ってる。ココマデハネ
でも、これ
2024年5月ごろからずっとそうなんよ。
(詳しい話は誰も興味ないだろうから省略)
Twitter→Xに変わって以降は
AI(現在ではGrok)を取り入れながら、
段階的にアルゴリズムの精度が高まってる。
↓ここからが間違ってるんだけども
・投稿から30分以内の反応に対するスコアの重みが14.5倍
・引用もしくはリプライは投稿後の時間に関係なく150倍の重み
さらには
「引用リプで拡散しつつ、引用元にもしっかりとリプをすることでそのポストの重みが300倍になり、さらにそれを投稿から30分以内に実行すれば314.5倍です」
!?
まあ、そんな怪文書も書かれていましたが………
↓
これらは公式情報でもないし、
そんなアルゴリズムは存在していない。
本人はオープンソースと主張しているが
コードが公開されている
GitHubにもそんなコードは存在しない。
↓そもそもね…
GitHubは最新のコードですらない。
もう3ヶ月も更新されていない。
最高技術責任者でオーナーのイーロンマスクも
以前、X上でオープンソースについて
「オープンは単なるスナップショット」
と言い放っている。
要は、ただの記録みたいなもん。
↓では
何故11月から12月にかけて
おすすめのされ方が変わったのか?
痛感している人も多いよね。
明らかに伸びづらくなったよね。
それはオープンソースされているような
Twitter時代から引き継いだ
過去の主導的なコードを削除して
完全にGrok(AI)主導のおすすめに
切り替えようとしてるから。
(というか、公式声明ないけど…11月中と告知があったし、もう切り替わってるのかな…?)
↓つい最近までは
事実に近い推測だけど、
古-INISHIE-の旧アルゴリズムコードと
Grokが補完関係にあって
いろんな基準で
「ポストを表示するか?」選定していた感じ。
↓直近でGrokのみのアルゴリズムに向かうことで
今までのように
「○○したらスコア重み付け」のような話ではなく
Grokが「あなたの興味関心と関連性が深い」と判断したら、即おすすめ表示する仕組みに変わっている。
↓しかも…
Grokに一本化されることで
このサイクルが「超高速化」している。
ポストタップやいいねをした瞬間に
またその人や似たコンテンツがおすすめされる。
これ、TikTokに近いかな。
TikTokもテストで
ユーザーに表示したコンテンツに対して
・エンゲージメント(いいね数、コメントなど)した
・視聴した時間が長い
などのシグナルを感知すると
同じ人や同じジャンルのコンテンツを奨める。
↓で、
反応なければ
フォローしててもおすすめしなくなる。
このように
「リアルタイムな興味関心」を
①テスト
②おすすめ
③反応
④フィードバック
って手順で高速で繰り返してる感じ。
↓冒頭でも述べたように
Xのアルゴリズムは以前から
「エンゲージメントの確率予測」が重要ポイント。
関連性が深そうなユーザーへポストをテスト表示
→初期の反応を見て拡散域をじわじわ広げる。
↓実際のところさ…
もうすでにタイムライン見てたら
・低エンゲージメント(いいね数、リプ数など)
・低インプレッション
そんなポストであっても
関連性が深い人であれば、おすすめしてるよね?
100インプ時点でもフォロワー外に表示されてる。
↓つまり
初期エンゲージメントが大事なことも
引用やリプが多いと伸びやすいことは間違いではない。
初期エンゲージメントが高ければ
質の高いポスト(話題性のあるポスト)
としておすすめする材料になる。
↓たーーーーだーーーーァッ!!
・されたらされただけブースト!!
・パワーが◯◯倍!!!!
なんてことは10000000%ない。
なぜなら、そんなことしたら
イーロンマスクやミスタービースト、
ヒカキン、Adoしか流れてこないよ。
むしろ、それを防ぐために
旧アルゴリズムにおける古いコードを消した。
既存のアカウントパワーに依存しない
小規模アカウントでも
適切なユーザに表示され評価を得ることで
適した場所へ拡散されていく仕組みになった。
↓
あくまで重要なのは
①どんなコンテンツを投稿して
②誰が
③どこから
④どんな行動をしたか
⑤その後の反応
という純粋な評価基準です。
引用やリプライもポスト評価のひとつ。
口コミみたいなもん。
良質な口コミが溜まったポストは
より多くのユーザーに拡散される。
他にも引用やリプが伸びる理由はあるけど
話がブレそうだから今回は割愛。
結論、エンゲージメントは必要。
でも、誰にされるか?も重要。
↓言いたいことは…
ああいう声でかいポストを間に受けて
・複数アカウントでエンゲージメントしまくったり…
・薄っぺらい上部だけのリプライしまくったり…
こういうことすると
アカウントがブレて壊滅的に弱くなるので注意。
下手したら凍結します。
フォロワー数でもエンゲージメント数でもなく
質×関連度×量の時代がきてます。
数は圧倒的に必要だけど
数だけ増やせばOK!ってことではない。
↓あと、最重要なことは
他力本願な「エンゲージメントの数で殴る」より
・純粋なファンを獲得すること
・求める誰かに刺さるポストをすること
・適切な界隈でポジションを掴むこと
・信頼性を得ること
・意外性(常識破壊)や具体性のあるポストすること
・市場の既存層と需要を理解すること
上記を頑張った方が、
変則的なアルゴリズムの波に左右されず
中長期的に支持されることは明白やでな。
↓
ここまで言っておいてアレだけど、
バンドや企業アカウント運用してる身としては
こういうバズったポスト情報を通して
ROM専のユーザーが減って、
推しのためにエンゲージメントする人が増えるなら
願ったり叶ったりだったりする。
別に正しいロジックが
一般で広まらなくてもいいしね。
99%の人は
SNSなんか適当に見てるでしょ。
ただ、その情報を悪用して
信者を洗脳して囲ったり、
商材にして儲けようとする輩が
絶対に出てくるから。
それは避けていきたいよね。
それだけの話。
↓
今回の話が勉強になったら
保存して、周りの人にも教えてやってください。
今後も「今のXでやるべきこと」を
発信していくから注目よろしくです。
↑
ここが重要な箇所です。 December 12, 2025
回顾一下今年的Vibe Coding之旅,大概分成三个阶段
Cursor → Claude Code → Claude Code
0) 24年-25年交接时,claude 3.5Sonnet 在逻辑推理能力已经很厉害了,在2024年底当时的几个主流模型里已经非常惊艳,当时我已经用它做了一些defi复杂机制函数的实现。还有小游戏旧代码的复刻移植。基本能达到我的预期。
1) 所以在元旦之后,土豆幸存者的第一版就是半人工/半Vibe出来的。那个时候我还是手搓的后端,只有链上充值机制轮询/防作弊方案还有一些比较繁琐的增删改查endpoint是用claude的方案。
2) 然后过完年之后的3.7,当时Cursor的额度是挺高的 而且似乎总体都没有降智。但是Cursor当时的幻觉还是很严重,还没有回退历史,一不小心就整页整页代码就被幻觉替换掉了。所以从0构建一个应用心里还是很虚的。有点点进展就要提交github这都是基操。
那个时候ai小镇/ai狼人杀有点火。那个时候就做了一版ai狼人杀,但是当时对agent/token消耗/蒸馏/模型很多概念都不懂。一边查文档一边用vibe code。撸了一个ai狼人杀,是ai之间的互博,不是人机互博。结果还额外充了gpt的api,但是token消耗太快了,就算是自己内测,都烧不起。难怪ai小镇类的产品都是让用户输入自己的apikey。第一次深刻感受就是ai产品创业之不容易。这里且不论训练模型,就单玩测试都是消耗。跟区块链比,那还是区块链适合创业。前端ipfs后端evm空手就能上线。😂
3) 到了年中Opus 4 + Claude Code上线,强是真的强,似乎Cursor就开始涨价了,刚扣了20U不到5天额度就没了。果断切换到了Claude Code,还是20U包月,还能撑一撑。这个时候vibe coding已经可以从0构建web应用的前后端了。然后我想进一步探索ai生成游戏的方向。找到了一些文生图模型,图生3D模型的模型。然后本地部署+接入Web应用。还是那个问题!贵!真的太贵了。为了跑模型我找了huggingface,又交了一笔钱,用包月的共享GPU,用上了牛逼的H200.但是一天只有几分钟的额度。哪怕这样其实ai生成游戏素材还是不理想。如果要自己训练还得持续的算力成本。虽然技术方案都有就摆在那里,奈何财力不允许啊!排了一圈的雷,AI生成商用游戏素材/批量生成素材这个方向的产品要实现还很难。
4) 到了10月前后4.5上线,我早已经升级到99U尊贵会员。最近两个月尝试了好多东西。还有年中我Web界面还是用V0,后面感觉我在claude 4.5用提示词也能做出不错的界面。claude就是天生不会花里胡哨的那些,不过你先找到代码库规定好边界,让他去实现还是OK的。现在我每天都有时间可以复盘创业的思路/运营的思路/生活的事。而且有什么点子马上就可以行动,比如什么自动化交易脚本,回测框架,交易策略,各种以前听起来云里雾里的名词立刻就能得到反馈。哪怕现在说要复刻一个Hyperliquid,从技术上来说,可能我已经在想提示词了。
5) 所以呢,大模型Vibe Coding已经抹平了巨大的信息差,抹平了人性的怠惰,当技术成本趋近于零,idea 到 MVP 的周期从三个月压缩到三天,竞争会从"谁先做出来"变成"谁先想明白"。思考的密度比执行的速度更重要了。真想做一个真的会思考的脑子。🧠🧠 December 12, 2025
本日もお疲れ様です!
【12/6(土)】
React基礎
JavaScriptで抜けていた穴も学習できて良い
【今日やったこと】
・朝作業
・ジャーナリング
・タスク報告
・YouTube確認
・GitHub更新
・Duolingo
・英語リスニング
・Webサイト制作
・個人開発(Blender)
【明日やること】
・朝作業
・ジャーナリング
・タスク報告
・YouTube確認
・GitHub更新
・Duolingo
・英語リスニング
・Webサイト制作
・個人開発(Blender)
【現在のやることリスト】
・読書
・作品制作
・個人開発(Blender × UnrelEngine)
・Webサイト制作
・ゲーム制作(Unity)
【英語】
Learning React basics has been great because it also helped me fill in the gaps I had in JavaScript.
【文法】
・Learning React basics(S): 動名詞句で主語「React基礎を学習すること」。
・has been(V): 現在完了形の動詞「である」。経験や継続を表す。
・great(C): 補語「素晴らしい、良い」。
・because(接続詞): 理由を表す接続詞「なぜなら~だから」。
・it(S): この節の主語。"Learning React basics" を指す。
・also(副詞): 「また、同時に」。追加の意味を強調。
・helped(V): この節の動詞「助けた、可能にした」。過去形。
・me(O): この節の目的語「私に」。
・fill in the gaps(原形不定詞): "help + O + 原形不定詞" の構文。「穴を埋める」。
・I had in JavaScript(関係代名詞節): "the gaps" を修飾する節。関係代名詞 "that/which" が省略されている。「JavaScriptにおいて私が持っていた(穴)」。 December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



