talk about ラジオ
0post
2025.12.05 23:00
:0% :0% (-/-)
人気のポスト ※表示されているRP数は特定時点のものです
Maybe we can talk about the deal… nice and slow?
ゆっくり契約の話でも…
イライラじゃない飲酒喫煙もいつか見たいですね。胸も開けといてくれ https://t.co/wlmdRejdDC December 12, 2025
5RP
【カスタムポリシー対応の推論型コンテンツ安全性モデル】
NVIDIAがHugging Face上でNemotron Content Safety Reasoning 4Bを公開した。Gemma-3-4B-itをベースとした4Bパラメータのコンテンツ安全性ガードレールモデルであり、開発者が自然言語で記述したポリシーをそのまま読み込んで判定に使えることが特徴である。単一の汎用ポリシーで有害コンテンツやジェイルブレイクだけを弾くのではなく、サービスや地域ごとに異なる制約を推論で解釈して運用できる設計となっている。
このモデルは、ポリシー・ユーザープロンプト・(任意の)アシスタントレスポンスという3要素を入力として受け取り、やり取りがポリシーに従っているかを判定し、その理由を1文で返す。推論付きのReasoning Onモードと、理由を省いて低レイテンシで判定するReasoning Offモードを切り替えられるため、カスタムポリシーの精密な検証と、汎用安全性チェックの高速処理を用途に応じて使い分けられる。推論チェーンを1文要約した効率化により、従来の推論型安全モデルと比べ最大40%高速、より大きな推論モデルとの比較では2〜3倍のレイテンシ改善が報告されている。
学習にはNemotron Content Safety Dataset V2とCantTalkAboutThisトピック制御データセットに、Qwen3-32Bなどの推論モデルから抽出した推論トレースを組み合わせたNemotron Content Safety Reasoning Datasetが用いられた。全体で約36Kサンプル・1Bトークン未満という規模ながら、汎用安全性とカスタム安全性の双方で、有害コンテンツ検出のF1スコアは既存モデルと同等以上の性能を示した。モデルとデータセットはNVIDIA Open Model Licenseのもとで提供され、Hugging Face InferenceやvLLM、TensorRT-LLM、SGLangなど主要な推論基盤で動作し、8GB超のGPUで本番運用が可能となる。 December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



