オフライン
0post
2025.12.01 21:00
:0% :0% (20代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
この作品がお好きでお持ちになりたい先生方、ご注目ください! 🩷
今回の「ホシノイタチ」フィギュアの予約受付は、本日と明日が最終日となります!
今が最後のチャンスです><!
今後開催される韓国のイベントでは、残り10個をオフライン販売する予定です。
URL:https://t.co/14L0zrh7JH
호제비를 좋아하고 소장하고 싶으신 팬분들께 알려드립니다🩷
'호시노 이타치' 피규어 예약이 오늘과 내일로 마감됩니다~!
지금이 마지막 예약 시간이에요 >< !!
향후 행사에서 오프라인으로 마지막 10개만 판매할 예정입니다. December 12, 2025
12RP
今年最後の撮影会
ひとかさぁん♥️はいつも写真を褒めてくれる🥹すごく嬉しいよ
1年間ありがとう♥️来年も宜しくお願いいたします🙇♂️
2025.11.30オフライン特典会品川
#坂井仁香
#超ときめき宣伝部 https://t.co/9JR6A1pZgy December 12, 2025
4RP
強化学習ではスケールによる創発はこれまでみられてなかった。今回、対比強化学習と1000層にも及ぶ深いネットワークを組み合わせることで、スケールによって大きな性能向上が達成し、様々な能力を創発できることが示された。NeurIPS 2025のベストペーパーの一つに選ばれている。
この研究では、対比RL(Contrastive Reinforcement Learning)を使っている。これは報酬は疎(ゴールに到達したら1をもらえて、それ以外は0)、デモデータは不要な手法である。
方策は現在の状態sとゴールgの両方を入力として受け取る。
π(a | s, g)
対比RLはactor-criticに基づく手法であり、criticは状態・行動とゴールがどれだけ一致するかを評価、actorはcriticを最大化するような行動を選択するように学習する。
criticは、「今の状態sでその行動aをとった時、それがゴールgに向かう良い行動か」を評価する。具体的には状態・行動ペアの埋め込みと、ゴール埋め込みのL2距離の形で定義される。
f(s, a, g) = ||Φ(s, a) - Ψ(g)||^2
Φ(s, a):状態・行動埋め込み
Ψ(g):ゴール埋め込み
CriticはInfoNCE目的関数で学習する。バッチ内で同じ軌跡内の正例と、別の軌跡から得られた別の目標g'を負例として、分類学習する。このように強化学習を回帰ではなく分類問題として扱うことがスケール化時の安定化でクリティカルと指摘されている。
ActorはCriticを最大化するように更新される。つまり、Criticが、「今の行動をとることが目標に向かっている」と判断する行動を選ぶように学習する。
InfoNCEは、従来のRLで使われていたTD学習で必要な未来状態の理解を分類問題で代替し、TDの不安定性を回避することで大規模化を成功させたといえる。
従来のネットワークは4ブロックのResNetを利用するが、今回は各ブロック内のdenseLayerを通常の4から64まで増やしたネットワークで検証した。一番大きい実験では256(256*4=1024)まで増やしている。
ネットワーク深さを増やすと、ロボット操作タスクでの性能は2~5倍、迷路系タスクでは20倍、ヒューマノイド系タスクでは50倍の性能改善がみられた
このような性能改善は従来RLではみられなかったものである。
また、深さを増やしていった時、性能は滑らかに改善するのではなく、ある臨界点を超えると突然大きく更新されているのがみられた。
例えば、ヒューマノイドタスクでは深さ4の時は転びながらゴールに向かって体を投げていたものが、深さ16で直立歩行が学習される、深さ256では体を折りたたんではね超えるといったような、これまで報告されていない複雑なスキルが創発されていることが確認された。
今回のスケーリングで重要だったこととして、まずバッチサイズは大きいほどよいことが確認された。バッチサイズは256では足らず、1024や4096が必要だった。これはInfoNCEの負例サンプルが十分ないと未来分布を正確に識別できるような表現がえられないためといえる。
またネットワークの幅と深さを比較すると、深さの方がはるかに効果的であることがわかった。深さにおいてもネットワークのなかではCriticの状態・行動ペアとゴールの埋め込みネットワークの両方を伸ばした時が重要であることがわかった。このように対比RLでは、Criticが重要であり、ActorはCriticの誘導に従いさえすればよいことが示された
また、探索ノイズの有無で性能はほとんど変わらず、今回深さによる未来予測・表現能力の向上が性能向上に起因していることがわかった。
今回うまくいった対比RLはスケール化で性能向上できるだけでなく、従来のRLと比べて次の利点がある
・ブートストラップがなく安定する
・目標が固定
・Q学習のoverestimation(ノイズによって実際よりも良いと誤解した行動をとる)問題がない
・デモを必要としない
コメント
===
対比RL自体は数年前から提唱されていたものだが、今回はネットワークを深くすることで様々な能力が創発し、大きく性能向上されることが示された。
また、今回得られるCriticは非常に応用範囲が広く、汎化することも重要である(直前のサツケバーのコメントにも関連)。このCriticは様々なタスクを意図せず学習する際に、重要な役割を果たしていくだろう。Criticゴール到達予測器というよりも「汎用の未来状態予測器」(今の状態でどの行動をとったら、最終的にどうなるのか)といってもいいのではないだろうか
結果はインパクトが大きいが、まだよくわかっていないことが多い。まず、なぜネットワークの深さをここまですると性能があがるかについてはよくわかっていない。Deep Priorの論文や生成モデルの一部のpaperではdense層の数を非常に多くすると大きな性能向上が達成できるとされた。今回も通常では考えられないほど増やしている。ここまで増やした場合に性能が出るという部分は表現力だけでなく最適化問題としても特徴がでてくるのだと思われる。
また、スケール化による性能向上は、この対比強化学習の枠組みで現れ従来のTD手法では改善がみられないこと、またオフライン環境では効果がみられないこと(予備実験までだが)から、まだ何が決定的な要因なのかの理解にいたっていない。 December 12, 2025
1RP
【試合中のバランス調整について】
この度、ゲーム内バランスの最適化を目的として、
試合中の一部バランスについて調整を実施いたします。
詳細につきましては、ゲーム内お知らせおよび画像をご確認ください。
■バランス調整の適用タイミング
・2025/12/02(火) 01:00ころから
※調整の時間は前後する場合がございます。
オフライン大会やPvP機能の導入を見据え、
より良いゲーム体験のため、ゲームバランスの調整は今後も継続的かつ柔軟に実施してまいります。
お客様にはご不便をおかけする場合がございますが、
ご理解とご協力をいただけますと幸いです。
今後とも『ブルーロック BLAZE BATTLE』をよろしくお願いいたします。 December 12, 2025
1RP
/
📢fweeバスPOPUP終了感謝イベント🚌💛🩵
\
みなさん、1ヵ月間fweeバスPOPUP'旅するストア'にお越しいただき、
誠にありがとうございました!
2万人を超えるたくさんの方々にお越しいただき
大盛況のうちに終えることができました✨
感謝の気持ちを込めて特別なイベントを準備しました👏🏻
この投稿をRTしてくださった方の中から抽選で、
POPUPで一番人気だった話題の🩵下地 02 リッチグロウ💛と、
相性ぴったりの’フィークッションガラスオリジナル’をプレゼントします🎁
🩵参加方法
① fwee公式アカウントをフォロー
② この投稿をいいね
③ この投稿をリポスト🔃
✨この投稿を引用RTして、POPUPで撮った写真を一緒に投稿すると当選率UP!
👉🏻ハッシュタグ必須 【fwee下地】
💛注意事項
- 非公開アカウントは対象外となります
🤫売り切れ常連の「02 リッチグロウ」は、現在オフライン店舗にて販売中!
ぜひfwee下地をお試しください!
※順次発売のため、在庫がない店舗もございます。
※取扱店舗:倭国国内フィーアジト・ロフト・プラザ・ショップイン・アットコスメ・ハンズ December 12, 2025
1RP
もし、XADEがPRIDEとかBLAZEとかUnion、来年とか行けそうだったらStardomとかのオフライン系出るとしたら
俺も行くのはそうだけど、XADEメンバーっていうか自分のメンバーに飯奢るのとか夢だよね December 12, 2025
PR
『M!LK』を聴くならAmazon Music🎵
30日間無料で‼️
ダウンロードでオフライン再生OK🎧
#MILK 佐野勇斗,塩﨑太智,吉田仁人,山中柔太朗,曽野舜太
好きすぎて滅!,イイじゃん,アオノオト,テレバシー
(12/01 21:32)
https://t.co/8jjKRAh6Lb December 12, 2025
ぷみりお西澤さん(非YouTuber)にYouTubeプレミアムのオフライン機能について教わるYouTuber🖊️
これでマダガスカルでもYouTube観れる!最高!!✨ https://t.co/vHN7qvF0tT December 12, 2025
業務報告の付箋と資料を上司に渡したら、
「ありがとう😊」
の手書きメモが返ってきた✍️
手書きって手間だけど、
それでも感謝を伝えたいって
気持ちが感じられ、
思わずニヤけました😁
オンライン秘書への憧れもありますが、
私がオフライン仕事を手放せない理由は
きっとこれです☘️
#リモラボ December 12, 2025
エアライダー、伝説グミはオンラインだと入手が難しいだけでオフラインだと伝説マシンを入手すれば貰えるどころか、NPCが入手した伝説マシンに負けても貰えるのでめちゃめちゃ優しい。 December 12, 2025
オンラインゲームは個人的にクソ面倒だから最近はオフラインソロゲームばかりやってる、ゲームやってても人付き合いとか本当に面倒。昔はアホみたいにやってたんだけどね。アークレイダースってゲームは気になるんだけど、PvPがクソウザそう、PvE専用モードがあれば、ソロでマッタリできるのに。 December 12, 2025
去年の12/1のオフラインで しおんのおかげで人生がめっちゃ楽しくて〜とお気持ち表明したら感謝してくれた上でお金の心配してくれたんだけど、ブーメランすぎるし世界変わりすぎ。全部 夢? December 12, 2025
みんなシリアルお疲れ様でした!
WithU盤コンプとシリアルのオフラインでリクコンプ出来てほんまよかった🥲
あとRISE UP、AWAKE、LOVELINEから続いてる全サ皆勤記録も継続できて良かった👍
来年まじ楽しみすぎるぅぅぅぅ
#NiziU_当選 https://t.co/ZO6UYNBIJQ December 12, 2025
ゆきむら。さんただいまです!
配信長時間されてたのかな?お疲れ様でした( . .)
仕事20時20分に終わって通知見たらメンシプしてくださってたのですね😭
開いた瞬間、オフラインになっていて、「あ、タイミング🥲」ってなってました💦
ゆきむら。さんの声聞きたかった、 December 12, 2025
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。




