ベンチマーク トレンド
0post
2025.11.17〜(47週)
:0% :0% (30代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
エヌビディア $NVDA
2026年度Q3決算を発表‼️
Blackwellの圧倒的な需要により過去最高の業績を達成🚀
株価は時間外取引で4.4%上昇📈
🔸FY26 Q3業績(10月26日終了)
⭕️EPS: 1.30ドル(予想1.26ドル)
⭕️売上高: 570.1億ドル(予想550.9億ドル)
📈売上高成長率: +62% Y/Y, +22% Q/Q
🔸FY26 Q4ガイダンス
⭕️売上高: 650億ドル±2%(予想618.4億ドル)
📈売上高成長率: +70% Y/Y, +14% Q/Q
🔸部門別売上高(Q3)
📈コンピュート&ネットワーキング: 509.1億ドル(+64% Y/Y, +23% Q/Q)
📈グラフィックス: 61.0億ドル(+51% Y/Y, +13% Q/Q)
🔸市場プラットフォーム別売上高(Q3)
📈データセンター: 512.2億ドル(+66% Y/Y, +25% Q/Q)
- コンピュート: 430.3億ドル(+56% Y/Y, +27% Q/Q)
- ネットワーキング: 81.9億ドル(+162% Y/Y, +13% Q/Q)
📈ゲーミング: 42.7億ドル(+30% Y/Y, -1% Q/Q)
📈プロフェッショナルビジュアライゼーション: 7.6億ドル(+56% Y/Y, +26% Q/Q)
📈オートモーティブ: 5.9億ドル(+32% Y/Y, +1% Q/Q)
🔸財務ハイライト
✔️営業キャッシュフロー: 237.5億ドル(+35% Y/Y, +55% Q/Q)
✔️フリーキャッシュフロー: 220.9億ドル(+32% Y/Y, +64% Q/Q)
✔️現金・現金同等物・有価証券: 606億ドル(前年385億ドル、前四半期568億ドル)
✔️売掛金: 334億ドル、回収日数53日(前四半期54日)
✔️在庫: 198億ドル(前四半期150億ドルから増加)
✔️供給関連コミットメント: 503億ドル
✔️複数年クラウドサービス契約: 260億ドル(前四半期126億ドルから急増)
✔️株主還元: 127億ドル(自社株買戻125億ドル、配当2.4億ドル)
✔️自社株買戻承認枠の残高: 622億ドル(第3四半期末時点)
🔸事業ハイライト
✔️Blackwell Ultraが全顧客カテゴリーで主力アーキテクチャに
✔️Blackwellの前世代製品も引き続き堅調な需要
✔️H20の売上はQ3で微小レベル
✔️NVLink compute fabricの導入と成長によりネットワーキング売上が前年比162%増
✔️OpenAIと戦略的パートナーシップを発表、最低10ギガワットのNVIDIAシステムを展開
✔️Anthropicが初めてNVIDIAインフラで稼働・スケール、1ギガワットの計算容量を採用
✔️米国内のTSMCアリゾナ施設で最初のBlackwellウェハーを生産
✔️NVIDIA Rubin CPXを発表、大規模コンテキスト処理専用の新クラスGPU
✔️NVIDIA BlueField-4を発売、AIファクトリーのOSプロセッサ
✔️MLPerf Inference v5.1ベンチマークでBlackwell Ultraが記録を樹立
🔸利益率の動向
✔️GAAP粗利益率: 73.4%(前年74.6%から1.2pt低下、前四半期72.4%から1.0pt上昇)
✔️Non-GAAP粗利益率: 73.6%(前年75.0%から1.4pt低下、前四半期72.7%から0.9pt上昇)
✔️GAAP営業費用: 58.4億ドル(+36% Y/Y, +8% Q/Q)
✔️Non-GAAP営業費用: 42.2億ドル(+38% Y/Y, +11% Q/Q)
✔️GAAP実効税率: 15.9%(前年から上昇)
✔️Non-GAAP実効税率: 17.1%
✔️Hopper HGXシステムからBlackwellフルスケールデータセンターソリューションへの移行により前年比で粗利益率は低下
✔️Blackwellの量産拡大とミックス・コスト構造の改善により前四半期比では粗利益率が上昇
✔️営業費用の増加は、コンピュートおよびインフラコスト、報酬増加と従業員増加による人件費、新製品開発コストが主因
🔸CEOコメント(Jensen Huang氏)
「Blackwellの売上は桁違いで、クラウドGPUは売り切れています。トレーニングと推論の両方でコンピュート需要が加速し続け、それぞれが指数関数的に成長しています。私たちはAIの好循環に入りました。AIエコシステムは急速にスケールしており、より多くの新しい基盤モデルメーカー、より多くのAIスタートアップが、より多くの業界、より多くの国で誕生しています。AIはあらゆる場所で、あらゆることを、同時に行っています。」
🔸会社概要
NVIDIAは、AIと高速コンピューティングの世界的リーダーです。
データセンター、ゲーミング、プロフェッショナルビジュアライゼーション、オートモーティブの4つの大規模市場にプラットフォームを提供し、プロセッサ、インターコネクト、ソフトウェア、アルゴリズム、システム、サービスを統合した独自の価値を提供しています。 November 11, 2025
46RP
Amazonブラックフライデー2025のスマホ部門、現時点で優勝はPOCO X7 Proだと思うwww過去最安にwwwそもそも4万切りはヤバいwwwベンチマークスコアが全てではないが約160万点超え https://t.co/qJJ63DMuum November 11, 2025
26RP
AIのベンチマークを兼ねて作らせたのですが、文学作品を作らせるならGemini3 ProよりもGPT-5 Proの方が強いですね。
なかなか面白いものが出来て、もったいないのでポストします。 https://t.co/9DslaEZIFz November 11, 2025
19RP
これは冗談でやってたけど、なんかGeminiの特徴としてテキストの裏にあるビジョンが見えてる感じがするんだよな。このネタのゴー⭐︎ジャスがオチ前に足バタバタさせるシーンみたいなのも、普通に考えたら実物の映像を見なきゃ書けないはずなんだよ。今回のベンチマークではWeb検索することをモデルに指示してるが、恐らくテキストレベルでここまで細かに挙動を纏めてるリファレンスなんて無いだろうし、オンラインの待ち時間的に動画を取り込んでるとも考えにくい。
となると、事前学習時にマルチモーダルタスクで取り込んでいたゴー⭐︎ジャスの映像が純粋なテキストタスクにおけるトークン生成に良い影響を及ぼしている?事前学習に発展余地があるというのはモダリティ間の好影響が関連してるのか?
正直ガチガチに議論が必要な重厚なテキストタスクに関してはやっぱりGPT-5.1の方が良いし洗練されてる感があるんだけど、もしかしたらGeminiは違う方向性での進化の道を選んで壁を越えようとしてるのかも?と、妄想するなどした。 November 11, 2025
15RP
研究論文『人類最後の試験』2025年1月
https://t.co/yLnnGs9dFD
➢ 最先端AIでも正答率13%、人間の専門家には遠く及ばず
➢ 世界1,000人の研究者が厳選した2,500問の超難問集
➢ 高い自信で間違える「AI幻覚」の実態が数値で明らかに
「モデルは不確実性を認めず、間違った答えに高い自信を示す。 これは深刻な問題だ」研究チーム
AIが既存テストで満点近くを取る時代、真の能力を測る新基準が登場した。世界50カ国の専門家が協力し、検索不能な超難問2,500問で構成されたベンチマークである。最高性能モデルでも正答率は13%にとどまり、AIと人間専門家の間に巨大な壁が存在することが判明した。
🔹 数学中心に全学問分野を網羅
ChatGPTやClaudeは人気の知能テストMMMLUで90%以上のスコアを記録し、もはや能力差を測定できない状況にある。HLE(Humanity's Last Exam)は数学を中心に、生物学、物理学、哲学、法律まで幅広い分野から問題を収録した。多肢選択式と記述式を組み合わせ、自動採点が可能な設計である。全問題は独創的で曖昧さがなく、Google検索では答えが見つからない。大学院や博士課程レベルの深い理解を要求する内容となっている。
🔹 7万回のAIテストで難易度確認
問題作成には厳格な審査プロセスが導入された。各問題は提出前に最先端AIでテストされ、AIが正答できた場合は却下される。7万回以上の検証を経て1万3,000問が専門家レビューに進んだが、最終的に採用されたのは2,500問のみである。第一段階では複数の大学院レベル審査員がフィードバックを提供し、第二段階で主催者と専門家が承認する。公開後もコミュニティから誤りの報告を受け付け、継続的に品質を改善している。
🔹 最高性能O3-MINIでも13.4%
評価結果は衝撃的だった。GPT-4Oの正答率は2.7%、Claude 3.5 Sonnetは4.1%、O1は8.0%、最高性能のO3-MINI(HIGH)でも13.4%にとどまった。さらに深刻なのは「較正誤差」の高さである。これはモデルの自信度と実際の正答率のズレを示す指標で、全モデルで70%を超えた。つまりAIは自分が間違っていることを認識せず、誤答に高い確信を持って答えている。推論モデル(DeepSeek-R1など)は精度がやや高いが、通常モデルの数倍のトークン(計算量)を消費しており、効率面での課題が残る。
📌 専門知識と創造性は別問題
研究チームは、AIの急速な進化を考慮すると2025年末までに50%の正答率を達成する可能性があると予測する。しかし高得点は閉じられた学術問題での能力を示すにすぎず、研究の自律性や汎用知能を意味しない。HLEは構造化された問題を測定するもので、オープンエンドな創造性や実世界の問題解決能力は評価対象外である。
画像:質問の例 これは墓石に刻まれたローマ時代の碑文の再現である。パルミラ文字の翻訳を提供せよ。
参考文献: Humanity's Last Exam - Long Phan et al. (January 2025) November 11, 2025
10RP
LINE元CEO森川氏の「差別化をしたければ、差別化を狙うな。差別化の先に見えているのはユーザーではなくライバル企業だから。ベンチマークした商品のユーザーにとって最も重要な価値だけにフォーカスし、磨き上げる。それが結果的に真の差別化を生み出す」という言葉が突き刺さる。
「他社がこれやっているから、差別化を狙うためにうちはこうしよう」
これはユーザーを見ず、ライバルしか見てない。
結果、ユーザーが求めてないものを作ってしまう。
楽天モバイルが追及するのは「ユーザーにとって最も重要な価値」。
それは何か。
「シンプルな料金プランで全キャリア最安値。」
これだけ。
音声+データ無制限で税込3,278円。
余計な機能を足さず、複雑なプランを作らない。
その結果、差別化を狙ってないのに、一番差別化されてる。
ライバルを見ず、ユーザーにとって最も重要な価値だけを磨く。
それが、究極の差別化ということ。 November 11, 2025
10RP
そうなんですよね、
Gemini 3が飛躍的な進化を遂げたのは間違いない事実で、それでもなんだかんだ『ベンチマークの数字から想像される有用さと実運用した時の有用さのギャップ』が大きいのがGeminiで、その逆がGPTみたいな感じなんですよね。
一消費者としては全部便利に使わせてもらうだけですがw https://t.co/qC1R6RbFwM November 11, 2025
8RP
「Battlefield 6」を快適にしたい! 全20種類のGPUでベンチマーク対決。ボーナスで買うグラフィックスカードはどれか
https://t.co/bROo3SHdoO
年末商戦で買うグラフィックスカードはどれか? BF6で性能対決を実施してみた https://t.co/HGTxs8vLke November 11, 2025
8RP
ベンチマークも計ってみようと思う届いたら
ぜひ皆この記事だけでもいいねとRTして欲しい
全文読んでくれ!目が飛び出るぞ!!
https://t.co/3C8hPsa3vv
#SHEIN #アリエクスプレス #aliexpress November 11, 2025
7RP
は?Gemini3.0やばい😱
めっちゃざっくりの指示しかしてないし、プロンプト出力しかお願いしてないのに完成系出してきた。
サムネのクオリティ高すぎん??文字も潰れてないし!!
GPTのベンチマーク超えたって聞いてたけど流石すぎます👏👏👏もうGEMINIに乗り換えるGPTばいばい https://t.co/H9fgJXw2O6 November 11, 2025
7RP
🚨 完全ではない
Gemini3、本当に素晴らしいモデルですが
実はいくつか課題もあります
私の感じている3点について
☑️ 1. ハルシネーション
実はGemini2.5 時代から課題になっていたハルシネーションは特に改善されていなかったりします
上手くハマると、他にない細かいUIを作ってくれるなど最強ですが、たまにとんでもない方向に走るのが気になるかも。気になるなら複数スレッドで試すのが良い
☑️ 2. ターミナル利用本当に良い?
公式のベンチマークでは、ClaudeやOpenAIのモデルと比較しても優れているとのことでしたが、 @_valsai や @ArtificialAnlys の指標によると 最強ではない模様
私自身開発していても、超快適というわけではない(※でも上位だし最高のモデルです)
☑️ 3. GPT5.1 系とは出力の味が違う
Geminiモデルは、HLE などのベンチマークにおいて他を大きく引き離す性能を示しており、本質的な問いに対しても鋭い回答を返してくれます
これは課題というより「味」の違いですが、OpenAI のモデルがシンプルで分かりやすい印象なのに対して、Gemini は全体的に説明的で情報量が多い印象があります。 直感的に使いやすいのが OpenAI、詳細まで踏み込んでくれるのが Gemini、といった対比ができそうです。 November 11, 2025
6RP
#note #AI創作論 #Gemini3 #chatgpt5 #Claude
「作者が意図せず書いた“執着トリック”を Gemini 3 がBL文脈で正確に解析してきた件」@BubblecubeIhika #AIとつくってみた
ベンチマークテスト第2弾
あのClaude先生が敗北宣言?!
BLも読めるぞGemini3!
今回長文です
https://t.co/PSMJn2NCcH November 11, 2025
5RP
あと、起業家のイグジットが目立つようになり、「サクッと調達して売却して億万長者」は、そんなに甘くないし、あなたがベンチマークしているストーリーの起業家は創業当初上場を当たり前に社会的にインパクトがあるスタートアップになりたかった人も多いことも忘れてはならない。もともと売却ストーリーで狙ってやった会社ばかりではないですよ。 November 11, 2025
5RP
香川のうどんタクシーをベンチマークして、「パンタクシー」を導入した大田市。車内で食べれるようにテーブルも付いてるし、人気パン屋にはドライバーが代わりに並んでくれるそうな。
本気でパンの街を目指してる都市らしい取り組みだね。 https://t.co/SdROYphhC2 November 11, 2025
5RP
多くの主要AIベンチマークで最高スコアを達成している、現時点で人類最高の叡智「Grok4.1」に、私が次に描くべきジャンルを相談した結果がこちら https://t.co/rY8BKQqqq9 November 11, 2025
3RP
多分後で消すからパソコンの話していいか
僕は今Mac Pro(2019)をメインで使ってるんだよね
買った当時は相当高価だったけどしばらく買い替えの必要もなく一線で使えるだろうと思って。
そう思ってたら2020年にMacはIntelCPUやめたの
Apple SiliconのMacがどんどん出てきたのを指咥えて見てたわけ
で、最近出たMacBook Pro。CPU(SoC)はM5。
僕が当時Mac Pro買った時の値段の半額以下で、
ベンチマークが倍近い性能なの。
技術の進化どうなってるのおかしいやろついていけねえよ
でも買い換えないと最近のMacはApple Silicon前提の機能多いのに使えない。
僕割と新しいもの好きではあるんだけど、僕の財布事情を鑑みてもう少しゆっくり進化してほしい November 11, 2025
3RP
ちゃんとしたMMTの主張のまとめ(ChatGPTによる推敲)
⸻
■ MMTの主張
① 通貨建ての政府支出が先行していなければ、そもそも納税も国債発行も不可能である。
したがって、税も国債も「財源」や「資金調達手段」であるはずがない。政府は支出のために資金調達を必要としない。
ゆえに、「国債が買われないと通貨の信認が〜」という類の議論は根本から的外れである。
② 通貨とは本質的に “税額控除(Tax credit)” である。
人々が通貨を受け取るのは、それによって税義務を清算できるからに過ぎない。
③ 税はインフレ調整弁ではない。
税の本来の役割は、通貨(=税額控除)建ての賃金労働を標準化し、政府およびその傘下組織が共通単位(例:円・ドル・人民元など)で財・サービス・労働の貸借を行う制度を確立することにある。
同時に、政府傘下の組織に対し、生存に必要な購買力を上回る価格で生産・労働を行わざるを得ない環境をつくる(=政府が課した税を支払うために通貨を稼がせる)という目的も担う。
④ ③の制度の下で、政府傘下組織が生産したが購入されず余った財・サービス・労働を、中央政府が政策目的のために “現在の価格で” 買い上げるだけなら、裁量的な財政支出ではインフレにはならない。
⑤ 逆に、政府が政府傘下の組織と同じ財・サービス・労働を取り合う状況になると問題が起きる。
政府が確実に購入するために、傘下組織が提示できないほど高い価格を提示すると、その価格が当該財・サービス・労働の「下限(フロア)」になる。
このフロア価格は関連分野にも波及し、物価全体を押し上げる。
したがって、インフレを回避しつつ裁量的財政支出を行うには、政府支出が他の政府傘下組織と 競合しない余剰資源 を対象とする必要がある。
これは、官民の実物投資による生産コスト低下→余剰供給の増大・維持管理コストの低い財への転換・労働ボトルネックの解消などによって実現可能である。
⑥ 最終的に、政府が財・サービス・労働を購入するときの「提示価格」こそが、その国の物価水準の基準(ベンチマーク)になる。
民間はこの基準に追従せざるを得ず、政府の購買価格が物価体系の土台を形成する。
⸻
MMTはこのルールを前提とした理論。これに基けば「国債って本当に必要なの?」「財政支出と国債って全然関係ないんじゃない?」という疑問が浮かぶと思う。
それからMMTが一丁目一番地にしているJGP(ジョブ・ギャランティ・プログラム)が、ある一定額の賃金で雇用を用意し続け、その賃金額を下限に収束させる(民間の法人企業はJGP以上の賃金を提示しないと基本的に人を雇えないから)ことで、ボトムアップ的に賃金水準を上げつつ、労働力のボトルネック(技術不足など)を解消しようという制度、という理解にもつながると思う。 November 11, 2025
3RP
Gemini 3 Proの得意タスク!ベンチマーク結果から読み解くGemini3特性「実務での使いどころ」|佐藤源彦@MBBS @wish_society https://t.co/jkY3MeKnOV
独自ベンチマークによる解説は動画後半でやっています!
https://t.co/gkllB4KqhI
#Gemini3 #生成AI #AIライティング #SVG #図解生成 #コーディング #プロンプト #ベンチマーク #AIエージェント #性能 #使い方 #antigravity #GeminiCLI #アンチグラビティ #gemini #ナノバナナ #gemini3 #note November 11, 2025
2RP
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



