新世代エッジHWでローカルLLMは速くなるのか【AI PC/NPU/Thor】

「AI PCを買えばローカルLLMが速く動く」——2026年の新世代ハードを巡る最大の誤解です。Copilot+ AI PCのNPU、大容量ユニファイドメモリ機、そして新登場のJetson Thor。本記事は、これら新世代エッジHWでローカルLLMの生成速度は実際どう変わるのかを、TOPSの誇大とメモリ帯域の現実を踏まえて整理し、結局2026-2027に何を買うべきかを用途別に示します。

速度の大原則はローカルLLMは帯域律速で詳説しています。本記事はその“法則”を新世代HWに当てはめた実践編です。

① AI PC（Copilot+/NPU）― 速くはならない

NPUのTOPS（40+でCopilot+認定）は、ローカルLLMの生成速度をほとんど予測しません。理由は2つ。

LLMの生成は帯域律速で、TOPS（小型・低精度演算のピーク値）ではない。
主要ランタイム（ollama/llama.cpp）はNPUを使わず、GGUFモデルはCPU/iGPUに回る。

実測の落差は明確です。Snapdragon X Eliteでは8BがCPU実行で約5〜10 tok/sなのに対し、中古のRTX 3090は同じ8Bを約100 tok/s——帯域が 約936 GB/s 対 Copilot+ノートの約135〜152 GB/s と桁違いだからです。根拠: AI PC・NPUの実力 2026 / NPU vs GPU 2026

NPUは「バッテリーと、小型・常時起動のWindows AI機能」の話で、ローカルLLMを速く回す手段ではありません。同じ「TOPSが大きいNPU＝LLMが速い」の神話は、エッジでもエッジSLMランキング（AI HATのTOPSはCNN画像に効くがLLMには無効）で実測済みです。

数値は他社実測の引用（要検証）。当サイトでは AI PC（NPU）は未計測です。

② 大容量ユニファイドメモリ機 ― “載る”が“速い”ではない

128GB級の大容量メモリ機は、大型モデルを“載せる”のに有効ですが、“実用速度で動く”かは帯域次第です。

機材	メモリ	メモリ帯域（公称）	位置づけ
AMD Ryzen AI Max+ 395	128GB	256 GB/s	大型を安価に“載せる”。速度は控えめ
NVIDIA DGX Spark	128GB	273 GB/s	開発者向け。70Bは帯域で頭打ち
Mac Studio M3 Ultra	512GB	約800 GB/s	巨大モデルを載せられる稀有な選択

いずれも演算(TOPS)は十分でも、70B級の生成速度は帯域で決まります（1000 TOPSのDGX Sparkが70Bで遅い理由は帯域律速の記事へ）。「大型が載る」と「速い」を分けて考えるのが鉄則です。大型モデルの現実は巨大モデルをローカルで動かすにも。

表の帯域・TOPS値（DGX Sparkの1000 TOPS含む）は各社の公称値で、当サイトの機材データ＝動くか診断に登録の理論値機材に準拠します。

③ Jetson AGX Thor ― 100B+をエッジへ（ただし用途特化）

2026年に登場したJetson AGX Thorは、エッジAIの新世代旗艦です。

128GB LPDDR5X（256bitバス・公称 273 GB/s）、2070 FP4 TFLOPS、消費電力 40〜130W、Blackwell GPU。根拠: NVIDIA Jetson Thor
開発キットは 約$3,499。根拠: Hackster（$3,499）
VLA（Vision-Language-Action）・VLM・LLM を Jetson AI Lab 経由で動かせ、フィジカルAI／ロボティクス向けに設計。根拠: NVIDIA Newsroom

注目は、帯域273GB/sがDGX Spark並みな点。128GBで100B+を“載せられる”一方、純粋なLLM生成速度は容量ほど劇的には伸びません（帯域律速）。Thorの真価はロボット・組み込みでVLA/VLMを低消費電力で常時動かすことにあります。エッジでのVLM活用は、次に予定している「ローカルVLM×地図/現場」記事で深掘りします。Jetsonの省電力・組み込みでの実力はJetson Orin Nano Superの実測へ。

Thorの数値はNVIDIA公称（新製品・当サイト未実機）。価格・流通は変動します（要検証）。

結局、2026-2027に何を買うか

目的	最適	理由
とにかく速く	ディスクリートGPU（RTX）	帯域が高く、フラッグシップAI PCより安いことも多い
モバイル・常時起動の軽いAI	Copilot+ AI PC	NPUは省電力。ただしLLM速度は期待しない
大型モデルを“載せたい”	大容量ユニファイド機	速度は妥協。Mac Studio等
ロボ・組み込み・VLA	Jetson Thor	低消費電力でVLA/VLMを常時

速さ最優先なら、結論は今もディスクリートGPUです。

速さの基準・大型も: Amazonで見る広告・Amazon ／楽天で見る広告・楽天
帯域最上位を取る: Amazonで見る広告・Amazon ／楽天で見る広告・楽天
省電力・常時起動の入口: Amazonで見る広告・Amazon ／楽天で見る広告・楽天

GPUの細かな選び方は自宅GPUの選び方、用途別の最適な1台はローカルAI機材の選び方、手元構成での可否は動くか診断と検証DBで確認できます。

まとめ

AI PCのNPUはローカルLLMを速くしない（バッテリー用途・小型常時起動向け）。速度は帯域で決まる。
大容量ユニファイド機は**“載る”が“速い”ではない**。容量と帯域を分けて考える。
Jetson Thorは100B+/VLA/VLMをエッジへ運ぶ新世代だが、ロボ・組み込み特化で、純LLM速度の万能機ではない。
速さ最優先は依然ディスクリートGPU。新世代HWは「用途が合えば」効く。

本記事のNPU/Thor等の数値は他社実測の引用・メーカー公称（当サイト未実機・要検証）で、量子化・測定条件が混在します。自前実測の速度・電力は検証DB、手元での可否は動くか診断でご確認ください。