検証DB
機材×モデル×量子化×ランタイムの組み合わせごとに、デコード速度(tok/s)・初回トークン応答時間(TTFT)・計測中の最高温度を記録しています。機材名・モデル名から各詳細ページへ移動できます。
※ 数値はすべて自前機材での実測です(ollama API・2回平均・num_predict=256)。
7件 / 全7件
| 機材 | モデル | 量子化 | ランタイム | tok/s | TTFT(ms) | 温度(℃) | 計測日 |
|---|---|---|---|---|---|---|---|
| RTX A6000 48GB ワークステーション | Gemma 4 26B (A4B) | Q4_K_M | ollama 0.30.7 | 99.6 | 407 | 64.0 | 2026-06-12 |
| RTX A6000 48GB ワークステーション | LFM2.5 8B A1B | Q4_K_M | ollama 0.30.7 | 283.9 | 205 | 61.0 | 2026-06-12 |
| RTX A6000 48GB ワークステーション | Qwen3.5 4B | Q4_K_M | ollama 0.30.7 | 123.5 | 313 | 60.0 | 2026-06-12 |
| RTX A6000 48GB ワークステーション | Qwen3.6 35B (A3B) | Q4_K_M | ollama 0.30.7 | 122.1 | 314 | 67.0 | 2026-06-12 |
| Jetson Orin Nano Super 8GB | Qwen3.5 4B | Q4_K_M | ollama 0.21.2 | 9.3 | 1322 | 57.7 | 2026-06-12 |
| Raspberry Pi 5 8GB | Qwen3.5 2B | Q8_0 | ollama 0.24.0 | 2.2 | 4863 | 51.8 | 2026-06-12 |
| Raspberry Pi 5 8GB | Qwen3.5 4B | Q4_K_M | ollama 0.24.0 | 1.7 | 25681 | 55.6 | 2026-06-12 |