計測詳細
RTX A6000 48GB ワークステーション × Llama 3.1 8B Instruct
モデル情報
| パラメータ数 | 8B |
|---|---|
| ライセンス | Llama 3.1 Community License |
| 商用利用 | 可 |
| 配布元 | https://huggingface.co/meta-llama/Llama-3.1-8B-Instruct |
計測データ
| 量子化 | ランタイム | tok/s | TTFT(ms) | 合計時間(ms) | 入出力トークン | 温度(℃) | 消費電力(W) | 計測日 | 備考 |
|---|---|---|---|---|---|---|---|---|---|
| F16 | ollama 0.30.8 | 43.1 | 214 | 6152 | 101 / 256 | 71 | 281.5 | 2026-06-18 | ollama API実測(2回平均・num_predict=256・温度は計測中の最大値) |
| Q4_K_M | ollama 0.30.8 | 111.2 | 199 | 2500 | 101 / 256 | 57 | 240.3 | 2026-06-18 | ollama API実測(2回平均・num_predict=256・温度は計測中の最大値) |
| Q8_0 | ollama 0.30.8 | 73.6 | 200 | 3676 | 101 / 256 | 63 | 261.4 | 2026-06-18 | ollama API実測(2回平均・num_predict=256・温度は計測中の最大値) |
※ 数値はすべて自前機材での実測です(ollama API・2回平均・num_predict=256)。