ai-local-lab

計測詳細

RTX A6000 48GB ワークステーション × Llama 3.1 8B Instruct

モデル情報

Llama 3.1 8B Instructのモデル情報
パラメータ数8B
ライセンスLlama 3.1 Community License
商用利用
配布元https://huggingface.co/meta-llama/Llama-3.1-8B-Instruct

計測データ

RTX A6000 48GB ワークステーションにおけるLlama 3.1 8B Instructの計測一覧
量子化ランタイムtok/sTTFT(ms)合計時間(ms)入出力トークン温度(℃)消費電力(W)計測日備考
F16ollama 0.30.843.12146152101 / 25671281.52026-06-18ollama API実測(2回平均・num_predict=256・温度は計測中の最大値)
Q4_K_Mollama 0.30.8111.21992500101 / 25657240.32026-06-18ollama API実測(2回平均・num_predict=256・温度は計測中の最大値)
Q8_0ollama 0.30.873.62003676101 / 25663261.42026-06-18ollama API実測(2回平均・num_predict=256・温度は計測中の最大値)

※ 数値はすべて自前機材での実測です(ollama API・2回平均・num_predict=256)。