ai-local-lab

計測詳細

RTX A6000 48GB ワークステーション × Llama 3.2 3B Instruct

モデル情報

Llama 3.2 3B Instructのモデル情報
パラメータ数3.2B
ライセンスLlama 3.2 Community License
商用利用
配布元https://huggingface.co/meta-llama/Llama-3.2-3B-Instruct

計測データ

RTX A6000 48GB ワークステーションにおけるLlama 3.2 3B Instructの計測一覧
量子化ランタイムtok/sTTFT(ms)合計時間(ms)入出力トークン温度(℃)消費電力(W)計測日備考
Q4_K_Mollama 0.30.7201.81931462116 / 25655189.72026-06-16ollama API実測(2回平均・num_predict=256・温度は計測中の最大値)

※ 数値はすべて自前機材での実測です(ollama API・2回平均・num_predict=256)。