ai-local-lab

計測詳細

RTX A6000 48GB ワークステーション × Llama 3.2 1B Instruct

モデル情報

Llama 3.2 1B Instructのモデル情報
パラメータ数1.2B
ライセンスLlama 3.2 Community License
商用利用
配布元https://huggingface.co/meta-llama/Llama-3.2-1B-Instruct

計測データ

RTX A6000 48GB ワークステーションにおけるLlama 3.2 1B Instructの計測一覧
量子化ランタイムtok/sTTFT(ms)合計時間(ms)入出力トークン温度(℃)消費電力(W)計測日備考
Q8_0ollama 0.30.7315.8182992116 / 25653144.92026-06-16ollama API実測(2回平均・num_predict=256・温度は計測中の最大値)

※ 数値はすべて自前機材での実測です(ollama API・2回平均・num_predict=256)。