ai-local-lab

計測詳細

RTX A6000 48GB ワークステーション × Qwen2.5 7B Instruct

モデル情報

Qwen2.5 7B Instructのモデル情報
パラメータ数7.6B
ライセンスApache-2.0
商用利用
配布元https://huggingface.co/Qwen/Qwen2.5-7B-Instruct

計測データ

RTX A6000 48GB ワークステーションにおけるQwen2.5 7B Instructの計測一覧
量子化ランタイムtok/sTTFT(ms)合計時間(ms)入出力トークン温度(℃)消費電力(W)計測日備考
F16ollama 0.30.845.11725843112 / 25669271.82026-06-18ollama API実測(2回平均・num_predict=256・温度は計測中の最大値)
Q4_K_Mollama 0.30.8117.41512332112 / 25657250.92026-06-18ollama API実測(2回平均・num_predict=256・温度は計測中の最大値)
Q8_0ollama 0.30.877.21613476112 / 25662260.72026-06-18ollama API実測(2回平均・num_predict=256・温度は計測中の最大値)

※ 数値はすべて自前機材での実測です(ollama API・2回平均・num_predict=256)。