ai-local-lab

計測詳細

RTX A6000 48GB ワークステーション × Qwen2.5 32B Instruct

モデル情報

Qwen2.5 32B Instructのモデル情報
パラメータ数32.8B
ライセンスApache-2.0
商用利用
配布元https://huggingface.co/Qwen/Qwen2.5-32B-Instruct

計測データ

RTX A6000 48GB ワークステーションにおけるQwen2.5 32B Instructの計測一覧
量子化ランタイムtok/sTTFT(ms)合計時間(ms)入出力トークン温度(℃)消費電力(W)計測日備考
Q4_K_Mollama 0.30.830.61958576112 / 25668286.52026-06-21ollama API実測(2回平均・num_predict=256・温度は計測中の最大値)

※ 数値はすべて自前機材での実測です(ollama API・2回平均・num_predict=256)。