ai-local-lab

計測詳細

RTX A6000 48GB ワークステーション × Mistral 7B Instruct v0.3

モデル情報

Mistral 7B Instruct v0.3のモデル情報
パラメータ数7.2B
ライセンスApache-2.0
商用利用
配布元https://huggingface.co/mistralai/Mistral-7B-Instruct-v0.3

計測データ

RTX A6000 48GB ワークステーションにおけるMistral 7B Instruct v0.3の計測一覧
量子化ランタイムtok/sTTFT(ms)合計時間(ms)入出力トークン温度(℃)消費電力(W)計測日備考
F16ollama 0.30.828.8768965141 / 25677269.62026-06-21ollama API実測(2回平均・num_predict=256・温度は計測中の最大値)
Q4_K_Mollama 0.30.8114.8472278141 / 25679254.62026-06-21ollama API実測(2回平均・num_predict=256・温度は計測中の最大値)
Q8_0ollama 0.30.873.7533527141 / 25679265.82026-06-21ollama API実測(2回平均・num_predict=256・温度は計測中の最大値)

※ 数値はすべて自前機材での実測です(ollama API・2回平均・num_predict=256)。