ai-local-lab

計測詳細

RTX A6000 48GB ワークステーション × Granite 3.3 8B Instruct

モデル情報

Granite 3.3 8B Instructのモデル情報
パラメータ数8.2B
ライセンスApache-2.0
商用利用
配布元https://huggingface.co/ibm-granite/granite-3.3-8b-instruct

計測データ

RTX A6000 48GB ワークステーションにおけるGranite 3.3 8B Instructの計測一覧
量子化ランタイムtok/sTTFT(ms)合計時間(ms)入出力トークン温度(℃)消費電力(W)計測日備考
Q4_K_Mollama 0.30.8102.2832587147 / 25659259.92026-06-21ollama API実測(2回平均・num_predict=256・温度は計測中の最大値)

※ 数値はすべて自前機材での実測です(ollama API・2回平均・num_predict=256)。