Skip to content
0
/ Ollama/Benchmark
3/17/2026
1m
AI 摘要

基准测试显示,qwen3.5:0.8blazy-cat-pod环境下输出速度为29.86token/s,但推理能力较弱。其他模型如qwen3:1.7b输出速度达72.71token/s。

基准测试

测试 ollama 在不同设备上的输出 token 速度性能

测试问题测试软件
3个人3天用3桶水,9个人9天用几桶水?请写出步骤Open WebUI

lazy-cat-pod

测试模型response_token/s输出内容备注
qwen3.5:9b19.84token/sgist
qwen3.5:4b26.76token/sgist
qwen3.5:0.8b29.86token/sgist推理能力极弱,思考就有一千二百行
qwen3:14b13.83token/sgist
qwen3:8b24.55token/sgist
qwen3:4b35.43token/sgist
qwen3:1.7b72.71token/sgist

Released under the MIT License.