Skip to content
0
/ Ollama/Benchmark
6/1/2026
1m
AI 摘要

对比 lazy-cat-pod 上多款 Ollama qwen3 模型的 token/s 输出速度,固定数学题与 Open WebUI 测试,附 gist 与推理能力备注。

基准测试

测试 ollama 在不同设备上的输出 token 速度性能

测试问题测试软件
3个人3天用3桶水,9个人9天用几桶水?请写出步骤Open WebUI

lazy-cat-pod

测试模型response_token/s输出内容备注
qwen3.5:9b19.84token/sgist
qwen3.5:4b26.76token/sgist
qwen3.5:0.8b29.86token/sgist推理能力极弱,思考就有一千二百行
qwen3:14b13.83token/sgist
qwen3:8b24.55token/sgist
qwen3:4b35.43token/sgist
qwen3:1.7b72.71token/sgist

Released under the MIT License.