6/1/2026

AI 摘要

对比 lazy-cat-pod 上多款 Ollama qwen3 模型的 token/s 输出速度，固定数学题与 Open WebUI 测试，附 gist 与推理能力备注。

基准测试

测试 ollama 在不同设备上的输出 token 速度性能

测试问题	测试软件
3个人3天用3桶水，9个人9天用几桶水？请写出步骤	Open WebUI

lazy-cat-pod

测试模型	response_token/s	输出内容	备注
qwen3.5:9b	19.84token/s	gist
qwen3.5:4b	26.76token/s	gist
qwen3.5:0.8b	29.86token/s	gist	推理能力极弱，思考就有一千二百行
qwen3:14b	13.83token/s	gist
qwen3:8b	24.55token/s	gist
qwen3:4b	35.43token/s	gist
qwen3:1.7b	72.71token/s	gist