技术规格
大小
397 MB (0.6B) 至 2.5 GB (4B)
架构
GGUF 格式 LLM (Q4_K_M 量化)
延迟
快速 (在 Apple Silicon 上为 80-120 token/秒)
作用
格式化整理与语法修复
开发者 / 创作者
Alibaba Group (阿里巴巴) / llama.cpp 社区
下载来源
模型概览
Qwen 3 是一系列轻量化、高性能的语言模型(参数量从 0.6B 到 4B),使用 GGUF 格式在本地进行文本整理。在 tapWhisper 中,启用“语音转文字 + LLM 格式化”会启动一个常驻的、仅限本地 localhost 的 llama.cpp 服务器。Qwen 会在设备端对原始语音输出进行润色:添加标点、修正语法、格式化代码。
可用模型版本
| 模型版本 | 文件大小 | 内存占用 | 格式/量化 | 支持语言 | 说明 |
|---|---|---|---|---|---|
| Apple Built-in Cleanup | 0 MB | 0 MB | System API | 英语 | 内置的本地文本整理系统,适用于基础语法和空格纠正。 |
| Small (Qwen 3 0.6B) ⭐ | 378 MB | 650 MB | Q4_K_M (GGUF) | 多语言 | 默认推荐的格式化程序。极速修复语法、标点和编程排版。 |
| Medium (Qwen 3 1.7B) | 1.03 GB | 1.5 GB | Q4_K_M (GGUF) | 多语言 | 增强的本地语言解析。适用于复杂的结构性文本重组。 |
| Large (Qwen 3 4B) | 2.33 GB | 3.2 GB | Q4_K_M (GGUF) | 多语言 | 准确率最高且完全离线的文本格式化模型。需要性能较强的 Mac (8GB+ 内存)。 |