tapWhisper — 阿里 Qwen 3 格式化模型

技术规格

大小 397 MB (0.6B) 至 2.5 GB (4B)

架构 GGUF 格式 LLM (Q4_K_M 量化)

延迟快速 (在 Apple Silicon 上为 80-120 token/秒)

作用格式化整理与语法修复

开发者 / 创作者

Alibaba Group (阿里巴巴) / llama.cpp 社区

许可证

Apache-2.0 (Qwen 3 GGUF); Apple platform terms (built-in cleanup)

下载来源

经验证的仓库来源

Hugging Face 仓库 (通过 tapWhisper 下载器下载)

Unsloth Qwen 3 GGUF repositories

实际运行时文件

模型概览

Qwen 3 是一系列轻量化、高性能的语言模型（参数量从 0.6B 到 4B），使用 GGUF 格式在本地进行文本整理。在 tapWhisper 中，启用“语音转文字 + LLM 格式化”会启动一个常驻的、仅限本地 localhost 的 llama.cpp 服务器。Qwen 会在设备端对原始语音输出进行润色：添加标点、修正语法、格式化代码。

可用模型版本

模型版本	文件大小	内存占用	格式/量化	支持语言	说明
Apple Built-in Cleanup	0 MB	0 MB	System API	英语	内置的本地文本整理系统，适用于基础语法和空格纠正。
Small (Qwen 3 0.6B) ⭐	378 MB	650 MB	Q4_K_M (GGUF)	多语言	默认推荐的格式化程序。极速修复语法、标点和编程排版。
Medium (Qwen 3 1.7B)	1.03 GB	1.5 GB	Q4_K_M (GGUF)	多语言	增强的本地语言解析。适用于复杂的结构性文本重组。
Large (Qwen 3 4B)	2.33 GB	3.2 GB	Q4_K_M (GGUF)	多语言	准确率最高且完全离线的文本格式化模型。需要性能较强的 Mac (8GB+ 内存)。

返回 tapWhisper