Especificações
Tamanho
397 MB (0.6B) a 2.5 GB (4B)
Arquitetura
GGUF LLM (Q4_K_M)
Latência
Rápido (80-120 tok/s no Apple Silicon)
Função
Formatação e correção gramatical
Desenvolvedor / Criador
Alibaba Group / comunidade llama.cpp
Origem de Download
Source Repository
Hugging Face Hub (via gerenciador de downloads do tapWhisper)
Open Repository (Qwen/Qwen2.5)Visão Geral do Modelo
O Qwen 3 é uma família de modelos de linguagem leves e eficientes (0.6B a 4B parâmetros) no formato GGUF usados para formatação local de texto. No tapWhisper, ao ativar a formatação LLM, um servidor local llama.cpp é iniciado. O Qwen organiza a saída de texto: pontuando, corrigindo a gramática e formatando código no próprio Mac.
Variantes de Modelos Disponíveis
| Nome do Modelo | Tamanho do Arquivo | Uso de RAM | Formato/Quant | Idiomas | Descrição |
|---|---|---|---|---|---|
| Apple Built-in Cleanup | 0 MB | 0 MB | System API | Inglês | Limpeza de texto local integrada para correção básica de gramática e espaçamento. |
| Small (Qwen 3 0.6B) ⭐ | 378 MB | 650 MB | Q4_K_M (GGUF) | Multilíngue | Formatador recomendado por padrão. Correção ultrarrápida de gramática, pontuação e código. |
| Medium (Qwen 3 1.7B) | 1.03 GB | 1.5 GB | Q4_K_M (GGUF) | Multilíngue | Processamento de linguagem local aprimorado. Ideal para reorganização estrutural de textos. |
| Large (Qwen 3 4B) | 2.33 GB | 3.2 GB | Q4_K_M (GGUF) | Multilíngue | Formatador de texto offline de maior precisão. Requer um Mac potente (8GB+ RAM). |