Технические характеристики
Размер
от 397 МБ (0.6B) до 2.5 ГБ (4B)
Архитектура
GGUF LLM (Q4_K_M)
Задержка
Быстро (80-120 токенов/сек на Apple Silicon)
Функция
Форматирование и исправление грамматики
Разработчик / Создатель
Alibaba Group / сообщество llama.cpp
Источник загрузки
Source Repository
Hugging Face Hub (через встроенный загрузчик tapWhisper)
Open Repository (Qwen/Qwen2.5)Обзор модели
Qwen 3 — это семейство легковесных высокопроизводительных языковых моделей (от 0.6B до 4B параметров) в формате GGUF, используемых для локального форматирования текста. В tapWhisper при выборе режима с форматированием запускается локальный сервер llama.cpp. Qwen наводит порядок в тексте: расставляет знаки препинания, исправляет грамматику и форматирует код.
Доступные варианты моделей
| Вариант модели | Размер файла | Использование ОЗУ | Формат/Квант | Языки | Описание |
|---|---|---|---|---|---|
| Apple Built-in Cleanup | 0 MB | 0 MB | System API | Английский | Встроенное локальное исправление текста для базовой грамматики и пробелов. |
| Small (Qwen 3 0.6B) ⭐ | 378 MB | 650 MB | Q4_K_M (GGUF) | Мультиязычный | Рекомендуемый форматировщик по умолчанию. Сверхбыстрая коррекция грамматики, пунктуации и разметки кода. |
| Medium (Qwen 3 1.7B) | 1.03 GB | 1.5 GB | Q4_K_M (GGUF) | Мультиязычный | Улучшенный языковой анализ. Поддерживает сложную структурную перестройку текста. |
| Large (Qwen 3 4B) | 2.33 GB | 3.2 GB | Q4_K_M (GGUF) | Мультиязычный | Высокоточный автономный форматировщик текста. Требует производительный Mac (от 8 ГБ ОЗУ). |