Назад к tapWhisper
Профиль модели

Useful Sensors Moonshine

2 варианта

Технические характеристики

Размер 100 МБ - 300 МБ
Архитектура Оптимизированный Transformer
Задержка Очень низкая (<100 мс)
Язык Английский

Разработчик / Создатель

Useful Sensors

Источник загрузки

Source Repository

Репозиторий моделей ONNX Hugging Face / Sherpa

Open Repository (UsefulSensors/moonshine)

Обзор модели

Moonshine — это высокооптимизированная модель распознавания речи с низкой задержкой, разработанная для диктовки в реальном времени на устройствах с ограниченными ресурсами. Она достигает точности, аналогичной Whisper, при этом обрабатывает аудио быстрее и потребляет значительно меньше оперативной памяти. Работает локально через Sherpa ONNX.

Доступные варианты моделей

Вариант модели Размер файла Использование ОЗУ Формат/Квант Языки Описание
Moonshine STT (Tiny) 103 MB 300 MB INT8 (ONNX) Английский Чрезвычайно быстрая модель Moonshine ONNX для английской речи.
Moonshine STT (Base) 239 MB 650 MB INT8 (ONNX) Английский Увеличенная и более точная модель Moonshine ONNX для расшифровки.