Volver a tapWhisper
Perfil del Modelo

Useful Sensors Moonshine

2 variantes

Especificaciones

Tamaño 100 MB - 300 MB
Arquitectura Transformer Optimizado
Latencia Muy baja (<100ms)
Idioma Inglés

Desarrollador / Creador

Useful Sensors

Origen de Descarga

Source Repository

Registro de modelos ONNX de Hugging Face / Sherpa

Open Repository (UsefulSensors/moonshine)

Descripción del Modelo

Moonshine es un modelo de reconocimiento de voz de baja latencia altamente optimizado para dictado en tiempo real en dispositivos con recursos limitados. Logra una precisión similar a la de Whisper pero procesa audio mucho más rápido con menor consumo de memoria. Funciona localmente en tapWhisper mediante el entorno Sherpa ONNX.

Variantes de Modelos Disponibles

Nombre del Modelo Tamaño de Archivo Uso de RAM Formato/Cuant Idiomas Descripción
Moonshine STT (Tiny) 103 MB 300 MB INT8 (ONNX) Inglés Modelo Moonshine ONNX extremadamente rápido para voz en inglés en tiempo real.
Moonshine STT (Base) 239 MB 650 MB INT8 (ONNX) Inglés Modelo Moonshine ONNX más grande y de mayor precisión para transcripción en inglés.