tapWhisper — Useful Sensors Moonshine

Especificaciones

Tamaño 100 MB - 300 MB

Arquitectura Transformer Optimizado

Latencia Muy baja (<100ms)

Idioma Inglés

Desarrollador / Creador

Useful Sensors

Licencia

MIT model; Apache-2.0 Sherpa ONNX runtime

Origen de Descarga

Source Repository

Registro de modelos ONNX de Hugging Face / Sherpa

k2-fsa/sherpa-onnx releases

Archivos exactos del runtime

Descripción del Modelo

Moonshine es un modelo de reconocimiento de voz de baja latencia altamente optimizado para dictado en tiempo real en dispositivos con recursos limitados. Logra una precisión similar a la de Whisper pero procesa audio mucho más rápido con menor consumo de memoria. Funciona localmente en tapWhisper mediante el entorno Sherpa ONNX.

Variantes de Modelos Disponibles

Nombre del Modelo	Tamaño de Archivo	Uso de RAM	Formato/Cuant	Idiomas	Descripción
Moonshine STT (Tiny)	103 MB	300 MB	INT8 (ONNX)	Inglés	Modelo Moonshine ONNX extremadamente rápido para voz en inglés en tiempo real.
Moonshine STT (Base)	239 MB	650 MB	INT8 (ONNX)	Inglés	Modelo Moonshine ONNX más grande y de mayor precisión para transcripción en inglés.

Volver a tapWhisper