技术规格
大小
100 MB - 300 MB
架构
优化版 Transformer
延迟
极低 (<100ms)
语言
英语
开发者 / 创作者
Useful Sensors
下载来源
模型概览
Moonshine 是一个经过高度优化、超低延迟的语音识别模型,专为资源受限的边缘设备上的实时听写而设计。它能在获得与 Whisper 模型相似准确率的同时,以更小的内存占用大幅提升音频处理速度。在 tapWhisper 中它通过 Sherpa ONNX 运行时在本地加载运行。
可用模型版本
| 模型版本 | 文件大小 | 内存占用 | 格式/量化 | 支持语言 | 说明 |
|---|---|---|---|---|---|
| Moonshine STT (Tiny) | 103 MB | 300 MB | INT8 (ONNX) | 英语 | 极速 Moonshine ONNX 模型,适用于实时英文语音识别。 |
| Moonshine STT (Base) | 239 MB | 650 MB | INT8 (ONNX) | 英语 | 体积更大、准确率更高的 Moonshine ONNX 模型,适用于英文转录。 |