技术规格
大小
~350 MB (INT8 ONNX)
架构
Conformer
延迟
中等
语言
英语、西班牙语、德语、法语 + 设备端翻译
开发者 / 创作者
NVIDIA (NeMo 团队), Sherpa ONNX 社区
下载来源
模型概览
NVIDIA 的 Canary 是一款先进的多语言语音转文字和翻译模型。它支持英语、西班牙语、德语和法语的语音识别,并可以在这些语言之间在设备端进行转录和翻译。它在 tapWhisper 中使用 Sherpa ONNX 本地高效运行。
可用模型版本
| 模型版本 | 文件大小 | 内存占用 | 格式/量化 | 支持语言 | 说明 |
|---|---|---|---|---|---|
| NVIDIA Canary | 350 MB | 650 MB | INT8 (ONNX) | 英、西、德、法 | NVIDIA Canary 180M Flash。支持设备端的语音识别(ASR)和翻译。 |