Spécifications
Taille
75 Mo (Tiny) à 1.5 Go (Large)
Architecture
Transformer Encoder-Decoder
Latence
1 à 3s pour une dictée moyenne
Langue
99+ langues
Développeur / Créateur
OpenAI (poids originaux), communauté GGML / whisper.cpp (fichiers quantifiés)
Source de Téléchargement
Source Repository
Hugging Face Hub (via le téléchargeur tapWhisper)
Open Repository (ggerganov/whisper.cpp)Aperçu du Modèle
Whisper est le modèle de reconnaissance vocale polyvalent le plus avancé d'OpenAI. Dans tapWhisper, les modèles Whisper s'exécutent hors ligne en utilisant whisper.cpp (format GGML) avec accélération Metal GPU sur Apple Silicon. Les utilisateurs peuvent télécharger différentes tailles (Base, Small, Medium, Large) depuis les réglages. Il offre une précision multilingue extrême.
Variantes de Modèles Disponibles
| Nom du Modèle | Taille du Fichier | Mémoire RAM | Format/Quant | Langues | Description |
|---|---|---|---|---|---|
| Whisper Very Small | 74 MB | 180 MB | Float16 (Full) | Multilingue | Transcription la plus rapide, précision inférieure. Idéal pour des tests rapides. |
| Whisper Very Small Q5 | 31 MB | 110 MB | Q5_1 (Quantized) | Multilingue | Option Whisper quantifiée la plus petite. Espace de stockage ultra réduit. |
| Whisper Small | 141 MB | 300 MB | Float16 (Full) | Multilingue | Modèle de base équilibré avec une précision décente pour les phrases quotidiennes simples. |
| Whisper Small Q5 | 57 MB | 180 MB | Q5_1 (Quantized) | Multilingue | Modèle de base Whisper quantifié. Utilisation optimisée de la mémoire et du stockage. |
| Whisper Medium ⭐ | 547 MB | 900 MB | Q5_0 (Quantized) | Multilingue | Meilleur rapport vitesse/qualité. Recommandé comme modèle hors ligne par défaut. |
| Whisper Very Small (English) | 74 MB | 180 MB | Float16 (Full) | Anglais | Modèle de dictée en anglais uniquement le plus rapide. Faible consommation. |
| Whisper Very Small Q5 (English) | 31 MB | 110 MB | Q5_1 (Quantized) | Anglais | Modèle minuscule quantifié en anglais uniquement. Extrêmement léger. |
| Whisper Small (English) | 141 MB | 300 MB | Float16 (Full) | Anglais | Modèle de base standard en anglais uniquement pour la dictée courante. |
| Whisper Small Q5 (English) | 57 MB | 180 MB | Q5_1 (Quantized) | Anglais | Modèle de base quantifié en anglais uniquement. Grande efficacité. |
| Whisper Standard | 465 MB | 850 MB | Float16 (Full) | Multilingue | Modèle standard. Offre une bonne précision pour plusieurs langues. |
| Whisper Standard Q5 | 181 MB | 450 MB | Q5_1 (Quantized) | Multilingue | Modèle réduit Whisper quantifié. Excellent compromis taille et fidélité. |
| Whisper Standard (English) | 465 MB | 850 MB | Float16 (Full) | Anglais | Modèle standard en anglais uniquement. Idéal pour une dictée claire en anglais. |
| Whisper Standard Q5 (English) | 181 MB | 450 MB | Q5_1 (Quantized) | Anglais | Modèle standard quantifié en anglais uniquement. Haute efficacité mémoire. |
| Whisper Large (legacy) | 1.43 GB | 2.2 GB | Float16 (Full) | Multilingue | Ancien grand modèle avec une large couverture linguistique. Haute précision, lourd. |
| Whisper Medium HQ | 1.51 GB | 2.3 GB | Float16 (Full) | Multilingue | Modèle moyen de haute qualité (architecture Turbo). Précision exceptionnelle. |
| Whisper Very Big | 2.88 GB | 4.2 GB | Float16 (Full) | Multilingue | Précision générale maximale. Téléchargement lourd, traitement plus lent. |