Retour à tapWhisper
Profil du Modèle

OpenAI Whisper GGML

16 variantes

Spécifications

Taille 75 Mo (Tiny) à 1.5 Go (Large)
Architecture Transformer Encoder-Decoder
Latence 1 à 3s pour une dictée moyenne
Langue 99+ langues

Développeur / Créateur

OpenAI (poids originaux), communauté GGML / whisper.cpp (fichiers quantifiés)

Source de Téléchargement

Source Repository

Hugging Face Hub (via le téléchargeur tapWhisper)

Open Repository (ggerganov/whisper.cpp)

Aperçu du Modèle

Whisper est le modèle de reconnaissance vocale polyvalent le plus avancé d'OpenAI. Dans tapWhisper, les modèles Whisper s'exécutent hors ligne en utilisant whisper.cpp (format GGML) avec accélération Metal GPU sur Apple Silicon. Les utilisateurs peuvent télécharger différentes tailles (Base, Small, Medium, Large) depuis les réglages. Il offre une précision multilingue extrême.

Variantes de Modèles Disponibles

Nom du Modèle Taille du Fichier Mémoire RAM Format/Quant Langues Description
Whisper Very Small 74 MB 180 MB Float16 (Full) Multilingue Transcription la plus rapide, précision inférieure. Idéal pour des tests rapides.
Whisper Very Small Q5 31 MB 110 MB Q5_1 (Quantized) Multilingue Option Whisper quantifiée la plus petite. Espace de stockage ultra réduit.
Whisper Small 141 MB 300 MB Float16 (Full) Multilingue Modèle de base équilibré avec une précision décente pour les phrases quotidiennes simples.
Whisper Small Q5 57 MB 180 MB Q5_1 (Quantized) Multilingue Modèle de base Whisper quantifié. Utilisation optimisée de la mémoire et du stockage.
Whisper Medium ⭐ 547 MB 900 MB Q5_0 (Quantized) Multilingue Meilleur rapport vitesse/qualité. Recommandé comme modèle hors ligne par défaut.
Whisper Very Small (English) 74 MB 180 MB Float16 (Full) Anglais Modèle de dictée en anglais uniquement le plus rapide. Faible consommation.
Whisper Very Small Q5 (English) 31 MB 110 MB Q5_1 (Quantized) Anglais Modèle minuscule quantifié en anglais uniquement. Extrêmement léger.
Whisper Small (English) 141 MB 300 MB Float16 (Full) Anglais Modèle de base standard en anglais uniquement pour la dictée courante.
Whisper Small Q5 (English) 57 MB 180 MB Q5_1 (Quantized) Anglais Modèle de base quantifié en anglais uniquement. Grande efficacité.
Whisper Standard 465 MB 850 MB Float16 (Full) Multilingue Modèle standard. Offre une bonne précision pour plusieurs langues.
Whisper Standard Q5 181 MB 450 MB Q5_1 (Quantized) Multilingue Modèle réduit Whisper quantifié. Excellent compromis taille et fidélité.
Whisper Standard (English) 465 MB 850 MB Float16 (Full) Anglais Modèle standard en anglais uniquement. Idéal pour une dictée claire en anglais.
Whisper Standard Q5 (English) 181 MB 450 MB Q5_1 (Quantized) Anglais Modèle standard quantifié en anglais uniquement. Haute efficacité mémoire.
Whisper Large (legacy) 1.43 GB 2.2 GB Float16 (Full) Multilingue Ancien grand modèle avec une large couverture linguistique. Haute précision, lourd.
Whisper Medium HQ 1.51 GB 2.3 GB Float16 (Full) Multilingue Modèle moyen de haute qualité (architecture Turbo). Précision exceptionnelle.
Whisper Very Big 2.88 GB 4.2 GB Float16 (Full) Multilingue Précision générale maximale. Téléchargement lourd, traitement plus lent.