tapWhisper — OpenAI Whisper GGML

Spécifications

Taille 75 Mo (Tiny) à 1.5 Go (Large)

Architecture Transformer Encoder-Decoder

Latence 1 à 3s pour une dictée moyenne

Langue 99+ langues

Développeur / Créateur

OpenAI (poids originaux), communauté GGML / whisper.cpp (fichiers quantifiés)

Licence

MIT

Source de Téléchargement

Source Repository

Hugging Face Hub (via le téléchargeur tapWhisper)

ggerganov/whisper.cpp

Fichiers runtime exacts

Aperçu du Modèle

Whisper est le modèle de reconnaissance vocale polyvalent le plus avancé d'OpenAI. Dans tapWhisper, les modèles Whisper s'exécutent hors ligne en utilisant whisper.cpp (format GGML) avec accélération Metal GPU sur Apple Silicon. Les utilisateurs peuvent télécharger différentes tailles (Base, Small, Medium, Large) depuis les réglages. Il offre une précision multilingue extrême.

Variantes de Modèles Disponibles

Nom du Modèle	Taille du Fichier	Mémoire RAM	Format/Quant	Langues	Description
Whisper Very Small	74 MB	180 MB	Float16 (Full)	Multilingue	Transcription la plus rapide, précision inférieure. Idéal pour des tests rapides.
Whisper Very Small Q5	31 MB	110 MB	Q5_1 (Quantized)	Multilingue	Option Whisper quantifiée la plus petite. Espace de stockage ultra réduit.
Whisper Small	141 MB	300 MB	Float16 (Full)	Multilingue	Modèle de base équilibré avec une précision décente pour les phrases quotidiennes simples.
Whisper Small Q5	57 MB	180 MB	Q5_1 (Quantized)	Multilingue	Modèle de base Whisper quantifié. Utilisation optimisée de la mémoire et du stockage.
Whisper Medium ⭐	547 MB	900 MB	Q5_0 (Quantized)	Multilingue	Meilleur rapport vitesse/qualité. Recommandé comme modèle hors ligne par défaut.
Whisper Very Small (English)	74 MB	180 MB	Float16 (Full)	Anglais	Modèle de dictée en anglais uniquement le plus rapide. Faible consommation.
Whisper Very Small Q5 (English)	31 MB	110 MB	Q5_1 (Quantized)	Anglais	Modèle minuscule quantifié en anglais uniquement. Extrêmement léger.
Whisper Small (English)	141 MB	300 MB	Float16 (Full)	Anglais	Modèle de base standard en anglais uniquement pour la dictée courante.
Whisper Small Q5 (English)	57 MB	180 MB	Q5_1 (Quantized)	Anglais	Modèle de base quantifié en anglais uniquement. Grande efficacité.
Whisper Standard	465 MB	850 MB	Float16 (Full)	Multilingue	Modèle standard. Offre une bonne précision pour plusieurs langues.
Whisper Standard Q5	181 MB	450 MB	Q5_1 (Quantized)	Multilingue	Modèle réduit Whisper quantifié. Excellent compromis taille et fidélité.
Whisper Standard (English)	465 MB	850 MB	Float16 (Full)	Anglais	Modèle standard en anglais uniquement. Idéal pour une dictée claire en anglais.
Whisper Standard Q5 (English)	181 MB	450 MB	Q5_1 (Quantized)	Anglais	Modèle standard quantifié en anglais uniquement. Haute efficacité mémoire.
Whisper Large (legacy)	1.43 GB	2.2 GB	Float16 (Full)	Multilingue	Ancien grand modèle avec une large couverture linguistique. Haute précision, lourd.
Whisper Medium HQ	1.51 GB	2.3 GB	Float16 (Full)	Multilingue	Modèle moyen de haute qualité (architecture Turbo). Précision exceptionnelle.
Whisper Very Big	2.88 GB	4.2 GB	Float16 (Full)	Multilingue	Précision générale maximale. Téléchargement lourd, traitement plus lent.

Retour à tapWhisper