المواصفات الفنية
الحجم
75 ميجابايت (Tiny) إلى 1.5 جيجابايت (Large)
البنية
مشفر ومفكك ترميز المحولات (Transformer)
زمن الانتقال
1-3 ثوانٍ للإملاء المتوسط
اللغة
أكثر من 99 لغة
المطور / المنشئ
OpenAI (الأوزان الأصلية)، مجتمع GGML / whisper.cpp (الملفات المكممة)
مصدر التحميل
Source Repository
Hugging Face Hub (عبر أداة تنزيل tapWhisper)
Open Repository (ggerganov/whisper.cpp)نظرة عامة على النموذج
Whisper هو نموذج متطور من OpenAI للتعرف على الكلام للأغراض العامة. في tapWhisper، تعمل نماذج Whisper دون اتصال بالإنترنت باستخدام whisper.cpp (تنسيق GGML) مع تسريع كامل لـ Metal GPU على Apple Silicon. يمكن للمستخدمين تنزيل أحجام مختلفة من الإعدادات. يوفر دقة لغوية فائقة.
إصدارات النموذج المتاحة
| اسم النموذج | حجم الملف | ذاكرة الوصول العشوائي | الصيغة/التكميم | اللغات | الوصف |
|---|---|---|---|---|---|
| Whisper Very Small | 74 MB | 180 MB | Float16 (Full) | متعدد اللغات | أسرع سرعة نسخ، دقة أقل. مثالي لاستعلامات الاختبار السريعة. |
| Whisper Very Small Q5 | 31 MB | 110 MB | Q5_1 (Quantized) | متعدد اللغات | أصغر خيار Whisper مكمم. متطلبات تخزين منخفضة للغاية. |
| Whisper Small | 141 MB | 300 MB | Float16 (Full) | متعدد اللغات | نموذج أساسي متوازن بدقة مناسبة للجمل اليومية البسيطة. |
| Whisper Small Q5 | 57 MB | 180 MB | Q5_1 (Quantized) | متعدد اللغات | نموذج أساسي Whisper مكمم. ذاكرة واستخدام تخزين محسنين. |
| Whisper Medium ⭐ | 547 MB | 900 MB | Q5_0 (Quantized) | متعدد اللغات | أفضل نسبة سرعة إلى جودة. يوصى به كنموذج افتراضي دون اتصال بالإنترنت. |
| Whisper Very Small (English) | 74 MB | 180 MB | Float16 (Full) | الإنجليزية | أسرع نموذج إملاء باللغة الإنجليزية فقط. استهلاك منخفض للموارد. |
| Whisper Very Small Q5 (English) | 31 MB | 110 MB | Q5_1 (Quantized) | الإنجليزية | نموذج صغير مكمم باللغة الإنجليزية فقط. خفيف الوزن للغاية. |
| Whisper Small (English) | 141 MB | 300 MB | Float16 (Full) | الإنجليزية | نموذج أساسي قياسي باللغة الإنجليزية فقط للإملاء القياسي. |
| Whisper Small Q5 (English) | 57 MB | 180 MB | Q5_1 (Quantized) | الإنجليزية | نموذج أساسي مكمم باللغة الإنجليزية فقط. كفاءة عالية. |
| Whisper Standard | 465 MB | 850 MB | Float16 (Full) | متعدد اللغات | نموذج قياسي. يوفر دقة تعرّف قوية للغات متعددة. |
| Whisper Standard Q5 | 181 MB | 450 MB | Q5_1 (Quantized) | متعدد اللغات | نموذج Whisper صغير مكمم. توازن ممتاز بين الحجم والدقة. |
| Whisper Standard (English) | 465 MB | 850 MB | Float16 (Full) | الإنجليزية | نموذج قياسي باللغة الإنجليزية فقط. مثالي لإملاء الكلام باللغة الإنجليزية الواضحة. |
| Whisper Standard Q5 (English) | 181 MB | 450 MB | Q5_1 (Quantized) | الإنجليزية | نموذج قياسي مكمم باللغة الإنجليزية فقط. كفاءة ذاكرة عالية. |
| Whisper Large (legacy) | 1.43 GB | 2.2 GB | Float16 (Full) | متعدد اللغات | نموذج كبير قديم بتغطية لغوية واسعة. دقة عالية، بصمة ثقيلة. |
| Whisper Medium HQ | 1.51 GB | 2.3 GB | Float16 (Full) | متعدد اللغات | نموذج متوسط عالي الجودة (بنية Turbo). دقة مذهلة. |
| Whisper Very Big | 2.88 GB | 4.2 GB | Float16 (Full) | متعدد اللغات | أقصى دقة عامة. تحميل ثقيل، أبطأ في المعالجة. |