tapWhisper — OpenAI Whisper GGML

المواصفات الفنية

الحجم 75 ميجابايت (Tiny) إلى 1.5 جيجابايت (Large)

البنية مشفر ومفكك ترميز المحولات (Transformer)

زمن الانتقال 1-3 ثوانٍ للإملاء المتوسط

اللغة أكثر من 99 لغة

المطور / المنشئ

OpenAI (الأوزان الأصلية)، مجتمع GGML / whisper.cpp (الملفات المكممة)

الترخيص

MIT

مصدر التحميل

Source Repository

Hugging Face Hub (عبر أداة تنزيل tapWhisper)

ggerganov/whisper.cpp

ملفات التشغيل الفعلية

نظرة عامة على النموذج

Whisper هو نموذج متطور من OpenAI للتعرف على الكلام للأغراض العامة. في tapWhisper، تعمل نماذج Whisper دون اتصال بالإنترنت باستخدام whisper.cpp (تنسيق GGML) مع تسريع كامل لـ Metal GPU على Apple Silicon. يمكن للمستخدمين تنزيل أحجام مختلفة من الإعدادات. يوفر دقة لغوية فائقة.

إصدارات النموذج المتاحة

اسم النموذج	حجم الملف	ذاكرة الوصول العشوائي	الصيغة/التكميم	اللغات	الوصف
Whisper Very Small	74 MB	180 MB	Float16 (Full)	متعدد اللغات	أسرع سرعة نسخ، دقة أقل. مثالي لاستعلامات الاختبار السريعة.
Whisper Very Small Q5	31 MB	110 MB	Q5_1 (Quantized)	متعدد اللغات	أصغر خيار Whisper مكمم. متطلبات تخزين منخفضة للغاية.
Whisper Small	141 MB	300 MB	Float16 (Full)	متعدد اللغات	نموذج أساسي متوازن بدقة مناسبة للجمل اليومية البسيطة.
Whisper Small Q5	57 MB	180 MB	Q5_1 (Quantized)	متعدد اللغات	نموذج أساسي Whisper مكمم. ذاكرة واستخدام تخزين محسنين.
Whisper Medium ⭐	547 MB	900 MB	Q5_0 (Quantized)	متعدد اللغات	أفضل نسبة سرعة إلى جودة. يوصى به كنموذج افتراضي دون اتصال بالإنترنت.
Whisper Very Small (English)	74 MB	180 MB	Float16 (Full)	الإنجليزية	أسرع نموذج إملاء باللغة الإنجليزية فقط. استهلاك منخفض للموارد.
Whisper Very Small Q5 (English)	31 MB	110 MB	Q5_1 (Quantized)	الإنجليزية	نموذج صغير مكمم باللغة الإنجليزية فقط. خفيف الوزن للغاية.
Whisper Small (English)	141 MB	300 MB	Float16 (Full)	الإنجليزية	نموذج أساسي قياسي باللغة الإنجليزية فقط للإملاء القياسي.
Whisper Small Q5 (English)	57 MB	180 MB	Q5_1 (Quantized)	الإنجليزية	نموذج أساسي مكمم باللغة الإنجليزية فقط. كفاءة عالية.
Whisper Standard	465 MB	850 MB	Float16 (Full)	متعدد اللغات	نموذج قياسي. يوفر دقة تعرّف قوية للغات متعددة.
Whisper Standard Q5	181 MB	450 MB	Q5_1 (Quantized)	متعدد اللغات	نموذج Whisper صغير مكمم. توازن ممتاز بين الحجم والدقة.
Whisper Standard (English)	465 MB	850 MB	Float16 (Full)	الإنجليزية	نموذج قياسي باللغة الإنجليزية فقط. مثالي لإملاء الكلام باللغة الإنجليزية الواضحة.
Whisper Standard Q5 (English)	181 MB	450 MB	Q5_1 (Quantized)	الإنجليزية	نموذج قياسي مكمم باللغة الإنجليزية فقط. كفاءة ذاكرة عالية.
Whisper Large (legacy)	1.43 GB	2.2 GB	Float16 (Full)	متعدد اللغات	نموذج كبير قديم بتغطية لغوية واسعة. دقة عالية، بصمة ثقيلة.
Whisper Medium HQ	1.51 GB	2.3 GB	Float16 (Full)	متعدد اللغات	نموذج متوسط عالي الجودة (بنية Turbo). دقة مذهلة.
Whisper Very Big	2.88 GB	4.2 GB	Float16 (Full)	متعدد اللغات	أقصى دقة عامة. تحميل ثقيل، أبطأ في المعالجة.

العودة إلى tapWhisper