প্রযুক্তিগত বৈশিষ্ট্য
আকার
75 MB (Tiny) থেকে 1.5 GB (Large)
আর্কিটেকচার
Transformer Encoder-Decoder
ল্যাটেন্সি
গড় ডিক্টেশনের জন্য ১-৩ সেকেন্ড
ভাষা
৯৯+ ভাষা
ডেভেলপার / নির্মাতা
OpenAI (মূল ওজন), GGML / whisper.cpp সম্প্রদায় (কোয়ান্টাইজড ফাইল)
ডাউনলোড উৎস
Source Repository
Hugging Face হাব (tapWhisper ডাউনলোডারের মাধ্যমে)
Open Repository (ggerganov/whisper.cpp)মডেল পরিচিতি
Whisper হল OpenAI-এর একটি সর্বাধুনিক সাধারণ-উদ্দেশ্যমূলক ভয়েস রিকগনিশন মডেল। tapWhisper-এ, অ্যাপল সিলিকনে সম্পূর্ণ মেটাল জিপিইউ অ্যাক্সিলারেশন সহ whisper.cpp (GGML ফরম্যাট) ব্যবহার করে অফলাইনে হুইস্পার মডেল চলে। ব্যবহারকারীরা সেটিংস থেকে বিভিন্ন আকারের মডেল ডাউনলোড করতে পারেন। এটি চরম বহুভাষিক নির্ভুলতা সরবরাহ করে।
উপলব্ধ মডেল ভেরিয়েন্ট
| মডেল ভেরিয়েন্ট | ফাইল সাইজ | র্যাম ব্যবহার | ফরম্যাট/কোয়াণ্ট | ভাষা | বিবরণ |
|---|---|---|---|---|---|
| Whisper Very Small | 74 MB | 180 MB | Float16 (Full) | বহুভাষিক | সবচেয়ে দ্রুত ট্রান্সক্রিপশন স্পিড, কম নির্ভুলতা। দ্রুত পরীক্ষার জন্য আদর্শ। |
| Whisper Very Small Q5 | 31 MB | 110 MB | Q5_1 (Quantized) | বহুভাষিক | সবচেয়ে ছোট কোয়ান্টাইজড Whisper অপশন。অত্যন্ত কম স্টোরেজ প্রয়োজন। |
| Whisper Small | 141 MB | 300 MB | Float16 (Full) | বহুভাষিক | সহজ দৈনিক বাক্যের জন্য ভালো নির্ভুলতা সহ ভারসাম্যपूर्ण বেস মডেল। |
| Whisper Small Q5 | 57 MB | 180 MB | Q5_1 (Quantized) | বহুভাষিক | কোয়ান্টাইজড Whisper বেস মডেল। অপ্টিমাইজড মেমরি এবং স্টোরেজ ব্যবহার। |
| Whisper Medium ⭐ | 547 MB | 900 MB | Q5_0 (Quantized) | বহুভাষিক | সেরা গতি-গুণমান অনুপাত। ডিফল্ট অফলাইন модель হিসাবে প্রস্তাবিত। |
| Whisper Very Small (English) | 74 MB | 180 MB | Float16 (Full) | ইংরেজি | সবচেয়ে দ্রুত কেবল-ইংরেজি ডিক্টেশন модель। কম রিসোর্স খরচ। |
| Whisper Very Small Q5 (English) | 31 MB | 110 MB | Q5_1 (Quantized) | ইংরেজি | কোয়ান্টাইজড কেবল-ইংরেজি ক্ষুদ্র মডেল। অত্যন্ত হালকা। |
| Whisper Small (English) | 141 MB | 300 MB | Float16 (Full) | ইংরেজি | স্ট্যান্ডার্ড ডিক্টেশনের জন্য স্ট্যান্ডার্ড কেবল-ইংরেজি বেস মডেল। |
| Whisper Small Q5 (English) | 57 MB | 180 MB | Q5_1 (Quantized) | ইংরেজি | কোয়ান্টাইজড কেবল-ইংরেজি বেস মডেল। উচ্চ দক্ষতা। |
| Whisper Standard | 465 MB | 850 MB | Float16 (Full) | বহুভাষিক | স্ট্যান্ডার্ড মডেল। একাধিক ভাষার জন্য ভালো নির্ভুলতা প্রদান করে। |
| Whisper Standard Q5 | 181 MB | 450 MB | Q5_1 (Quantized) | বহুভাষিক | কোয়ান্টাইজড Whisper ছোট মডেল। সাইজ এবং বিশ্বস্ততার চমৎকার ভারসাম্য। |
| Whisper Standard (English) | 465 MB | 850 MB | Float16 (Full) | ইংরেজি | স্ট্যান্ডার্ড কেবল-ইংরেজি মডেল। পরিষ্কার ইংরেজি স্পিচ ডিক্টেশনের জন্য আদর্শ। |
| Whisper Standard Q5 (English) | 181 MB | 450 MB | Q5_1 (Quantized) | ইংরেজি | কোয়ান্টাইজড কেবল-ইংরেজি স্ট্যান্ডার্ড মডেল। উচ্চ মেমরি দক্ষতা। |
| Whisper Large (legacy) | 1.43 GB | 2.2 GB | Float16 (Full) | বহুভাষিক | ব্যাপক ভাষা কভারেজ সহ পুরানো বড় মডেল। উচ্চ নির্ভুলতা, ভারী ফুটপ্রিন্ট। |
| Whisper Medium HQ | 1.51 GB | 2.3 GB | Float16 (Full) | বহুভাষিক | উচ্চ মানের মাঝারি মডেল (টার্বো আর্কিটেকচার)। অসামান্য নির্ভুলতা। |
| Whisper Very Big | 2.88 GB | 4.2 GB | Float16 (Full) | বহুভাষিক | সর্বোচ্চ সামগ্রিক নির্ভুলতা। ভারী ডাউনলোড, ধীর প্রসেসিং স্পিড। |