tapWhisper-এ ফিরে যান
মডেল প্রোফাইল

OpenAI Whisper GGML

১৬ ভেরিয়েন্ট

প্রযুক্তিগত বৈশিষ্ট্য

আকার 75 MB (Tiny) থেকে 1.5 GB (Large)
আর্কিটেকচার Transformer Encoder-Decoder
ল্যাটেন্সি গড় ডিক্টেশনের জন্য ১-৩ সেকেন্ড
ভাষা ৯৯+ ভাষা

ডেভেলপার / নির্মাতা

OpenAI (মূল ওজন), GGML / whisper.cpp সম্প্রদায় (কোয়ান্টাইজড ফাইল)

ডাউনলোড উৎস

Source Repository

Hugging Face হাব (tapWhisper ডাউনলোডারের মাধ্যমে)

Open Repository (ggerganov/whisper.cpp)

মডেল পরিচিতি

Whisper হল OpenAI-এর একটি সর্বাধুনিক সাধারণ-উদ্দেশ্যমূলক ভয়েস রিকগনিশন মডেল। tapWhisper-এ, অ্যাপল সিলিকনে সম্পূর্ণ মেটাল জিপিইউ অ্যাক্সিলারেশন সহ whisper.cpp (GGML ফরম্যাট) ব্যবহার করে অফলাইনে হুইস্পার মডেল চলে। ব্যবহারকারীরা সেটিংস থেকে বিভিন্ন আকারের মডেল ডাউনলোড করতে পারেন। এটি চরম বহুভাষিক নির্ভুলতা সরবরাহ করে।

উপলব্ধ মডেল ভেরিয়েন্ট

মডেল ভেরিয়েন্ট ফাইল সাইজ র‍্যাম ব্যবহার ফরম্যাট/কোয়াণ্ট ভাষা বিবরণ
Whisper Very Small 74 MB 180 MB Float16 (Full) বহুভাষিক সবচেয়ে দ্রুত ট্রান্সক্রিপশন স্পিড, কম নির্ভুলতা। দ্রুত পরীক্ষার জন্য আদর্শ।
Whisper Very Small Q5 31 MB 110 MB Q5_1 (Quantized) বহুভাষিক সবচেয়ে ছোট কোয়ান্টাইজড Whisper অপশন。অত্যন্ত কম স্টোরেজ প্রয়োজন।
Whisper Small 141 MB 300 MB Float16 (Full) বহুভাষিক সহজ দৈনিক বাক্যের জন্য ভালো নির্ভুলতা সহ ভারসাম্যपूर्ण বেস মডেল।
Whisper Small Q5 57 MB 180 MB Q5_1 (Quantized) বহুভাষিক কোয়ান্টাইজড Whisper বেস মডেল। অপ্টিমাইজড মেমরি এবং স্টোরেজ ব্যবহার।
Whisper Medium ⭐ 547 MB 900 MB Q5_0 (Quantized) বহুভাষিক সেরা গতি-গুণমান অনুপাত। ডিফল্ট অফলাইন модель হিসাবে প্রস্তাবিত।
Whisper Very Small (English) 74 MB 180 MB Float16 (Full) ইংরেজি সবচেয়ে দ্রুত কেবল-ইংরেজি ডিক্টেশন модель। কম রিসোর্স খরচ।
Whisper Very Small Q5 (English) 31 MB 110 MB Q5_1 (Quantized) ইংরেজি কোয়ান্টাইজড কেবল-ইংরেজি ক্ষুদ্র মডেল। অত্যন্ত হালকা।
Whisper Small (English) 141 MB 300 MB Float16 (Full) ইংরেজি স্ট্যান্ডার্ড ডিক্টেশনের জন্য স্ট্যান্ডার্ড কেবল-ইংরেজি বেস মডেল।
Whisper Small Q5 (English) 57 MB 180 MB Q5_1 (Quantized) ইংরেজি কোয়ান্টাইজড কেবল-ইংরেজি বেস মডেল। উচ্চ দক্ষতা।
Whisper Standard 465 MB 850 MB Float16 (Full) বহুভাষিক স্ট্যান্ডার্ড মডেল। একাধিক ভাষার জন্য ভালো নির্ভুলতা প্রদান করে।
Whisper Standard Q5 181 MB 450 MB Q5_1 (Quantized) বহুভাষিক কোয়ান্টাইজড Whisper ছোট মডেল। সাইজ এবং বিশ্বস্ততার চমৎকার ভারসাম্য।
Whisper Standard (English) 465 MB 850 MB Float16 (Full) ইংরেজি স্ট্যান্ডার্ড কেবল-ইংরেজি মডেল। পরিষ্কার ইংরেজি স্পিচ ডিক্টেশনের জন্য আদর্শ।
Whisper Standard Q5 (English) 181 MB 450 MB Q5_1 (Quantized) ইংরেজি কোয়ান্টাইজড কেবল-ইংরেজি স্ট্যান্ডার্ড মডেল। উচ্চ মেমরি দক্ষতা।
Whisper Large (legacy) 1.43 GB 2.2 GB Float16 (Full) বহুভাষিক ব্যাপক ভাষা কভারেজ সহ পুরানো বড় মডেল। উচ্চ নির্ভুলতা, ভারী ফুটপ্রিন্ট।
Whisper Medium HQ 1.51 GB 2.3 GB Float16 (Full) বহুভাষিক উচ্চ মানের মাঝারি মডেল (টার্বো আর্কিটেকচার)। অসামান্য নির্ভুলতা।
Whisper Very Big 2.88 GB 4.2 GB Float16 (Full) বহুভাষিক সর্বোচ্চ সামগ্রিক নির্ভুলতা। ভারী ডাউনলোড, ধীর প্রসেসিং স্পিড।