tapWhisper — OpenAI Whisper GGML

প্রযুক্তিগত বৈশিষ্ট্য

আকার 75 MB (Tiny) থেকে 1.5 GB (Large)

আর্কিটেকচার Transformer Encoder-Decoder

ল্যাটেন্সি গড় ডিক্টেশনের জন্য ১-৩ সেকেন্ড

ভাষা ৯৯+ ভাষা

ডেভেলপার / নির্মাতা

OpenAI (মূল ওজন), GGML / whisper.cpp সম্প্রদায় (কোয়ান্টাইজড ফাইল)

লাইসেন্স

MIT

ডাউনলোড উৎস

Source Repository

Hugging Face হাব (tapWhisper ডাউনলোডারের মাধ্যমে)

ggerganov/whisper.cpp

সঠিক রানটাইম ফাইল

মডেল পরিচিতি

Whisper হল OpenAI-এর একটি সর্বাধুনিক সাধারণ-উদ্দেশ্যমূলক ভয়েস রিকগনিশন মডেল। tapWhisper-এ, অ্যাপল সিলিকনে সম্পূর্ণ মেটাল জিপিইউ অ্যাক্সিলারেশন সহ whisper.cpp (GGML ফরম্যাট) ব্যবহার করে অফলাইনে হুইস্পার মডেল চলে। ব্যবহারকারীরা সেটিংস থেকে বিভিন্ন আকারের মডেল ডাউনলোড করতে পারেন। এটি চরম বহুভাষিক নির্ভুলতা সরবরাহ করে।

উপলব্ধ মডেল ভেরিয়েন্ট

মডেল ভেরিয়েন্ট	ফাইল সাইজ	র‍্যাম ব্যবহার	ফরম্যাট/কোয়াণ্ট	ভাষা	বিবরণ
Whisper Very Small	74 MB	180 MB	Float16 (Full)	বহুভাষিক	সবচেয়ে দ্রুত ট্রান্সক্রিপশন স্পিড, কম নির্ভুলতা। দ্রুত পরীক্ষার জন্য আদর্শ।
Whisper Very Small Q5	31 MB	110 MB	Q5_1 (Quantized)	বহুভাষিক	সবচেয়ে ছোট কোয়ান্টাইজড Whisper অপশন。অত্যন্ত কম স্টোরেজ প্রয়োজন।
Whisper Small	141 MB	300 MB	Float16 (Full)	বহুভাষিক	সহজ দৈনিক বাক্যের জন্য ভালো নির্ভুলতা সহ ভারসাম্যपूर्ण বেস মডেল।
Whisper Small Q5	57 MB	180 MB	Q5_1 (Quantized)	বহুভাষিক	কোয়ান্টাইজড Whisper বেস মডেল। অপ্টিমাইজড মেমরি এবং স্টোরেজ ব্যবহার।
Whisper Medium ⭐	547 MB	900 MB	Q5_0 (Quantized)	বহুভাষিক	সেরা গতি-গুণমান অনুপাত। ডিফল্ট অফলাইন модель হিসাবে প্রস্তাবিত।
Whisper Very Small (English)	74 MB	180 MB	Float16 (Full)	ইংরেজি	সবচেয়ে দ্রুত কেবল-ইংরেজি ডিক্টেশন модель। কম রিসোর্স খরচ।
Whisper Very Small Q5 (English)	31 MB	110 MB	Q5_1 (Quantized)	ইংরেজি	কোয়ান্টাইজড কেবল-ইংরেজি ক্ষুদ্র মডেল। অত্যন্ত হালকা।
Whisper Small (English)	141 MB	300 MB	Float16 (Full)	ইংরেজি	স্ট্যান্ডার্ড ডিক্টেশনের জন্য স্ট্যান্ডার্ড কেবল-ইংরেজি বেস মডেল।
Whisper Small Q5 (English)	57 MB	180 MB	Q5_1 (Quantized)	ইংরেজি	কোয়ান্টাইজড কেবল-ইংরেজি বেস মডেল। উচ্চ দক্ষতা।
Whisper Standard	465 MB	850 MB	Float16 (Full)	বহুভাষিক	স্ট্যান্ডার্ড মডেল। একাধিক ভাষার জন্য ভালো নির্ভুলতা প্রদান করে।
Whisper Standard Q5	181 MB	450 MB	Q5_1 (Quantized)	বহুভাষিক	কোয়ান্টাইজড Whisper ছোট মডেল। সাইজ এবং বিশ্বস্ততার চমৎকার ভারসাম্য।
Whisper Standard (English)	465 MB	850 MB	Float16 (Full)	ইংরেজি	স্ট্যান্ডার্ড কেবল-ইংরেজি মডেল। পরিষ্কার ইংরেজি স্পিচ ডিক্টেশনের জন্য আদর্শ।
Whisper Standard Q5 (English)	181 MB	450 MB	Q5_1 (Quantized)	ইংরেজি	কোয়ান্টাইজড কেবল-ইংরেজি স্ট্যান্ডার্ড মডেল। উচ্চ মেমরি দক্ষতা।
Whisper Large (legacy)	1.43 GB	2.2 GB	Float16 (Full)	বহুভাষিক	ব্যাপক ভাষা কভারেজ সহ পুরানো বড় মডেল। উচ্চ নির্ভুলতা, ভারী ফুটপ্রিন্ট।
Whisper Medium HQ	1.51 GB	2.3 GB	Float16 (Full)	বহুভাষিক	উচ্চ মানের মাঝারি মডেল (টার্বো আর্কিটেকচার)। অসামান্য নির্ভুলতা।
Whisper Very Big	2.88 GB	4.2 GB	Float16 (Full)	বহুভাষিক	সর্বোচ্চ সামগ্রিক নির্ভুলতা। ভারী ডাউনলোড, ধীর প্রসেসিং স্পিড।

tapWhisper-এ ফিরে যান