तकनीकी विवरण
आकार
397 MB (0.6B) से 2.5 GB (4B)
आर्किटेक्चर
GGUF LLM (Q4_K_M)
लेटेंसी
तेज़ (Apple Silicon पर 80-120 tok/s)
कार्य
फ़ॉर्मेटिंग और व्याकरण की सफ़ाई
डेवलपर / निर्माता
Alibaba Group / llama.cpp समुदाय
डाउनलोड स्रोत
सत्यापित स्रोत रिपॉजिटरी
Hugging Face हब (tapWhisper डाउनलोडर के माध्यम से)
मॉडल रिपॉजिटरी खोलें (Qwen/Qwen2.5)मॉडल अवलोकन
Qwen 3 स्थानीय टेक्स्ट फ़ॉर्मेटिंग के लिए उपयोग किए जाने वाले GGUF प्रारूप में हल्के, उच्च-प्रदर्शन भाषा मॉडल (0.6B से 4B पैरामीटर) का एक परिवार है। tapWhisper में, STT + LLM फ़ॉर्मेटिंग का चयन करने से एक निरंतर, केवल-स्थानीय localhost llama.cpp सर्वर शुरू होता है। Qwen कच्चे स्पीच आउटपुट को फ़ॉर्मेट और साफ़ करता है: विराम चिह्न जोड़ना, व्याकरण को ठीक करना और डिवाइस पर कोड फ़ॉर्मेट करना।
उपलब्ध मॉडल संस्करण
| मॉडल संस्करण | फ़ाइल का आकार | रैम उपयोग | प्रारूप/क्वांट | भाषाएँ | विवरण |
|---|---|---|---|---|---|
| Apple Built-in Cleanup | 0 MB | 0 MB | System API | अंग्रेजी | 기본 문법 및 공백 수정을 위한 기본 로컬 텍스트 정리. |
| Small (Qwen 3 0.6B) ⭐ | 378 MB | 650 MB | Q4_K_M (GGUF) | बहुभाषी | डिफ़ॉल्ट अनुशंसित फ़ॉर्मेटर। बिजली जैसी तेज़ व्याकरण, विराम चिह्न और कोडिंग लेआउट。 |
| Medium (Qwen 3 1.7B) | 1.03 GB | 1.5 GB | Q4_K_M (GGUF) | बहुभाषी | उन्नत स्थानीय भाषा पार्सिंग। संरचनात्मक पाठ पुनर्गठन को संभालता है। |
| Large (Qwen 3 4B) | 2.33 GB | 3.2 GB | Q4_K_M (GGUF) | बहुभाषी | उच्चतम सटीकता वाला ऑफ़लाइन टेक्स्ट फ़ॉर्मेटर। एक शक्तिशाली Mac (8GB+ RAM) की आवश्यकता है। |