ਤਕਨੀਕੀ ਵੇਰਵੇ
ਆਕਾਰ
75 MB (Tiny) ਤੋਂ 1.5 GB (Large)
ਆਰਕੀਟੈਕਚਰ
Transformer Encoder-Decoder
ਲੇਟੈਂਸੀ
ਔਸਤ ਡਿਕਟੇਸ਼ਨ ਲਈ 1-3s
ਭਾਸ਼ਾ
99+ ਭਾਸ਼ਾਵਾਂ
ਡਿਵੈਲਪਰ / ਨਿਰਮਾਤਾ
OpenAI (ਅਸਲ ਵੇਟਸ), GGML / whisper.cpp ਕਮਿਊਨਿਟੀ (ਕੁਆਂਟਾਈਜ਼ਡ ਫਾਈਲਾਂ)
ਡਾਊਨਲੋਡ ਸਰੋਤ
Source Repository
Hugging Face ਹੱਬ (tapWhisper ਡਾਊਨਲੋਡਰ ਦੇ ਜ਼ਰੀਏ)
Open Repository (ggerganov/whisper.cpp)ਮਾਡਲ ਸੰਖੇਪ ਜਾਣਕਾਰੀ
Whisper, OpenAI ਦਾ ਵਿਸ਼ਵ-ਪੱਧਰੀ ਭਾਸ਼ਣ ਪਛਾਣ ਮਾਡਲ ਹੈ। tapWhisper ਵਿੱਚ, Whisper ਮਾਡਲ Apple Silicon ਤੇ ਪੂਰੇ ਮੈਟਲ ਜੀਪੀਯੂ ਨਾਲ whisper.cpp (GGML ਫਾਰਮੈਟ) ਰਾਹੀਂ ਆਫਲਾਈਨ ਚੱਲਦੇ ਹਨ। ਯੂਜ਼ਰਸ ਸੈਟਿੰਗਾਂ ਵਿੱਚੋਂ ਵੱਖ-ਵੱਖ ਆਕਾਰ (Base, Small, Medium, Large) ਡਾਊਨਲੋਡ ਕਰ ਸਕਦੇ ਹਨ। ਇਹ ਬਹੁਤ ਸਹੀ ਨਤੀਜੇ ਦਿੰਦਾ ਹੈ।
ਉਪਲਬਧ ਮਾਡਲ ਵੇਰੀਐਂਟ
| ਮਾਡਲ ਵੇਰੀਐਂਟ | ਫਾਈਲ ਅਕਾਰ | ਰੈਮ ਵਰਤੋਂ | ਫਾਰਮੈਟ/ਕੁਆਂਟ | ਭਾਸ਼ਾਵਾਂ | ਵੇਰਵਾ |
|---|---|---|---|---|---|
| Whisper Very Small | 74 MB | 180 MB | Float16 (Full) | ਬਹੁ-ਭਾਸ਼ਾਈ | ਸਭ ਤੋਂ ਤੇਜ਼ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਸਪੀਡ, ਘੱਟ ਸ਼ੁੱਧਤਾ। ਟੈਸਟਿੰਗ ਲਈ ਵਧੀਆ। |
| Whisper Very Small Q5 | 31 MB | 110 MB | Q5_1 (Quantized) | ਬਹੁ-ਭਾਸ਼ਾਈ | ਸਭ ਤੋਂ ਛੋਟਾ ਕੁਆਂਟਾਈਜ਼ਡ Whisper ਵਿਕਲਪ। ਬਹੁਤ ਘੱਟ ਸਟੋਰੇਜ ਦੀ ਲੋੜ। |
| Whisper Small | 141 MB | 300 MB | Float16 (Full) | ਬਹੁ-ਭਾਸ਼ਾਈ | ਸਧਾਰਨ ਰੋਜ਼ਾਨਾ ਵਾਕਾਂ ਲਈ ਵਧੀਆ ਸ਼ੁੱਧਤਾ ਵਾਲਾ ਸੰਤੁਲਿਤ ਬੇਸ ਮਾਡਲ। |
| Whisper Small Q5 | 57 MB | 180 MB | Q5_1 (Quantized) | ਬਹੁ-ਭਾਸ਼ਾਈ | ਕੁਆਂਟਾਈਜ਼ਡ Whisper ਬੇਸ ਮਾਡਲ। ਅਨੁਕੂਲਿਤ ਮੈਮੋਰੀ ਅਤੇ ਸਟੋਰੇਜ ਵਰਤੋਂ। |
| Whisper Medium ⭐ | 547 MB | 900 MB | Q5_0 (Quantized) | ਬਹੁ-ਭਾਸ਼ਾਈ | ਸਭ ਤੋਂ ਵਧੀਆ ਸਪੀਡ-ਟੂ-ਕੁਆਲਿਟੀ ਅਨੁਪਾਤ। ਡਿਫੌਲਟ ਔਫਲਾਈਨ ਮਾਡਲ ਵਜੋਂ ਸਿਫਾਰਸ਼ ਕੀਤੀ। |
| Whisper Very Small (English) | 74 MB | 180 MB | Float16 (Full) | ਅੰਗਰੇਜ਼ੀ | ਸਭ ਤੋਂ ਤੇਜ਼ ਕੇਵਲ-ਅੰਗਰੇਜ਼ੀ ਡਿਕਟੇਸ਼ਨ ਮਾਡਲ। ਘੱਟ ਸਰੋਤ ਖਪਤ। |
| Whisper Very Small Q5 (English) | 31 MB | 110 MB | Q5_1 (Quantized) | ਅੰਗਰੇਜ਼ੀ | ਕੁਆਂਟਾਈਜ਼ਡ ਕੇਵਲ-ਅੰਗਰੇਜ਼ੀ ਛੋਟਾ ਮਾਡਲ। ਬਹੁਤ ਹਲਕਾ। |
| Whisper Small (English) | 141 MB | 300 MB | Float16 (Full) | ਅੰਗਰੇਜ਼ੀ | ਮਿਆਰੀ ਡਿਕਟੇਸ਼ਨ ਲਈ ਮਿਆਰੀ ਕੇਵਲ-ਅੰਗਰੇਜ਼ੀ ਬੇਸ ਮਾਡਲ। |
| Whisper Small Q5 (English) | 57 MB | 180 MB | Q5_1 (Quantized) | ਅੰਗਰੇਜ਼ੀ | ਕੁਆਂਟਾਈਜ਼ਡ ਕੇਵਲ-ਅੰਗਰੇਜ਼ੀ ਬੇਸ ਮਾਡਲ। ਉੱਚ ਕੁਸ਼ਲਤਾ। |
| Whisper Standard | 465 MB | 850 MB | Float16 (Full) | ਬਹੁ-ਭਾਸ਼ਾਈ | ਮਿਆਰੀ ਮਾਡਲ। ਕਈ ਭਾਸ਼ਾਵਾਂ ਲਈ ਵਧੀਆ ਸ਼ੁੱਧਤਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। |
| Whisper Standard Q5 | 181 MB | 450 MB | Q5_1 (Quantized) | ਬਹੁ-ਭਾਸ਼ਾਈ | ਕੁਆਂਟਾਈਜ਼ਡ Whisper ਛੋਟਾ ਮਾਡਲ। ਅਕਾਰ ਅਤੇ ਸ਼ੁੱਧਤਾ ਦਾ ਵਧੀਆ ਸੰਤੁਲਨ। |
| Whisper Standard (English) | 465 MB | 850 MB | Float16 (Full) | ਅੰਗਰੇਜ਼ੀ | ਮਿਆਰੀ ਕੇਵਲ-ਅੰਗਰੇਜ਼ੀ ਮਾਡਲ। ਸਾਫ਼ ਅੰਗਰੇਜ਼ੀ ਡਿਕਟੇਸ਼ਨ ਲਈ ਵਧੀਆ। |
| Whisper Standard Q5 (English) | 181 MB | 450 MB | Q5_1 (Quantized) | ਅੰਗਰੇਜ਼ੀ | ਕੁਆਂਟਾਈਜ਼ਡ ਕੇਵਲ-ਅੰਗਰੇਜ਼ੀ ਮਿਆਰੀ ਮਾਡਲ। ਉੱਚ ਮੈਮੋਰੀ ਕੁਸ਼ਲਤਾ। |
| Whisper Large (legacy) | 1.43 GB | 2.2 GB | Float16 (Full) | ਬਹੁ-ਭਾਸ਼ਾਈ | ਵਿਆਪਕ ਭਾਸ਼ਾ ਕਵਰੇਜ ਵਾਲਾ ਪੁਰਾਣਾ ਵੱਡਾ ਮਾਡਲ। ਉੱਚ ਸ਼ੁੱਧਤਾ, ਵੱਡਾ ਅਕਾਰ। |
| Whisper Medium HQ | 1.51 GB | 2.3 GB | Float16 (Full) | ਬਹੁ-ਭਾਸ਼ਾਈ | ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲਾ ਮੱਧਮ ਮਾਡਲ (ਟਰਬੋ ਆਰਕੀਟੈਕਚਰ)। ਬਹੁਤ ਵਧੀਆ ਸ਼ੁੱਧਤਾ। |
| Whisper Very Big | 2.88 GB | 4.2 GB | Float16 (Full) | ਬਹੁ-ਭਾਸ਼ਾਈ | ਅਧਿਕਤਮ ਆਮ ਸ਼ੁੱਧਤਾ। ਭਾਰੀ ਡਾਊਨਲੋਡ, ਹੌਲੀ ਪ੍ਰੋਸੈਸਿੰਗ ਓਵਰਹੈੱਡ। |