ਮਾਡਲ ਪ੍ਰੋਫਾਈਲ
ਸਮਰਥਿਤ ਆਨ-ਡੀਵਾਈਸ ਮਾਡਲ
tapWhisper ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਪ੍ਰਾਈਵੇਸੀ ਅਤੇ ਪ੍ਰਦਰਸ਼ਨ ਲਈ ਪੂਰੀ ਤਰ੍ਹਾਂ ਆਫਲਾਈਨ ਅਤੇ ਆਨ-ਡੀਵਾਈਸ ਚਲਾਉਣ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਸਾਡੇ ਇੰਜਣ ਦੁਆਰਾ ਸਮਰਥਿਤ ਮਾਡਲ ਦੇਖੋ।
macOS ਤੇ Apple Speech
Apple Speech, tapWhisper ਵਿੱਚ ਡਿਫੌਲਟ, ਜ਼ੀਰੋ-ਕੌਂਫਿਗਰੇਸ਼ਨ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਇੰਜਣ ਹੈ। ਇਹ Apple ਦੇ ਇਨ-ਬਿਲਟ Speech ਫਰੇਮਵਰਕ ਦੀ ਵਰਤੋਂ ਕਰਕੇ 100% ਡਿਵਾਈਸ ਤੇ ਹੀ ਚੱਲਦਾ ਹੈ। ਇਹ ਲਗਭਗ ਜ਼ੀਰੋ ਸੈੱਟਅੱਪ ਸਮਾਂ ਲੈਂਦਾ ਹੈ, ਬਹੁਤ ਘੱਟ ਰੈਮ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ, ਅਤੇ Apple Silicon (M1/M2/M3/M4) ਅਤੇ Intel ਚਿੱਪਾਂ ਲਈ ਬਹੁਤ ਵਧੀਆ ਹੈ। ਕਿਉਂਕਿ ਇਹ ਸਿਸਟਮ API ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ, ਮਾਡਲ ਫਾਈਲਾਂ ਡਾਊਨਲੋਡ ਕਰਨ ਦੀ ਲੋੜ ਨਹੀਂ ਪੈਂਦੀ।
OpenAI Whisper GGML
Whisper, OpenAI ਦਾ ਵਿਸ਼ਵ-ਪੱਧਰੀ ਭਾਸ਼ਣ ਪਛਾਣ ਮਾਡਲ ਹੈ। tapWhisper ਵਿੱਚ, Whisper ਮਾਡਲ Apple Silicon ਤੇ ਪੂਰੇ ਮੈਟਲ ਜੀਪੀਯੂ ਨਾਲ whisper.
Useful Sensors Moonshine
Moonshine ਇੱਕ ਬਹੁਤ ਹੀ ਹਲਕਾ ਅਤੇ ਘੱਟ ਲੇਟੈਂਸੀ ਵਾਲਾ ਮਾਡਲ ਹੈ ਜੋ ਰੀਅਲ-ਟਾਈਮ ਵਰਤੋਂ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਹ ਬਹੁਤ ਘੱਟ ਮੈਮੋਰੀ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਵ੍ਹੀਸਪਰ ਜਿੰਨੀ ਹੀ ਸ਼ੁੱਧਤਾ ਨਾਲ ਬਹੁਤ ਤੇਜ਼ੀ ਨਾਲ ਕੰਮ ਕਰਦਾ ਹੈ। ਇਹ Sherpa ONNX ਰਨਟਾਈਮ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਚੱਲਦਾ ਹੈ।
NVIDIA Parakeet ONNX
NVIDIA ਦਾ Parakeet ਅੰਗਰੇਜ਼ੀ ਭਾਸ਼ਾ ਲਈ ਇੱਕ ਸ਼ਾਨਦਾਰ ਮਾਡਲ ਹੈ। ਇਹ Sherpa ONNX ਇੰਜਣ ਰਾਹੀਂ ਚਲਾਉਣ ਲਈ INT8 ONNX ਫਾਰਮੈਟ ਵਿੱਚ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਹ ਕੋਡਿੰਗ ਅਤੇ ਆਮ ਕੰਮਾਂ ਲਈ ਬਹੁਤ ਸਹੀ ਅਤੇ ਤੇਜ਼ ਨਤੀਜੇ ਦਿੰਦਾ ਹੈ।
NVIDIA Canary ONNX
NVIDIA ਦਾ Canary ਇੱਕ ਉੱਨਤ ਬਹੁਭਾਸ਼ਾਈ ਮਾਡਲ ਹੈ ਜੋ ਅੰਗਰੇਜ਼ੀ, ਸਪੈਨਿਸ਼, ਜਰਮਨ ਅਤੇ ਫ੍ਰੈਂਚ ਭਾਸ਼ਾਵਾਂ ਦਾ ਸਮਰਥਨ ਕਰਦਾ ਹੈ। ਇਹ ਆਨ-ਡਿਵਾਈਸ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਅਤੇ ਅਨੁਵਾਦ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਰੱਖਦਾ ਹੈ। ਇਹ ਸ਼ੇਰਪਾ ਓਐਨਐਨਐਕਸ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਬਹੁਤ ਵਧੀਆ ਕੰਮ ਕਰਦਾ ਹੈ।
Google Gemma ਆਡੀਓ ਮਾਡਲ
Gemma Audio ਇੱਕ ਨੇਟਿਵ ਐਂਡ-ਟੂ-ਐਂਡ ਆਡੀਓ-ਟੂ-ਟੈਕਸਟ ਮਾਡਲ ਹੈ। ਇਹ ਸਿੱਧਾ ਆਵਾਜ਼ ਦੀ ਤਰੰਗ ਨੂੰ ਟੈਕਸਟ ਵਿੱਚ ਬਦਲਦਾ ਹੈ, ਬਿਨਾਂ ਵਿਚਕਾਰਲੇ ਕਿਸੇ ਸਟੈਪ ਦੇ। ਇਹ ਇੱਕ ਲੋਕਲ LiteRT-LM ਸਰਵਰ ਰਾਹੀਂ ਚੱਲਦਾ ਹੈ। ਡਿਕਟੇਸ਼ਨ ਦੌਰਾਨ ਤੁਰੰਤ ਵਰਤੋਂ ਲਈ ਇਹ ਹਮੇਸ਼ਾ ਮੈਮੋਰੀ ਵਿੱਚ ਰਹਿੰਦਾ ਹੈ।
Alibaba Qwen 3 ਫਾਰਮੈਟਰ
Qwen 3 ਇੱਕ ਹਲਕਾ ਅਤੇ ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲਾ ਭਾਸ਼ਾ ਮਾਡਲ ਹੈ ਜੋ ਟੈਕਸਟ ਦੇ ਫਾਰਮੈਟ ਨੂੰ ਸੁਧਾਰਨ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ। tapWhisper ਵਿੱਚ, ਇਹ ਲੋਕਲ ਹੋਸਟ llama.