tapWhisper ਤੇ ਵਾਪਸ ਜਾਓ
ਮਾਡਲ ਪ੍ਰੋਫਾਈਲ

Google Gemma ਆਡੀਓ ਮਾਡਲ

4 ਵੇਰੀਐਂਟ

ਤਕਨੀਕੀ ਵੇਰਵੇ

ਆਕਾਰ 4 GB ਤੋਂ 12 GB
ਆਰਕੀਟੈਕਚਰ ਮਲਟੀ-ਮੋਡਲ ਐਲਐਲਐਮ
ਲੇਟੈਂਸੀ ਘੱਟ (ਐਂਡ-ਟੂ-ਐਂਡ)
ਭਾਸ਼ਾ ਬਹੁਭਾਸ਼ਾਈ

ਡਿਵੈਲਪਰ / ਨਿਰਮਾਤਾ

Google DeepMind

ਡਾਊਨਲੋਡ ਸਰੋਤ

Source Repository

Hugging Face ਹੱਬ / ਗੂਗਲ ਮਾਡਲ ਰਜਿਸਟਰੀ

Open Repository (google/gemma-3)

ਮਾਡਲ ਸੰਖੇਪ ਜਾਣਕਾਰੀ

Gemma Audio ਇੱਕ ਨੇਟਿਵ ਐਂਡ-ਟੂ-ਐਂਡ ਆਡੀਓ-ਟੂ-ਟੈਕਸਟ ਮਾਡਲ ਹੈ। ਇਹ ਸਿੱਧਾ ਆਵਾਜ਼ ਦੀ ਤਰੰਗ ਨੂੰ ਟੈਕਸਟ ਵਿੱਚ ਬਦਲਦਾ ਹੈ, ਬਿਨਾਂ ਵਿਚਕਾਰਲੇ ਕਿਸੇ ਸਟੈਪ ਦੇ। ਇਹ ਇੱਕ ਲੋਕਲ LiteRT-LM ਸਰਵਰ ਰਾਹੀਂ ਚੱਲਦਾ ਹੈ। ਡਿਕਟੇਸ਼ਨ ਦੌਰਾਨ ਤੁਰੰਤ ਵਰਤੋਂ ਲਈ ਇਹ ਹਮੇਸ਼ਾ ਮੈਮੋਰੀ ਵਿੱਚ ਰਹਿੰਦਾ ਹੈ।

ਉਪਲਬਧ ਮਾਡਲ ਵੇਰੀਐਂਟ

ਮਾਡਲ ਵੇਰੀਐਂਟ ਫਾਈਲ ਅਕਾਰ ਰੈਮ ਵਰਤੋਂ ਫਾਰਮੈਟ/ਕੁਆਂਟ ਭਾਸ਼ਾਵਾਂ ਵੇਰਵਾ
Gemma 4 E2B 2.41 GB 1.7 GB INT8 (LiteRT) ਬਹੁ-ਭਾਸ਼ਾਈ ਗੂਗਲ ਜੇਮਾ 4 ਆਡੀਓ-ਸਮਰੱਥ LiteRT-LM ਮਾਡਲ। ਬਹੁਤ ਕੁਸ਼ਲ ਐਂਡ-ਟੂ-ਐਂਡ ਮਾਡਲ।
Gemma 4 E4B 3.41 GB 3.3 GB INT8 (LiteRT) ਬਹੁ-ਭਾਸ਼ਾਈ ਉੱਨਤ ਸਮਰੱਥਾ ਵਾਲਾ ਗੂਗਲ ਜੇਮਾ 4 ਆਡੀਓ ਮਾਡਲ। ਉੱਨਤ ਭਾਸ਼ਾ ਪ੍ਰੋਸੈਸਿੰਗ।
Gemma 4 12B 6.10 GB 12.0 GB INT8 (LiteRT) ਬਹੁ-ਭਾਸ਼ਾਈ ਉੱਚ ਸ਼ੁੱਧਤਾ ਲਈ ਵੱਡਾ ਗੂਗਲ ਜੇਮਾ 4 ਆਡੀਓ ਮਾਡਲ। ਉੱਚ ਰੈਮ ਦੀ ਲੋੜ।
Gemma 3n 3.40 GB 4.5 GB INT4 (LiteRT) ਬਹੁ-ਭਾਸ਼ਾਈ ਗੂਗਲ ਜੇਮਾ 3n ਆਡੀਓ ਮਾਡਲ। ਸੰਤੁਲਿਤ ਸਪੀਡ ਲਈ Int4 ਕੁਆਂਟਾਈਜ਼ਡ ਸੰਸਕਰਣ।