ਤਕਨੀਕੀ ਵੇਰਵੇ
ਆਕਾਰ
4 GB ਤੋਂ 12 GB
ਆਰਕੀਟੈਕਚਰ
ਮਲਟੀ-ਮੋਡਲ ਐਲਐਲਐਮ
ਲੇਟੈਂਸੀ
ਘੱਟ (ਐਂਡ-ਟੂ-ਐਂਡ)
ਭਾਸ਼ਾ
ਬਹੁਭਾਸ਼ਾਈ
ਡਿਵੈਲਪਰ / ਨਿਰਮਾਤਾ
Google DeepMind
ਡਾਊਨਲੋਡ ਸਰੋਤ
ਮਾਡਲ ਸੰਖੇਪ ਜਾਣਕਾਰੀ
Gemma Audio ਇੱਕ ਨੇਟਿਵ ਐਂਡ-ਟੂ-ਐਂਡ ਆਡੀਓ-ਟੂ-ਟੈਕਸਟ ਮਾਡਲ ਹੈ। ਇਹ ਸਿੱਧਾ ਆਵਾਜ਼ ਦੀ ਤਰੰਗ ਨੂੰ ਟੈਕਸਟ ਵਿੱਚ ਬਦਲਦਾ ਹੈ, ਬਿਨਾਂ ਵਿਚਕਾਰਲੇ ਕਿਸੇ ਸਟੈਪ ਦੇ। ਇਹ ਇੱਕ ਲੋਕਲ LiteRT-LM ਸਰਵਰ ਰਾਹੀਂ ਚੱਲਦਾ ਹੈ। ਡਿਕਟੇਸ਼ਨ ਦੌਰਾਨ ਤੁਰੰਤ ਵਰਤੋਂ ਲਈ ਇਹ ਹਮੇਸ਼ਾ ਮੈਮੋਰੀ ਵਿੱਚ ਰਹਿੰਦਾ ਹੈ।
ਉਪਲਬਧ ਮਾਡਲ ਵੇਰੀਐਂਟ
| ਮਾਡਲ ਵੇਰੀਐਂਟ | ਫਾਈਲ ਅਕਾਰ | ਰੈਮ ਵਰਤੋਂ | ਫਾਰਮੈਟ/ਕੁਆਂਟ | ਭਾਸ਼ਾਵਾਂ | ਵੇਰਵਾ |
|---|---|---|---|---|---|
| Gemma 4 E2B | 2.41 GB | 1.7 GB | INT8 (LiteRT) | ਬਹੁ-ਭਾਸ਼ਾਈ | ਗੂਗਲ ਜੇਮਾ 4 ਆਡੀਓ-ਸਮਰੱਥ LiteRT-LM ਮਾਡਲ। ਬਹੁਤ ਕੁਸ਼ਲ ਐਂਡ-ਟੂ-ਐਂਡ ਮਾਡਲ। |
| Gemma 4 E4B | 3.41 GB | 3.3 GB | INT8 (LiteRT) | ਬਹੁ-ਭਾਸ਼ਾਈ | ਉੱਨਤ ਸਮਰੱਥਾ ਵਾਲਾ ਗੂਗਲ ਜੇਮਾ 4 ਆਡੀਓ ਮਾਡਲ। ਉੱਨਤ ਭਾਸ਼ਾ ਪ੍ਰੋਸੈਸਿੰਗ। |
| Gemma 4 12B | 6.10 GB | 12.0 GB | INT8 (LiteRT) | ਬਹੁ-ਭਾਸ਼ਾਈ | ਉੱਚ ਸ਼ੁੱਧਤਾ ਲਈ ਵੱਡਾ ਗੂਗਲ ਜੇਮਾ 4 ਆਡੀਓ ਮਾਡਲ। ਉੱਚ ਰੈਮ ਦੀ ਲੋੜ। |
| Gemma 3n | 3.40 GB | 4.5 GB | INT4 (LiteRT) | ਬਹੁ-ਭਾਸ਼ਾਈ | ਗੂਗਲ ਜੇਮਾ 3n ਆਡੀਓ ਮਾਡਲ। ਸੰਤੁਲਿਤ ਸਪੀਡ ਲਈ Int4 ਕੁਆਂਟਾਈਜ਼ਡ ਸੰਸਕਰਣ। |