Interfaze lança `diffusion-gemma-asr-small`, um modelo de Reconhecimento Automático de Fala de código aberto.
O novo modelo permite transcrever áudio em seis línguas diferentes, quebrando barreiras globais de comunicação.
Utiliza arquitetura de difusão e Parallel Denoising Decoder para maior precisão e robustez na transcrição.
Sendo open-source, democratiza o acesso a IA avançada para startups e desenvolvedores criarem novos apps.
Promete acelerar a inovação em assistência de voz, acessibilidade e comunicação global com ASR.
Leia o artigo completo no nosso blog.