Inteligência artificial caminha para entender todos os 7.000 idiomas do mundo
Startup britânica aposta em mecanismo de reconhecimento de fala que tem mais de 80% de precisão, acima das soluções do Google e AmazonBy - Cesar Schaeffer, 10 julho 2022 às 16:19
O reconhecimento de fala natural por meio de algoritmos de inteligência artificial está próximo de compreender os mais de 7.000 idiomas falados no mundo.
A tecnologia vai muito além do que oferecem hoje Apple, Amazon, Google e outras gigantes com seus assistentes. A maior promessa vem da startup de reconhecimento de fala britânica Speechmatics, que acaba de conseguir um financiamento de US$ 62 milhões.
A compreensão da linguagem natural por máquinas é hoje um grande desafio para a indústria. A tecnologia tem uma série de aplicações em potencial: robôs, veículos autônomos e, claro, computação pessoal – como PCs e smartphones. Soluções do tipo, mudaria bastante a forma como estamos a interagir com máquinas; simplesmente falando… naturalmente.
O reconhecimento de fala já está presente em algumas soluções, mas ainda é bastante limitada – tanto na questão de dispositivos quanto na questão de idiomas.
Inteligência artificial democrática
Um dos principais desafios para o entendimento da linguagem natural em diferentes idiomas por máquinas é o modelo de treinamento dos algoritmos de inteligência artificial – atualmente, a maioria é feita de forma manual. É aí que a Speechmatics entra com uma nova abordagem que promete transformar a tecnologia.
O mecanismo usado pela startup é exposto a centenas de milhares de vozes individuais usando dados de voz não rotulados e mais representativos que não requerem intervenção humana. Isso ajudou a impulsionar a cobertura além do inglês.
“A equipe da Speechmatics é extremamente ambiciosa. Temos uma herança real em tecnologia de fala combinada com alguns dos mais talentosos especialistas em fala e aprendizado de máquina do mundo”, explica o CEO Katy Wigdahl.
Atualmente, o sistema de inteligência artificial entende 34 idiomas – o que ainda é muito pouco. Mas com precisão geral de 82,8% (acima de Google e Amazon, que possuem 68,6%), a proposta é levar o reconhecimento de fala para as mais de sete mil línguas faladas em todo o mundo.
Via: ZDNet
Comentários