ChatGPT ganha voz para conversar com usuários
OpenAI atualiza do ChatGPT, que agora também é capaz de analisar imagens para dar respostas ao usuáriosBy - Cesar Schaeffer, 26 setembro 2023 às 15:47
Depois de puxar o grande boom da inteligência artificial generativa, o ChatGPT está evoluindo – agora, mais do que um mecanismo inteligente baseado em texto, a OpenAI anunciou a chegada de novos recursos baseados em voz e imagem à ferramenta. Ou seja, os usuários poderão manter uma conversa por voz com o chatbot.
A atualização vai permitir que o usuário pergunte algo verbalmente ou até peça para que a inteligência artificial crie uma história na hora de dormir.
Usando um novo modelo de converter texto em fala, o recurso de voz do ChatGPT é capaz de gerar vozes semelhantes às humanas a partir de texto e apenas alguns segundos de amostra. Segundo a OpenAI, são cinco vozes diferentes, com seu sistema de reconhecimento de fala Whisper de código aberto usado para transcrever declarações verbais em texto.
O Spotify é o primeiro parceiro de lançamento do recurso de voz da OpenAI. A plataforma de streaming anunciou uma nova funcionalidade para podcasters que lhes permite experimentar sua voz e traduzir seus programas do inglês para o espanhol, francês ou alemão – mantendo sua voz original.
“A nova tecnologia de voz – capaz de criar vozes sintéticas realistas a partir de apenas alguns segundos de fala real – abre portas para muitas aplicações criativas e focadas na acessibilidade”, explica a empresa. “No entanto, estas capacidades também apresentam novos riscos, como a possibilidade de intervenientes mal-intencionados se passarem por figuras públicas ou cometerem fraude”.
ChatGPT também ganha “olhos” e agora enxerga
A atualização também permite que os usuários do chatbot procurem respostas usando imagens. Basta enviar uma imagem ao ChatGPT e pedir algo ao mesmo tempo como, por exemplo, explicar o que é visto na cena ou até instruções do que fazer em determinadas situações.
Os novos recursos (voz e imagem) serão implementados para assinantes Plus e Enterprise nas próximas duas semanas. A voz será limitada inicialmente aos aplicativos ChatGPT para Android e iOS em uma versão beta opcional, enquanto a pesquisa de imagens chegará a todas as plataformas por padrão.
Comentários