Um vídeo propositalmente acelerado, com escrita questionável e inconsistências de todo tipo: sim, este é mais um mod de The Elder Scrolls: Skyrim – mas ao contrário de muitos outros que aprimoram a experiência de um dos jogos mais populares da Bethesda, esse poderia ter ficado um pouquinho mais na sala de edição.

A febre das inteligências artificiais (IA) generativas chegou aos games – desde Square Enix até Ubisoft – mas o modderArt from the Machine” decidiu ir além, e incorporou o ChatGPT, além de outros dois programas (o xVASynth para transcrição texto-para-áudio, e o Whisper para transcrição áudio-para-texto) para recriar o diálogo de Skyrim. O objetivo: melhor sincronização labial entre diálogo e personagens e total ciência dos eventos do jogo pelos NPCs. O resultado obtido…bem…

As críticas que tecemos logo no primeiro parágrafo deste texto estão justificadas agora, certo? O vídeo – todos os seis minutos dele – mostram uma mídia propositalmente acelerada, a fim de que os personagens na tela sincronizassem os lábios em suas falas junto do diálogo reescrito de forma artificial. Ou seja, se rodar o vídeo na velocidade normal, tudo fica fora do lugar.

Não que isso tenha dado muito certo, e não que, se desse, fosse fazer muita diferença: o texto é…entediante, na melhor das hipóteses:

– “Já lhe contaram histórias junto à fogueira?”

– “Deixe-me pensar… [desnecessariamente longa espera]… sim, minha família costumava contar histórias junto à fogueira durante viagens de caça.”

Esse é um dos aspectos que mostram a diferença entre conversar com pessoas versus conversar com máquinas: ferramentas como o ChatGPT vão pegar o essencial da sua primeira interação – geralmente, uma pergunta ou pedido – e vão usar a expressão chave mais evidente por diversas repetições.

Neste caso, “histórias junto à fogueira” ou, no inglês, “campfire stories”. Ao criar um trecho de diálogo baseado nisso, a IA generativa da OpenAI até conseguirá cumprir o objetivo, mas vai repetir a expressão várias e várias vezes. Em outras palavras, parece um discurso ensaiado por uma criança.

A outra parte do projeto – “ciência dos eventos do jogo” – não só pareceu desnecessária, como deixou as coisas ainda mais estranhas: é até compreensível os lojistas do jogo informarem horários de funcionamento (Skyrim tem mecânicas que se alteram dentro desse parâmetro e o jogo todo tem um calendário próprio marcando hora, dia, semana, mês e ano, além de estação climática), mas a inconsistência de um vendedor atrás do balcão saber que você “pegou uma espada” é meio…forçada, considerando que a loja é…de um casal de ferreiros.

E aí vêm as interações filosóficas onde um personagem fala bem mais do que o tempo que você gostaria de dedicar à conversa e todas as alterações parecem…cosmeticamente forçadas por todo o jogo.

E as ações não batem com os diálogos. Sim, vamos ressaltar isso de novo.

No que tange à “percepção de mundo” mais generalizada, Skyrim já faz isso pelo jogo básico. Ao longo de várias interações, guardas e NPCs de uma vila costumam comentar em voz alta sobre os eventos de outros lugares, como qualquer patrulhamento comentando sobre as espadas usadas por guerreiros de Hammerfell ou os impactos da morte do imperador por todo o continente.

Mais além, o vídeo acima não é o primeiro a usar a IA generativa para alterar os diálogos em Skyrim. O material abaixo, produzido por “Bloc”, tem um pouco mais de consistência, embora ele também não seja perfeito: você tem que digitar as interações para iniciar um diálogo, e a sincronização labial ainda é atroz. Mas se o objetivo for a imersão – e esse é um dos pontos de venda de ferramentas como o ChatGPT – então este tem mais potencial:

E não esqueçamos também de um projeto similar, ambientado em um universo de certos “monstrinhos de bolso”

Isso tudo tem cara de ser um protótipo do projeto, e o potencial para que ele seja refinado é bem grande – tão grande quanto à própria IA ser, ela própria, melhorada a cada nova versão. Entretanto, nada disso poderá responder à pergunta mais evidente: “pra quê?