Um vídeo propositalmente acelerado, com escrita questionável e inconsistências de todo tipo: sim, este é mais um mod de The Elder Scrolls: Skyrim – mas ao contrário de muitos outros que aprimoram a experiência de um dos jogos mais populares da Bethesda, esse poderia ter ficado um pouquinho mais na sala de edição.

A febre das inteligências artificiais (IA) generativas chegou aos games – desde Square Enix até Ubisoft – mas o modderArt from the Machine” decidiu ir além, e incorporou o ChatGPT, além de outros dois programas (o xVASynth para transcrição texto-para-áudio, e o Whisper para transcrição áudio-para-texto) para recriar o diálogo de Skyrim. O objetivo: melhor sincronização labial entre diálogo e personagens e total ciência dos eventos do jogo pelos NPCs. O resultado obtido…bem…

As críticas que tecemos logo no primeiro parágrafo deste texto estão justificadas agora, certo? O vídeo – todos os seis minutos dele – mostram uma mídia propositalmente acelerada, a fim de que os personagens na tela sincronizassem os lábios em suas falas junto do diálogo reescrito de forma artificial. Ou seja, se rodar o vídeo na velocidade normal, tudo fica fora do lugar.

Não que isso tenha dado muito certo, e não que, se desse, fosse fazer muita diferença: o texto é…entediante, na melhor das hipóteses:

– “Já lhe contaram histórias junto à fogueira?”

– “Deixe-me pensar… [desnecessariamente longa espera]… sim, minha família costumava contar histórias junto à fogueira durante viagens de caça.”

Esse é um dos aspectos que mostram a diferença entre conversar com pessoas versus conversar com máquinas: ferramentas como o ChatGPT vão pegar o essencial da sua primeira interação – geralmente, uma pergunta ou pedido – e vão usar a expressão chave mais evidente por diversas repetições.

Neste caso, “histórias junto à fogueira” ou, no inglês, “campfire stories”. Ao criar um trecho de diálogo baseado nisso, a IA generativa da OpenAI até conseguirá cumprir o objetivo, mas vai repetir a expressão várias e várias vezes. Em outras palavras, parece um discurso ensaiado por uma criança.

A outra parte do projeto – “ciência dos eventos do jogo” – não só pareceu desnecessária, como deixou as coisas ainda mais estranhas: é até compreensível os lojistas do jogo informarem horários de funcionamento (Skyrim tem mecânicas que se alteram dentro desse parâmetro e o jogo todo tem um calendário próprio marcando hora, dia, semana, mês e ano, além de estação climática), mas a inconsistência de um vendedor atrás do balcão saber que você “pegou uma espada” é meio…forçada, considerando que a loja é…de um casal de ferreiros.

E aí vêm as interações filosóficas onde um personagem fala bem mais do que o tempo que você gostaria de dedicar à conversa e todas as alterações parecem…cosmeticamente forçadas por todo o jogo.

E as ações não batem com os diálogos. Sim, vamos ressaltar isso de novo.

No que tange à “percepção de mundo” mais generalizada, Skyrim já faz isso pelo jogo básico. Ao longo de várias interações, guardas e NPCs de uma vila costumam comentar em voz alta sobre os eventos de outros lugares, como qualquer patrulhamento comentando sobre as espadas usadas por guerreiros de Hammerfell ou os impactos da morte do imperador por todo o continente.

Mais além, o vídeo acima não é o primeiro a usar a IA generativa para alterar os diálogos em Skyrim. O material abaixo, produzido por “Bloc”, tem um pouco mais de consistência, embora ele também não seja perfeito: você tem que digitar as interações para iniciar um diálogo, e a sincronização labial ainda é atroz. Mas se o objetivo for a imersão – e esse é um dos pontos de venda de ferramentas como o ChatGPT – então este tem mais potencial:

E não esqueçamos também de um projeto similar, ambientado em um universo de certos “monstrinhos de bolso”

Isso tudo tem cara de ser um protótipo do projeto, e o potencial para que ele seja refinado é bem grande – tão grande quanto à própria IA ser, ela própria, melhorada a cada nova versão. Entretanto, nada disso poderá responder à pergunta mais evidente: “pra quê?

Comentários

4

Please give us your valuable comment

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Inscrever-se
Notificar de
4 Comentários
Feedbacks embutidos
Ver todos os comentários
Marlon
10 de maio de 2023 18:22

Cara, eu acho q pra um início está muito bom. Tem q ver tbm q não é pra qq tipo de jogador, talvez quem gosta do jogo mais dinâmico não ache muita graça no mod. Só sei q esperei mais de 10 anos pra saber como aquele bendito soldado recebeu aquela flechada no joelho kkkk

Misa
11 de maio de 2023 14:48

Se o autor fosse um gamer, não iria perguntar o “pra que?” no final.
Prefere um game todo cheio de script e sem surpresas ou um game totalmente dinâmico e onde toda conversa é diferente e interessante?

Ein
12 de maio de 2023 06:53

Acho que o “pra quê?” serve pra essa matéria também. Muito bem escrita, gramaticalmente falando, fundação de argumentos bons baseados na análise do tema, mas honestamente… pra quê? Se quem usufrui do jogo está gostando, surpresos e esperançosos com o que vem pela frente, “pra quê” se ater a uma obviedade? É uma ferramenta recém nascida, claro que haverão pausas longas enquanto a IA está formulando as frases e gerando as vozes. Realmente, pra quê?

Mohajo
12 de maio de 2023 17:57

Essa matéria não faz o menor sentido.

O mod é praticamente uma prova de conceito de uma tecnologia que ainda está dando os primeiros passos, que o criador fez e disponibilizou de graça, mas o autor do artigo cobra como se fosse uma grande empresa fazendo um produto comercial.

Para o estado da tecnologia atual, é o que tem. E já é impressionante pelo que dá pra fazer hoje.