Apesar de demonstrarem grandes potenciais, os geradores de imagens baseados em inteligência artificial (IA) ainda precisam de uma boa refinada. E uma boa prova disso foi vista em uma dessas ferramentas que não foi capaz de atender a simples “pedidos gamer”.

Controle de Chernobyl?

A história começou quando um entusiasta de IA generativa resolveu testar a ferramenta Midjourney, que basicamente gera imagens com base em texto. E o pedido do usuário do Reddit @theloudestlion foi relativamente simples: “uma influenciadora relaxando jogando PlayStation 5 e se divertindo muito”.

Justiça seja feita, o Midjourney fez um bom trabalho até certo ponto: uma jovem, com roupas casuais, com número certo de dedos e usando headsets similares ao de influencers. O grande problema foi que os controles passaram longe dos manetes que estamos acostumados a ver na vida real.

Resultados da ferramenta de inteligência artificial generativa Midjourney

Imagem: reprodução/theloudestlion

Desnecessário comentar que os resultados repercutiram fortemente no fórum. Outra chance à ferramenta foi dada, e dessa vez, ela teria que gerar imagens de “alguém jogando videogame enquanto come um espaguete”. Mas novamente, o resultado não foi bem o que era esperado.

Resultados da ferramenta de inteligência artificial generativa Midjourney 2

Imagem: reprodução/pinkdreamery

IA carece de refinamentos

Muitos comentaram sobre um prompt excessivamente amplo, uma vez que um termo intuitivo pode ser vago para o sistema de IA. Mas ao que parece, o grande problema pode estar relacionado à uma fraqueza da inteligência artificial generativa: ela é ótima para criar variações de algo que já existe, mas não se atenta muito a detalhes de coisas que estão faltando.

No exemplo do controle, o maior culpado pode ser a falta de imagens da parte traseira do acessório. E talvez a ferramenta só detecte o controle com imagens da parte da frente. Sobre o outro caso, é possível especular que não existam tantas fotos de pessoas comendo espaguete e jogando ao mesmo tempo. Daí a confusão.

Isso significa que os novos sistemas de inteligência artificial não prestam? Longe disso. Mas fica claro que, como são baseados e treinados com coisas que já existem, precisam de um refinamento e de mais bancos de dados para criações de cenários hipotéticos ou inéditos.

Do contrário, resultados como controles inversos e com múltiplos botões serão replicados — e de formas ainda mais bizarras.

Via: Kotaku

Comentários

0

Please give us your valuable comment

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Inscrever-se
Notificar de
0 Comentários
Feedbacks embutidos
Ver todos os comentários