Inteligência artificial falha (miseravelmente) ao criar imagens de controle de PS5
Testes com o Midjourney provam que inteligência artificial generativa ainda peca em detalhes e elementos básicos da vida realBy - Igor Shimabukuro, 24 abril 2023 às 10:00
Apesar de demonstrarem grandes potenciais, os geradores de imagens baseados em inteligência artificial (IA) ainda precisam de uma boa refinada. E uma boa prova disso foi vista em uma dessas ferramentas que não foi capaz de atender a simples “pedidos gamer”.
Controle de Chernobyl?
A história começou quando um entusiasta de IA generativa resolveu testar a ferramenta Midjourney, que basicamente gera imagens com base em texto. E o pedido do usuário do Reddit @theloudestlion foi relativamente simples: “uma influenciadora relaxando jogando PlayStation 5 e se divertindo muito”.
Justiça seja feita, o Midjourney fez um bom trabalho até certo ponto: uma jovem, com roupas casuais, com número certo de dedos e usando headsets similares ao de influencers. O grande problema foi que os controles passaram longe dos manetes que estamos acostumados a ver na vida real.
Desnecessário comentar que os resultados repercutiram fortemente no fórum. Outra chance à ferramenta foi dada, e dessa vez, ela teria que gerar imagens de “alguém jogando videogame enquanto come um espaguete”. Mas novamente, o resultado não foi bem o que era esperado.
IA carece de refinamentos
Muitos comentaram sobre um prompt excessivamente amplo, uma vez que um termo intuitivo pode ser vago para o sistema de IA. Mas ao que parece, o grande problema pode estar relacionado à uma fraqueza da inteligência artificial generativa: ela é ótima para criar variações de algo que já existe, mas não se atenta muito a detalhes de coisas que estão faltando.
No exemplo do controle, o maior culpado pode ser a falta de imagens da parte traseira do acessório. E talvez a ferramenta só detecte o controle com imagens da parte da frente. Sobre o outro caso, é possível especular que não existam tantas fotos de pessoas comendo espaguete e jogando ao mesmo tempo. Daí a confusão.
Isso significa que os novos sistemas de inteligência artificial não prestam? Longe disso. Mas fica claro que, como são baseados e treinados com coisas que já existem, precisam de um refinamento e de mais bancos de dados para criações de cenários hipotéticos ou inéditos.
Do contrário, resultados como controles inversos e com múltiplos botões serão replicados — e de formas ainda mais bizarras.
Via: Kotaku
Comentários