A OpenAI admitiu, em documento por escrito, que é impossível treinar modelos de linguagem como o GPT-4 (essencialmente, a “base” para chatbots como o ChatGPT), sem o uso de materiais protegidos por direitos autorais.

O documento, publicado no Reino Unido em meio a um processo respondido pela empresa na Câmara dos Comuns, expressa sumariamente uma posição de que, sem usar materiais criados por outras pessoas, recursos tecnológicos como o ChatGPT, DALL-E e outras inovações da inteligência artificial (IA) generativa nunca existiriam.

Imagem mostra um smartphone com a logomarca da OpenAI na tela, à frente de um monitor de computador com vários códigos de programação em vermelho

Imagem: Camilo Concha / Shutterstock.com

Pelo trecho do documento:

“Os modelos de linguagem da OpenAI, incluindo aqueles que servem de base para o ChatGPT, são desenvolvidos por meio de três fontes primárias de dados: informações disponíveis no domínio público, informações que licenciados de terceiros e, finalmente, informações trazidas por treinadores humanos.

Pelo fato de que direitos autorais, hoje, protegem virtualmente todo tipo de expressão humana – incluindo postagens em blogs, fotografias, postagens em fóruns, partes de códigos de software etc. – seria impossível treinar modelos de IA sem o uso de materiais protegidos. Limitar os dados de treinamento apenas ao domínio público, com livros e desenhos criados há mais de 100 anos pode até resultar em um experimento interessante, mas não permitiria que sistemas de IA fossem ao encontro das demandas dos cidadãos de hoje.”

A empresa ainda afirma que, embora faça uso de conteúdos protegidos pelos direitos autorais, ela os obtém fazendo o devido licenciamento deste material, ainda que ela própria tenha a opinião de que “uso para treino” não deva ser incluído nesse tipo de proteção.

A situação remete a um entre vários processos que a OpenAI – bem como sua apoiadora primária, a Microsoft – estão respondendo no âmbito jurídico de vários países. Essencialmente, as empresas estão sendo acusadas de usarem materiais protegidos por lei, sem a devida autorização, para treinar seus chatbots de IA.

Entre novembro e dezembro, capturas de imagem (“prints”) de conversas da equipe da OpenAI no Slack foram vazadas na internet, revelando como funcionários se gabavam de usarem materiais fechados por direitos autorais nas atualizações dos modelos de linguagem da empresa. Os prints, no entanto, não entravam no mérito do material ter sido licenciado ou roubado.

Em um caso ainda mais recente, a OpenAI se viu processada pelo jornal New York Times nos EUA, sob a mesma acusação: o periódico afirma “ter sofrido danos por conta da cópia ilegal e uso das obras valiosas e únicas do The Times”. Ajuizada em 20 de dezembro, a ação ainda não tem data para julgamento.

Comentários

0

Please give us your valuable comment

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Inscrever-se
Notificar de
0 Comentários
Feedbacks embutidos
Ver todos os comentários