Google atualiza política de privacidade para realizar raspagem de tudo o que for postado publicamente

Em cláusula incomum para uma política de privacidade, empresa se reserva no direito de usar dados disponíveis em qualquer parte da web pública para treinamento de IAs próprias

By - Liliane Nakagawa, 6 julho 2023 às 21:10

Com objetivo de ganhar escala no mercado da inteligência artificial generativa, ávido por dados para treinamento, o Google reservou-se o direito de coletar tudo o que o usuário postar online, segundo explicita um trecho da política de privacidade da empresa, atualizada no último fim de semana. Em outras palavras, qualquer palavra legível pertencerá automaticamente à gigante das buscas, material que possivelmente alimentará as entranhas de um chatbot.

“O Google usa informações para melhorar nossos serviços e desenvolver novos produtos, recursos e tecnologias que beneficiem nossos usuários e o público”, diz a nova política do Google. “Por exemplo, usamos informações disponíveis publicamente para ajudar a treinar os modelos de IA do Google e criar produtos e recursos como o Google Translate, o Bard e os recursos de IA na nuvem.”

Na política anterior, em vez de “modelos de IA”, a empresa mencionava o treinamento de “modelos de linguagem” e dados coletados para o Google Tradutor. Agora, a nova linguagem torna a política mais abrangente, incluindo Bard e Cloud AI.

Uma cláusula incomum para uma política de privacidade: transformação da web pública em um parquinho de IA do Google e o surgimento de novas questões de privacidade

Normalmente, essas políticas descrevem como as empresas usam as informações publicadas pelos usuários em serviços próprios. Na nova política, o Google se reserva no direito de coletar e aproveitar os dados publicados em qualquer parte da web pública, como se toda a internet fosse o próprio playground de IA da empresa.

Web pública como próprio playground: Google reserva-se o direito de coletar tudo para projetos de IA

Imagem: Cesar Schaeffer

A prática levanta novas questões de privacidade, visto que as pessoas geralmente entendem que as postagens públicas são públicas. Esse entendimento, no entanto, necessita de um novo modelo mental para a situação atual, visto que não se trata mais de uma questão de quem pode ver essas informações, mas como elas podem ser usadas.

Possivelmente, chatbots de IA como Bard e ChatGPT já tenham ingerido postagens que você tenha feito em blogs esquecidos e resenhas de restaurantes de uma década atrás.

Se uma das complicações menos óbvias no mundo pós-ChatGPT é saber onde os chatbots obtiveram a porção de dados para serem treinados, provavelmente a próxima será esclarecer se isso é legal, colocando os tribunais para lidarem efetivamente com direitos autorais. Enquanto isso, o fenômeno já afeta usuários de outras formas inesperadas.

Reação de mídias sociais

Nessa esteira, Twitter e Reddit fizeram mudanças para bloquear suas respectivas plataformas, desativando o acesso gratuito às suas APIs — uma possibilidade que qualquer pessoa tem de baixar grandes quantidades de publicações. Basicamente, o objetivo da medida é proteger os sites de mídia social de outras empresas que coletam sua propriedade intelectual.

Imagem: Brett Jordan/Unsplash

Essas alterações nas APIs das redes sociais geraram mal funcionamento das ferramentas de terceiros, prejudicando muitos usuários que as usavam para acessá-las.

No mesmo fim de semana, o Twitter limitou o número de tweets visíveis por dia para os usuários. A medida, segundo Elon Musk, era uma resposta necessária à “raspagem de dados” e à “manipulação do sistema”. O atual proprietário da rede social culpou a série de desastres recentes do Twitter pela necessidade de impedir que outros extraiam dados do site, mesmo quando os problemas parecem não estar relacionados. De acordo com a maioria dos especialistas em TI, a limitação da taxa foi mais provavelmente uma resposta de crise a problemas técnicos decorrentes de má administração, incompetência ou ambos.

Já o Reddit, o efeito das alterações da API foi particularmente mais prejudicial, visto que moderadores de grandes subreddits tendem a depender de ferramentas de terceiros para seu trabalho, ferramentas que são construídas em APIs agora inacessíveis. A rede social, que essencialmente administrada por moderadores não remunerados, basicamente fechou sob protesto em massa.

Possivelmente haverá consequências permanentes à medida que mais moderadores se aposentam enquanto a questão ainda continua em andamento.

Sobre a política de privacidade do Google, o Gizmodo pediu comentários, mas não obteve resposta imediata.

bard ChatGPT Cloud AI Google google translate Inteligência Artificial (IA) web pública Web scraping

Comentários

Please give us your valuable comment Cancelar resposta

Inscrever-se

0 Comentários

Feedbacks embutidos

Ver todos os comentários

Google atualiza política de privacidade para realizar raspagem de tudo o que for postado publicamente

By - Liliane Nakagawa, 6 julho 2023 às 21:10

Compartilhe post

Uma cláusula incomum para uma política de privacidade: transformação da web pública em um parquinho de IA do Google e o surgimento de novas questões de privacidade

Reação de mídias sociais

Compartilhe post

Comentários

Please give us your valuable comment Cancelar resposta

Matérias relacionadas

Buscas sobre termos e condições da Netflix disparam mais de 1.500% após ‘Joan Is Awful’ ser lançado

ChatGPT: como excluir histórico de bate-papo

Mais de 100 mil dispositivos infectados vazam credenciais de ChatGPT; Brasil está entre os mais afetados