Ética da IA ​​em questão: Openai acusa o Deepseek de roubo de dados da China

Autor : Ava Feb 12,2025

Openai suspeita que os modelos Deepseek AI da China, significativamente mais baratos que os colegas ocidentais, podem ter sido treinados usando os dados do OpenAI. Essa revelação, juntamente com o rápido aumento da popularidade da Deepseek, desencadeou uma desaceleração do mercado para as principais empresas de IA. A Nvidia, uma participante importante na tecnologia GPU crucial para a IA, sofreu a maior perda de ações de um dia na história de Wall Street, perdendo quase US $ 600 bilhões em capitalização de mercado. Outros gigantes da tecnologia como Microsoft, Meta, Google e Dell também experimentaram gotas significativas.

O modelo R1 da Deepseek, construído no Deepseek-V3 de código aberto, possui um custo de treinamento significativamente menor (estimado em US $ 6 milhões) em comparação aos modelos ocidentais. Embora essa reivindicação seja contestada, alimentou as preocupações dos investidores sobre os enormes investimentos em IA por empresas americanas. O sucesso da Deepseek, particularmente o seu melhor classificação nas paradas de download de aplicativos dos EUA, amplificou ainda mais essas preocupações.

OpenAI e Microsoft estão investigando se a Deepseek violou os Termos de Serviço da OpenAI usando sua API para treinar seus modelos através de uma técnica chamada destilação - extraindo dados de modelos maiores. O OpenAI reconhece que as empresas chinesas e outras, tentam ativamente replicar os principais modelos de IA dos EUA. Eles estão empregando ativamente contramedidas e colaborando com o governo dos EUA para proteger sua propriedade intelectual.

O conselheiro de AI de Donald Trump, David Sacks, confirmou a suspeita de que a Deepseek empregou destilação, uma prática OpenAI considera uma violação de seus termos. Esta situação destaca o debate em andamento em torno do uso de material protegido por direitos autorais no treinamento do modelo de IA.

A ironia não está perdida para os observadores, dada a própria história do Openai. Openi anteriormente argumentou que a criação de modelos de IA como o ChatGPT é impossível sem usar material protegido por direitos autorais, citando uma definição ampla de direitos autorais que abrange várias formas de expressão humana. Essa postura é ainda mais apoiada por sua submissão à Câmara dos Lordes do Reino Unido e suas batalhas legais em andamento. O New York Times e 17 autores, incluindo George R. R. Martin, entraram com ações contra o Openai e a Microsoft, alegando violação de direitos autorais. O Openai defende suas ações reivindicando "uso justo".

O cenário legal em torno dos dados de treinamento da IA ​​permanece complexo, particularmente em relação a questões de direitos autorais, conforme destacado por um escritório de direitos autorais dos EUA em 2018 que decidiu que a arte gerada pela IA não é direitos autorais devido à falta de um "nexo entre a mente humana e a expressão criativa . "

Deepseek é acusado de usar o modelo do OpenAI para treinar seu concorrente usando destilação. Crédito da imagem: Andrey Rudakov/Bloomberg via Getty Images.