L'éthique de l'IA en question: OpenAI accuse la profondeur de la Chine de vol de données
Openai soupçonne que les modèles d'IA profonde de la Chine, nettement moins chers que les homologues occidentaux, peuvent avoir été formés à l'aide des données d'Openai. Cette révélation, couplée à la montée rapide de la popularité de Deepseek, a déclenché un ralentissement du marché pour les grandes sociétés d'IA. Nvidia, un acteur clé de la technologie GPU cruciale pour l'IA, a subi la plus forte perte d'actions d'une journée dans l'histoire de Wall Street, perdant près de 600 milliards de dollars de capitalisation boursière. D'autres géants de la technologie comme Microsoft, Meta, Google et Dell ont également connu des gouttes importantes.
Le modèle R1 de Deepseek, construit sur la source open sourceeek-V3, possède un coût de formation nettement inférieur (estimé à 6 millions de dollars) par rapport aux modèles occidentaux. Bien que cette réclamation soit contestée, elle a alimenté les préoccupations des investisseurs concernant les investissements massifs dans l'IA par les entreprises américaines. Le succès de Deepseek, en particulier son premier classement sur les graphiques de téléchargement des applications américaines, a encore amplifié ces préoccupations.
OpenAI et Microsoft étudient si Deepseek a violé les conditions d'utilisation d'OpenAI en utilisant son API pour former ses modèles à travers une technique appelée distillation - extraction de données de modèles plus grands. OpenAI reconnaît que les entreprises chinoises et d'autres tentent activement de reproduire les principaux modèles d'IA américains. Ils emploient activement des contre-mesures et collaborent avec le gouvernement américain pour protéger leur propriété intellectuelle.
Le conseiller de l'IA de Donald Trump, David Sacks, a confirmé le soupçon que Deepseek a utilisé la distillation, une pratique Openai considère une violation de ses termes. Cette situation met en évidence le débat en cours entourant l'utilisation du matériel protégé par le droit d'auteur dans la formation du modèle d'IA.
L'ironie n'est pas perdue pour les observateurs, compte tenu de l'histoire d'Openai. OpenAI a précédemment fait valoir que la création de modèles d'IA comme Chatgpt est impossible sans utiliser de matériel protégé par le droit d'auteur, citant une définition large du droit d'auteur englobant diverses formes d'expression humaine. Cette position est en outre soutenue par leur soumission à la Chambre des Lords du Royaume-Uni et à leurs batailles juridiques en cours. Le New York Times et 17 auteurs, dont George R. R. Martin, ont intenté des poursuites contre Openai et Microsoft, alléguant une violation du droit d'auteur. OpenAI défend ses actions en revendiquant une «utilisation équitable».
Le paysage juridique entourant les données de formation de l'IA reste complexe, en particulier concernant les problèmes de droit d'auteur, comme l'a souligné un bureau de droit d'auteur américain de 2018 que l'art généré par l'IA n'est pas le droit d'auteur en raison de l'absence d'un "lien entre l'esprit humain et l'expression créative . "



