AI Ética en cuestión: OpenAi acusa a la profundidad de robo de datos de China
OpenAi sospecha que los modelos de IA Deepseek de China, significativamente más baratos que las contrapartes occidentales, pueden haber sido entrenados utilizando los datos de OpenAI. Esta revelación, junto con el rápido aumento de la popularidad de Deepseek, provocó una recesión del mercado para las principales compañías de inteligencia artificial. NVIDIA, un jugador clave en tecnología GPU crucial para la IA, sufrió la mayor pérdida de acciones de un solo día en la historia de Wall Street, perdiendo casi $ 600 mil millones en capitalización de mercado. Otros gigantes tecnológicos como Microsoft, Meta, Google y Dell también experimentaron gotas significativas.
El modelo R1 de Deepseek, basado en el Deepseek-V3 de código abierto, cuenta con un costo de entrenamiento significativamente menor (estimado en $ 6 millones) en comparación con los modelos occidentales. Si bien este reclamo se disputa, impulsó las preocupaciones de los inversores sobre las inversiones masivas en IA por parte de las compañías estadounidenses. El éxito de Deepseek, particularmente su clasificación superior en las listas de descarga de aplicaciones de EE. UU., Amplificó aún más estas preocupaciones.
Openai y Microsoft están investigando si Deepseek violó los términos de servicio de OpenAI utilizando su API para capacitar a sus modelos a través de una técnica llamada destilación, extrayendo datos de modelos más grandes. Openai reconoce que las empresas chinas y otros intentan replicar activamente los principales modelos de IA de EE. UU. Están empleando activamente contramedidas y colaborando con el gobierno de los Estados Unidos para proteger su propiedad intelectual.
El asesor de IA de Donald Trump, David Sacks, confirmó la sospecha de que Deepseek empleó la destilación, una práctica OpenAi considera una violación de sus términos. Esta situación destaca el debate en curso en torno al uso de material con derechos de autor en la capacitación del modelo de IA.
La ironía no se pierde en los observadores, dada la propia historia de Openai. Operai argumentó previamente que crear modelos de IA como ChatGPT es imposible sin usar material con derechos de autor, citando una definición amplia de derechos de autor que abarca diversas formas de expresión humana. Esta postura es más apoyada por su sumisión a la Cámara de los Lores del Reino Unido y sus batallas legales en curso. Los autores del New York Times y 17, incluido George R. R. Martin, han presentado demandas contra Openai y Microsoft, alegando infracción de derechos de autor. Operai defiende sus acciones al reclamar "uso justo".
El paisaje legal que rodea los datos de capacitación de IA sigue siendo complejo, particularmente en relación con los problemas de derechos de autor, como lo destacó una decisión de la Oficina de Derechos de Autor de los EE. UU. 2018 de que el arte generado por la IA no es con derechos de autor debido a la falta de un "nexo entre la mente humana y la expresión creativa . "



