AI Ethics in questione: Openi accusa la profondità della Cina di furto di dati
Openai sospetta che i modelli di AI Deepseek della Cina, significativamente più economici delle controparti occidentali, potrebbero essere state addestrate utilizzando i dati di Openai. Questa rivelazione, unita al rapido aumento della popolarità di Deepseek, ha scatenato una recessione del mercato per le principali società di intelligenza artificiale. Nvidia, un attore chiave nella tecnologia GPU cruciale per l'IA, ha subito la più grande perdita di azioni di un giorno nella storia di Wall Street, perdendo quasi $ 600 miliardi di capitalizzazione di mercato. Altri giganti tecnologici come Microsoft, Meta, Google e Dell hanno anche sperimentato cali significativi.
Il modello R1 di DeepSeek, costruito sull'open-source Deepseek-V3, vanta un costo di allenamento significativamente più basso (stimato a $ 6 milioni) rispetto ai modelli occidentali. Sebbene questa affermazione sia contestata, ha alimentato le preoccupazioni degli investitori per gli enormi investimenti nell'intelligenza artificiale da parte delle società americane. Il successo di DeepSeek, in particolare la sua classifica in alto sui grafici per i download delle app statunitensi, ha ulteriormente amplificato queste preoccupazioni.
Openai e Microsoft stanno studiando se DeepSeek abbia violato i termini di servizio di Openi utilizzando la sua API per addestrare i suoi modelli attraverso una tecnica chiamata distillazione, estrarre dati da modelli più grandi. Openi riconosce che le aziende cinesi e altri tentano attivamente di replicare i principali modelli di AI statunitensi. Stanno impiegando attivamente contromisure e collaborano con il governo degli Stati Uniti per proteggere la loro proprietà intellettuale.
Il consulente di intelligenza artificiale di Donald Trump, David Sacks, ha confermato il sospetto che Deepseek impiegasse una distillazione, una pratica aperta, considera una violazione dei suoi termini. Questa situazione evidenzia il dibattito in corso che circonda l'uso di materiale protetto da copyright nella formazione del modello AI.
L'ironia non è persa sugli osservatori, data la storia di Openi. Openai in precedenza aveva sostenuto che la creazione di modelli di intelligenza artificiale come Chatgpt è impossibile senza usare materiale protetto da copyright, citando un'ampia definizione di copyright che comprende varie forme di espressione umana. Questa posizione è ulteriormente supportata dalla loro sottomissione alla House of Lords del Regno Unito e alle loro continue battaglie legali. Il New York Times e 17 autori, tra cui George R. R. Martin, hanno intentato azioni legali contro Openi e Microsoft, sostenendo una violazione del copyright. Openi difende le sue azioni rivendicando "equo uso".
Il panorama legale che circonda i dati di addestramento dell'IA rimane complesso, in particolare per quanto riguarda le questioni di copyright, come evidenziato da una sentenza dell'ufficio del copyright degli Stati Uniti del 2018 che l'arte generata non è protetta da copyright a causa della mancanza di un "nesso tra la mente umana e l'espressione creativa . "



