AI伦理的问题:OpenAI指责中国的数据盗窃案
Openai怀疑中国的DeepSeek AI模型(比西方的型号都要便宜得多)可能已经使用OpenAI的数据培训了。 这种启示,加上DeepSeek的迅速流行,引发了主要AI公司的市场经济下滑。 NVIDIA是GPU技术对AI至关重要的主要参与者,在华尔街历史上遭受了最大的单日股票损失,损失了近6000亿美元的市值。 Microsoft,Meta,Google和Dell等其他科技巨头也经历了大量跌落。
与西方型号相比,DeepSeek的R1模型(建立在开源DeepSeek-V3上)的培训成本明显较低(估计为600万美元)。 尽管这一主张是有争议的,但它引起了投资者对美国公司对AI大规模投资的关注。 DeepSeek的成功,尤其是其在美国应用程序下载图表上的最高排名,进一步扩大了这些问题。
Openai和Microsoft正在调查DeepSeek是否使用其API通过一种称为蒸馏的技术来训练其模型,从而违反了OpenAI的服务条款 - 从较大的模型中提取数据。 Openai承认,中国公司和其他公司积极尝试复制领先的美国AI模型。 他们正在积极采用对策并与美国政府合作以保护其知识产权。
唐纳德·特朗普(Donald Trump)的AI顾问戴维·萨克斯(David Sacks)证实了人们的怀疑,即deepseek采用了蒸馏,一种做法是openai认为违反了其条款。 这种情况强调了在AI模型培训中使用受版权保护的材料的持续辩论。
鉴于Openai的历史,讽刺并没有在观察者身上迷失。 Openai先前认为,如果不使用受版权保护的材料,创建像Chatgpt这样的AI模型是不可能的,理由是版权涵盖了各种形式的人类表达。他们向英国上议院及其正在进行的法律斗争提交的立场得到了进一步的支持。 《纽约时报》和17位作者,包括乔治·R·马丁(George R. Martin),已针对Openai和Microsoft提起诉讼,指控侵犯版权。 Openai通过声称“合理使用”来捍卫其行动。围绕AI培训数据的法律景观仍然很复杂,尤其是关于版权问题的问题,正如2018年美国版权局裁决所强调的那样,由于人类思想和创造性表达之间缺乏联系,因此AI生成的艺术无法获得版权保护。 。”
DeepSeek被指控使用Openai的模型使用蒸馏来训练其竞争对手。图片来源:Andrey Rudakov/彭博通过盖蒂图像。




