OpenAI 的 O3-mini 模型疑似抄袭 DeepSeek 代码?
OpenAI 最新的 O3-mini 模型引发了争议,用户发现它在用英语提示的情况下,却用中文进行回复。这一意外行为,由 X(前 Twitter)用户 Vikhyat Rana 曝光,引发了人们对 OpenAI 是否借鉴了专门从事中文语言处理的开源 AI 项目 DeepSeek 的猜测。
这一指控是在 OpenAI 声称 DeepSeek 复制了其专有 AI 模型来训练其开源系统不到一周后出现的。OpenAI 指责 DeepSeek 使用“蒸馏”技术,让较小的模型在使用较少计算资源的情况下模仿较大模型的性能。
O3-mini 用中文回应英语提示
问题出现在 Rana 分享了一张截图,截图显示一个用英语提出的问题,却得到了用中文的回答。这个回答包含了关于 PyScript 和 JavaScript 处理音频 API 的详细技术解释,这使得一些人质疑 OpenAI 是否在没有充分审查的情况下,整合或使用了现有的中文语言数据集。
Rana 在 X 上发帖问道:“为什么 O3-mini 用中文推理?”,OpenAI 的 O3-mini 用中文回答了这个问题。
“考虑将代码转换为 Python 代码,耗时 9 秒”
启动 PyScript 探索
使用 PyScript 创建画布类的边框
过滤评估中在考虑使用 JavaScript 处理音频输入后,我决定写一个 PyScript 假子,借助 HTML canvas 和 Web Audio API,通过 Python 控制声音,然后这可能比较复杂。
融合音频输入和 Python 感觉不难。放大了。通过 Pyodide 的 js 模块,我可以接入 Web 音频 API,定期计算音量并更新播放。
更新播放和处理音频输入是不相干的,可以利用 PyScript 的 js 模块和滚动动画来计算音频偏移并动
Why O3-mini is reasoning in Chinese 🥹 pic.twitter.com/2Z8mNCPrBY
— Vikhyat Rana (@The_Vikhyat) February 1, 2025
以下是 DaiWW 对 Rana 帖子回复:
“最新的 OpenAI O3-mini 用中文推理。看来 OpenAI 复制了 DeepSeek 的开源代码和数据,在没有经过适当编辑的情况下发布了 O3-mini。”
The latest OpenAI O3-mini is reasoning in Chinese,it seems OpenAI copied Deepseek’s open-source code/data and released the O3-mini without carefully edit. pic.twitter.com/tKoOTanhOQ
— DaiWW (@BeijingDai) February 3, 2025
OpenAI 的沉默和影响
与此同时,OpenAI 尚未对此指控做出回应。这种情况突显了人们对 AI 模型训练透明度、开源数据伦理使用以及 AI 输出意外行为风险的担忧。如果 OpenAI 的数据来源是 DeepSeek,那么这可能会改变专有 AI 公司与开源社区的互动方式,并引发人们对数据集审计的质疑。
开源代码滥用指控
一些批评人士认为,OpenAI 可能在没有注明来源的情况下,整合了 DeepSeek 公开可用的数据集。DeepSeek 是一个专注于中文语言模型的开源 AI 项目,O3-mini 突然在这一领域表现出色,引发了人们对其来源的猜测。如果 OpenAI 确实使用了 DeepSeek 的成果,那么这可能会在 AI 研究界引发伦理和知识产权方面的担忧。
更大的问题
这场争议加剧了人们对 AI 伦理、数据来源以及 AI 开发中企业责任的持续争论。像 OpenAI 这样的公司一直在推动生成式 AI 的边界,但关于问责制和透明度的疑问依然存在。
随着 AI 社区等待 OpenAI 的回应,关键问题是 O3-mini 的中文推理是其训练的意外结果,还是 AI 数据伦理和知识产权方面更深层次问题的征兆。未来几天可能会出现更多审查,OpenAI 可能需要澄清其数据来源以维护信任。目前,情况仍未解决。
尽管存在持续的指控,Altman 承认 DeepSeek 的模型是一个强大的竞争对手,并指出需要更大的计算能力才能保持领先优势。他在 X 上发帖,将 DeepSeek 的 R1 模型描述为“令人印象深刻,特别是在他们能够以这个价格提供的服务方面。”
DeepSeek 成本效益高的 V3 模型的发布,让全球行业参与者感到震惊,一些人将其称为“AI 卫星”时刻。据报道,DeepSeek AI 突破性模型的开发成本不到 600 万美元,这对已经投入数十亿美元用于类似技术的美国科技公司来说是一个令人不安的数字。
据多方报道,DeepSeek V3 在关键基准测试中,包括 Codeforces 上的竞争性编码挑战,其性能超过了 Llama 3.1 和 GPT-4o 等领先模型。该项目以仅 550 万美元的预算完成,与竞争对手花费的数亿美元形成鲜明对比。这一突破挑战了尖端 AI 开发需要巨额资金投入的观念。