关注我们
QRcode 邮件联系 新浪微博
首页 > 科技 » 正文

AI公司相互抄袭利用别家数据训练AI聊天机器人已成公开秘密

 小尚

【资讯】据国外媒体报道,许多初创公司的AI聊天机器人,极可能是采用OpenAI和其他公司的数据开发的。这些机器人在某些特定领域可以媲美GPT-4,但收费只是OpenAI的一小部分。

图源:视觉中国(VCG111465471109)

为了训练这些机器人的模型,一些初创公司采取了一种秘密的做法。他们首先开通GPT-4的会员,然后向它提出一系列问题,这些问题和答案被用来训练自己的模型。据报道,采取这一策略的初创公司不在少数,但并未公开披露它们使用了OpenAI的技术。

这种做法被认为实质上损害了OpenAI的增长,因为OpenAI的CEO奥特曼曾表示,规模较小的企业可以适度利用该公司的技术。然而,这种暗中使用的做法随时都有可能改变奥特曼的想法。

一些初创公司的创始人表示,他们使用OpenAI的数据来训练自己的模型,是为了改进产品的性能和准确性。例如,Unsloth AI联合创始人Daniel Han估计,他大约一半的客户从GPT-4或Anthropic的Claude模型中获取数据,并用它来改进自己的模型。

此外,这种做法与OpenAI等巨头的做法并无二致。例如,谷歌曾转录YouTube视频,Meta雇佣承包商总结受版权保护的书籍,Adobe使用Midjourney的AI生成照片,这些都是为了训练自家AI模型。

本文标签:
中国日均移动互联网使用时长达435分钟 短视频占比高达1/3
首搭骁龙8 Gen4!小米15被曝本月开始内测