知识产权版权正在阻碍人工智能的应用

知识产权正在阻碍人工智能的应用

图片

分享中提到了一个现阶段很关键的问题,那就是人工智能造假胡说八道的问题。

以前人工智能还没那么智能的时候,造假还是明显能看出来的。

现在DeepSeek出来后,加上国外的各种大模型,造假胡说八道的时候,一般人可能完全无法分辨。

还有另外一种情况就是,把段子当作真实。

比如有些常见的恶搞,张冠李戴把鲁迅没说过的话,套在鲁迅头上。

才开始传播的人还是知道的,但是网络传播广了,人工智能发现很多内容都在重复说这是鲁迅说的。

那最后它在给用户对话的时候,很可能就会作为引用给到用户,用户就这样被误导了。

别说一般人了,只要不是熟读鲁迅的研究者,都很容易被误导。

图片

那怎么办?其中一个办法就是给出准确出处,这点现在各家大模型基本都能做到。

但是如果你经常使用AI的话,就会发现,它很多时候都是在引用网页上的内容,很少会直接引用某本书中的内容。

为什么呢?其中一个非常重要的原因,就是我标题里写的,知识产权在作祟。

这可不光是我在乱说,我现场就问了刀哥这个问题。

我说你们得到电子书有很大的优质书籍资源,为什么不做一个“AI核查”,专门给用户提供资料核查的功能?

刀哥说我是不是偷听了他们内部会议,他们的确正在做类似的功能,市场也确实有这个需求。

另外我还提了另一个问题,就是得到本身有个“AI助手”,好像没有接入DeepSeek,也没有直接使用得到的电子书资源,我说这是不是跟版权有关?

刀哥的回答是肯定的,他还做了进一步解答,简单来说就是,电子书的版权是出版社的,出版社跟得到签订的合同只是在得到平台上销售,没有说让你拿来训练大模型,更没有说你可以用大模型来直接调用。

刀哥虽然不像我这样,从逻辑和理论上来彻底否定知识产权,但作为一线从业者,他的确坦言受到版权问题的困扰,未来应该有新的版权形式,而不是现在这样。

现在这样的情况是,你如果从书里摘录一些笔记,他们新出的Get笔记是可以调用的,不受版权问题的约束。

另外一个办法就是,你自己找来的电子书,扔给任何一个大模型,虽然也不完全符合出版社的要求,但大概率没人会因为这种事找你麻烦。

再说了,我是反对知识产权的,即便那些支持知识产权的朋友,谁手上没有几本电子书?有没有用它来喂给AI,让AI来帮你回答问题?

还有,如果互联网用户自己上传了电子书到平台,平台能不能使用这些电子书来训练大模型呢?

实际上,用户自己就是想要用这个电子书来训练大模型的。

不光是得到这样的平台,还有比如微信读书,都是与出版商、作者等版权方签订了严格的版权协议,只有在协议允许的范围内才能使用这些电子书内容。

人工智能平台若要使用微信读书的电子书内容,需获得版权方的明确授权。未经授权直接调用,很可能将构成侵权。

不是说不尊重协议内容,而是说,这个问题应该有更高效的解决方式,促进书籍和人工智能的配合使用。

图片

书籍是经过几道工序加工过的知识,作者和出版社的信用背书,整体上肯定比一个网页链接更可靠。

但是现在的实际情况就是,无论中外,都受到了版权问题的困扰。

去年美国作家协会,就指控OpenAI未经许可使用他们的书籍内容来训练其ChatGPT语言模型,侵犯了版权权利人的利益。

不过2024年11月7日,美国纽约南区地方法院驳回了诉讼请求,法官认为原告没有证明因版权信息被删除而遭受具体伤害,不满足提起诉讼的条件。

除了这起官司,OpenAI还面临至少六起正在进行的版权官司,包括来自《纽约时报》、《每日新闻》、非营利新闻机构调查报道中心、The Intercept等媒体的诉讼,以及YouTube博主Millette和小说作者提起的诉讼。

这其中的核心争议就是,OpenAI使用版权素材训练AI是否需要获得版权方授权?

那么,你的答案是什么?

2025年03月04日