知识产权版权正在阻碍人工智能的应用
知识产权正在阻碍人工智能的应用
分享中提到了一个现阶段很关键的问题,那就是人工智能造假胡说八道的问题。
以前人工智能还没那么智能的时候,造假还是明显能看出来的。
现在DeepSeek出来后,加上国外的各种大模型,造假胡说八道的时候,一般人可能完全无法分辨。
还有另外一种情况就是,把段子当作真实。
比如有些常见的恶搞,张冠李戴把鲁迅没说过的话,套在鲁迅头上。
才开始传播的人还是知道的,但是网络传播广了,人工智能发现很多内容都在重复说这是鲁迅说的。
那最后它在给用户对话的时候,很可能就会作为引用给到用户,用户就这样被误导了。
别说一般人了,只要不是熟读鲁迅的研究者,都很容易被误导。
那怎么办?其中一个办法就是给出准确出处,这点现在各家大模型基本都能做到。
但是如果你经常使用AI的话,就会发现,它很多时候都是在引用网页上的内容,很少会直接引用某本书中的内容。
为什么呢?其中一个非常重要的原因,就是我标题里写的,知识产权在作祟。
这可不光是我在乱说,我现场就问了刀哥这个问题。
我说你们得到电子书有很大的优质书籍资源,为什么不做一个“AI核查”,专门给用户提供资料核查的功能?
刀哥说我是不是偷听了他们内部会议,他们的确正在做类似的功能,市场也确实有这个需求。
另外我还提了另一个问题,就是得到本身有个“AI助手”,好像没有接入DeepSeek,也没有直接使用得到的电子书资源,我说这是不是跟版权有关?
刀哥的回答是肯定的,他还做了进一步解答,简单来说就是,电子书的版权是出版社的,出版社跟得到签订的合同只是在得到平台上销售,没有说让你拿来训练大模型,更没有说你可以用大模型来直接调用。
刀哥虽然不像我这样,从逻辑和理论上来彻底否定知识产权,但作为一线从业者,他的确坦言受到版权问题的困扰,未来应该有新的版权形式,而不是现在这样。
现在这样的情况是,你如果从书里摘录一些笔记,他们新出的Get笔记是可以调用的,不受版权问题的约束。
另外一个办法就是,你自己找来的电子书,扔给任何一个大模型,虽然也不完全符合出版社的要求,但大概率没人会因为这种事找你麻烦。
再说了,我是反对知识产权的,即便那些支持知识产权的朋友,谁手上没有几本电子书?有没有用它来喂给AI,让AI来帮你回答问题?
还有,如果互联网用户自己上传了电子书到平台,平台能不能使用这些电子书来训练大模型呢?
实际上,用户自己就是想要用这个电子书来训练大模型的。
不光是得到这样的平台,还有比如微信读书,都是与出版商、作者等版权方签订了严格的版权协议,只有在协议允许的范围内才能使用这些电子书内容。
人工智能平台若要使用微信读书的电子书内容,需获得版权方的明确授权。未经授权直接调用,很可能将构成侵权。
不是说不尊重协议内容,而是说,这个问题应该有更高效的解决方式,促进书籍和人工智能的配合使用。
书籍是经过几道工序加工过的知识,作者和出版社的信用背书,整体上肯定比一个网页链接更可靠。
但是现在的实际情况就是,无论中外,都受到了版权问题的困扰。
去年美国作家协会,就指控OpenAI未经许可使用他们的书籍内容来训练其ChatGPT语言模型,侵犯了版权权利人的利益。
不过2024年11月7日,美国纽约南区地方法院驳回了诉讼请求,法官认为原告没有证明因版权信息被删除而遭受具体伤害,不满足提起诉讼的条件。
除了这起官司,OpenAI还面临至少六起正在进行的版权官司,包括来自《纽约时报》、《每日新闻》、非营利新闻机构调查报道中心、The Intercept等媒体的诉讼,以及YouTube博主Millette和小说作者提起的诉讼。
这其中的核心争议就是,OpenAI使用版权素材训练AI是否需要获得版权方授权?
那么,你的答案是什么?
2025年03月04日