人工智能永无可能全面超越人类智能

“Computers are like humans - they do everything except think.” – John von Neumann

“No computer has ever been designed that is ever aware of what it’s doing; but most of the time, we aren’t either.” – Marvin Minsky

近年来,伴随着人工智能技术和应用的进展,世界上许多人工智能专家(包括曾经获得图灵奖和诺贝尔奖的知名学者)或非人工智能专业人士,一直在鼓吹“人工智能将会超越人类智能”,“人工通用智能(AGI)将会实现(甚至已经实现!)”,“人工智能将会威胁人类的生存”,等等一系列缺乏切实科学根据的观点,在全世界范围内造成大众的认知混乱。本文意图澄清现今世界上关于“人工智能是否能够超越人类智能”这个问题各种议论中的概念性混乱,彻底从最基本概念层次上对该问题给出一个准确回答:什么是“智能”?什么是“人类智能”?什么是“人工智能”?什么是“人工智能系统”?人工智能应用中的行为主体是谁?人工智能是否曾经部分地超越过人类智能?人工智能是否在将来迟早能够超越人类智能?本文给出的最终结论如题:“人工智能永无可能全面超越人类智能”。

第一节 基本概念及术语定义

首先定义本文所使用的基本概念和术语。

什么是“智能”?从哲学、生物学、心理学的观点来看,智能是自然界生物长期持续进化的产物[1]。“智能(Intelligence)”一词通常被用于指称动物(注意,仅限定于动物,但是此处也包括人类)的辨识、认知、理解、记忆、模仿、学习、交流、规划、推理、问题求解等需要一般程度智慧的能力[1]。在最权威的英语辞典牛津英语辞典 OED 的“Intelligence”词条中,“智能(Intelligence)”主要被定义为“The faculty of understanding; Understanding as a quality of admitting of degree; The action or fact of mentally apprehending something”[2]。在美国Merriam-Webster Dictionary 的“Intelligence”词条中,“智能(Intelligence)”主要被定义为 “(1) the ability to learn or understand or to deal with new or trying situations, (2) the ability to apply knowledge to manipulate one’s environment or to think abstractly as measured by objective criteria.”[3]。

笔者认为,“智能”从学术上来说应该是属于神经科学/动物行为学/心理学/认知科学等多学科范畴的概念,各个学科研究“智能”的不同侧面。但是,“智能”从学术上来说原本不属于计算机科学或“人工智能”的学科范畴(无论“人工智能”是否包含在整个“计算机科学”之内);使用计算技术作为手段来研究(注意,是研究而不是实现及应用)“智能”是相应各个学科内之事项,如同计算物理和计算化学只不过是使用计算技术作为手段来研究物理学和化学的物理学分支和化学分支而已。

什么是“人类智能”?“人类智能”一词用于指称人类作为高等动物包含了动物一般智能之外还进一步具备的概念抽象、分析、计算、演绎、归纳、溯因、联想、猜想、预测、论证、概念推理等需要高等程度(亦即,基于概念抽象)智慧的能力。“人类智能”是本文要比较的对象之一。

美国心理学家 Howard Earl Gardner 把(人类)智能定义为“解决问题或创造产品的能力(the ability to solve problems, or to create products)”;他提出的著名多元智能理论把(人类)智能划分为如下几类:语言智能(Linguistic Intelligence),音乐智能(Musical Intelligence),逻辑数理智能(Logical-Mathematical Intelligence),空间智能(Spatial Intelligence),身体动觉智能(Bodily-Kinesthetic Intelligence),个人智能(The Personal Intelligences),人际智能(Interpersonal Intelligence),内省智能(Intrapersonal Intelligence),自然主义智能(Naturalist Intelligence)[4]。

根据认知处理的层次,智能可以被划分为“抽象智能(Abstract Intelligence)”和“具体智能(Concrete Intelligence)”[1]。“抽象智能”是对单词、数字、字母等做出反应的能力,是进行抽象思维的能力(Abstract intelligence is the ability to respond to words, numbers, letters, etc. It is the ability to carry on abstract thinking.)[5,6]。相对于抽象智能,具体智能就应该是无需升华为抽象概念,针对现实世界个别物体或场景直接进行形象思维的能力[1,6]。

因为基于抽象概念,抽象智能具有概括性、理论性、完备性、类推性(举一反三)、本质性(一言以蔽之)等特征,是高认知层次的智能。具有抽象智能的行为主体能够通过抽象思维及逻辑思维来思考不直接与现实世界具体物体或场景相关的问题,涉及对事物本质和事物间相互关系的理解,能够在没有实际现实参照物的情况下进行推理和决策[1,6,7]。因为不基于抽象概念,具体智能具有特殊性、实践性、代表性、个案性(case by case)、感官体验等特征,是低认知层次的智能。具有具体智能的行为主体能够理解和操作现实世界具体物体和场景。具体智能与感知和直接经验密切相关,直接解决实际问题[1,6]。除去人类的其它动物没有符号语言文字,不可能进行概念思维和逻辑思维,当然也就没有抽象智能而仅有具体智能。人类智能在本质上区别于(远远优于)动物智能的正是其抽象智能[1,6,7]。

根据行为主体的个体性和群体性,智能还可以被区分为“个体智能(Individual Intelligence)”和“群体智能(Collective Intelligence)”。个体智能是指单个行为主体个体的感知认知能力和智慧表现,独立完成任务的能力。群体智能指多个行为主体个体通过协商的(比如人类群体)或者非协商的(比如动物群体)协作方式共同产生的智慧表现,群体完成任务的能力[1]。

什么是“人工智能”?“人工智能(Artificial Intelligence)”,作为计算机科学的一个领域,其创立者之一,“Artificial Intelligence”的命名提出者麦卡锡(John McCarthy,1927-2011)将其定义为:“人工智能是制造智能机器,特别是智能计算机程序的科学和工程。它与使用计算机理解人类智能的类似任务有关,但人工智能不必局限于以生物学手段可观察的方法。([Artificial Intelligence] It is the science and engineering of making intelligent machines, especially intelligent computer programs. It is related to the similar task of using computers to understand human intelligence, but AI does not have to confine itself to methods that are biologically observable.)”[8] 将“人工智能”溯源于图灵(Alan Mathison Turing, 1912-1954)在1950发表的一篇论文“Computing Machinery and Intelligence”[9],或者以现今的“人工智能”技术成就来定义“人工智能”领域,在学术上都不规范合理。

“人工智能(Artificial Intelligence)”,作为一种能力,是人类作为行为主体(请注意,本文此处对“人工智能”概念定义所限定的“人类作为行为主体”是一个本质上非常重要的关键点,参见下文讨论)以计算技术构筑的工程系统在执行由人类制订特定任务中呈现出来的类似“人类智能”的具体能力。作为能力的“人工智能”是本文要比较的对象之一。

“计算机”一词用于指称现代通用电子数字计算机[10],亦即,以第一台现代通用电子数字计算机 EDSAC 为代表的,具备有“程序控制,程序内存,程序可改”三个本质特征的,可以具有多个 CPU 处理器的计算机硬件设备(亦即,包括传统输入输出装置的通称“裸机”)。

“计算机系统”一词用于指称安装了系统软件以及应用软件的,能够执行其存储器中存储的计算程序来完成程序规定计算任务的计算机以及其它外部附属装置(的静态存在)。 其本质特征是在被启动之后能够根据输入计算机的每个计算程序来自动(亦即,无需人类参与)地完成程序规定的每个计算任务。对于通过通信网络连接在一起的一组计算机系统,亦即分布式计算机系统,在本文中视为一个整体与计算机系统不另做区分。

“运行中的计算机系统”一词用于指称在一个时间阶段内正在执行着某组(至少一个)计算程序,完成该组程序所规定的特定计算任务的计算机系统及其对系统外部显示出的“动态行为”。因为本文要讨论的是“人类智能”与“人工智能”之间的关系,所以,暂不考虑所有在计算过程中必须要求人类即时参与才能完成任务目标的交互式计算方式。

“解决问题”一词用于指称某个(或某组或某群)行为主体对于预先给定的某个(某类)问题找到解决该问题的切实方法并且用该方法实际解决了该(类)问题,给出正确答案,并且,问题是否得到正确解决的判断是由该行为主体自身做出的。请注意,本文此处对“解决问题”概念定义所限定的“问题是否得到正确解决的判断是由该行为主体自身做出的”是一个本质上非常重要的关键点,参见下文讨论。

“人工智能系统”一词用于指称能够执行为解决某个(或某类、某组)特定问题由人类制订了初始计算程序并且在完成任务时(或过程中)呈现出一定类似“人类智能”行为特征的计算机系统。这里,“人工”的限定意义在于该计算机系统所执行的初始计算程序是由人类设定的,尽管在完成任务的过程中该系统也可能会执行由其自身自动生成的程序指令。

显然,如果把“计算”也视为一种智能行为,那么实际上任何计算机系统都可以被认作是“人工智能系统”。反之,因为任何“人工智能系统”首先是计算机系统,所以,任何“人工智能”本质上也都是“计算”。本文关心的是那些可以呈现狭义“计算”之外智能行为的人工智能系统。

于是,基于“人工智能系统”概念,作为一种能力的指称,“人工智能(Artificial Intelligence)”一词用于指称通过运行任何人工智能系统可以呈现出的所有能力。“人工智能”是本文要比较的对象之一。

需要强调说明的一点是,因为根本不存在完全不依赖于人类的计算机系统,所以,所谓“机器智能”是个从哲学上从逻辑上从技术上都完全说不通的伪概念,本文不予考虑。

“人工通用智能(AGI)”,按照该领域经典权威文献[11]的陈述:“专注于人工智能领域最初雄心勃勃的目标 – 创造和研究具有与人类相当甚至最终可能更高等的通用智能的软件或硬件系统 (focusing on the original ambitious goals of the AI field – the creation and study of software or hardware systems with general intelligence comparable to, and ultimately perhaps greater than, that of human beings.)。”[11] “通用智能包括在各种不同的背景和环境中实现各种目标和执行各种任务的能力。一个通用智能系统应该能够处理与其创建者所预期的截然不同的问题和情况。一个通用智能系统应该善于概括它所获得的知识,以便将这些知识从一个问题或上下文转移到其他问题或上下文(General intelligence involves the ability to achieve a variety of goals, and carry out a variety of tasks, in a variety of different contexts and environments. A generally intelligent system should be able to handle problems and situations quite different from those anticipated by its creators. A generally intelligent system should be good at generalizing the knowledge it’s gained, so as to transfer this knowledge from one problem or context to others.)。”[11]

“形式化”一词用于指称把某个(某类)问题/方法用某种形式逻辑学或者数学方法表达为符号方式,使得该问题/方法依据逻辑学/数学解释具有唯一确定的涵义。

“评价标准”一词用于指称在评价事物时用到的衡量准则,可以是定性的,被称为“定性评价标准”,也可以是定量的,被称为“定量评价标准”;实施评价的行为主体必须能够依据该准则切实可行地对被评价事物做出定性的或者定量的评价。

“评价事物”一词用于指称实施评价的行为主体依据确切的评价标准对被评价事物做出定性的或者定量的评价赋值。

** **

*第二节 问题设定*

对于“人工智能是否能够超越人类智能”这个问题,我们需要把它的内涵设定清楚。

如果仅仅考虑“计算”这种能力的话,从现代通用计算机诞生的第一天起,计算机的计算能力就早已“超越”(关于这种“超越”,下文还有分析说明)人类的计算能力了。现今世界上关于“人工智能是否能够超越人类智能”的议论,显然寓意着“人工智能是否能够全面超越人类智能”或者至少是“人工智能是否能够多方面超越人类智能”。

早在上个世纪70年代起,世界上就有过计算机(人工智能)是否能够超越人类的争论 [12,13]。 H. L. Dreyfus 的名著[11]被翻译为中文时,北京大学马希文教授在为中译本做序时就明确地阐明过 [12, 中译本序言]: “计算机能不能代替人脑?这是一个十分含糊的问题。至少可以有以下几种很不同的解释:(1)计算机能不能完成一些迄今为止主要是靠人的大脑的活动完成的工作?(2)计算机能不能完成一切这种工作?(3)计算机能不能像大脑一样地完成这种工作?” “对于(1),回答是肯定的,这已有当前的社会实践所证实了。其实,自计算机发明之日起,它所做的一切工作一直是那些主要靠人的大脑完成的工作。 …… 除了可计算性(包括理论的和实际的可计算性)之外,几乎再也找不到一个合理的说法来为计算机的应用划定一个技术性的界限了。由于这种情况,只要稍不谨慎,就会陷入幻觉,以为计算机的应用并无界限,也就是说,对前面的问题(2)做出肯定的回答。这就是书中说的AI学派的论点。然而这是一种没有格局的外推,其中包含着不合理的逻辑跳跃。”

2016年3月,DeepMind 的 AlphaGo [14](其改进版 AlphaGo Zero 还远强于它[15])继2015年10月战胜人类围棋欧洲冠军之后又战胜了人类围棋世界冠军[16-20];2022年11月30日,OpenAI 发布了 ChatGPT [21-24]。这两个事件在全世界范围内两次掀起了各届众多人士都声称“人工智能已经或即将或迟早要超越人类智能”的热潮。尤其是这次 ChatGPT 的自然语言问答功能十分强大并且具有通用性,更是使得某些人声称“人工智能已经超越人类智能”,“人工通用智能(AGI)将会实现(甚至已经实现!)”,“人工智能将会威胁人类的生存”[25-29]。 图灵奖及诺贝尔奖获得者 Geoffrey Hinton 甚至宣称:“很明显,也许在未来的20年内,我敢说有0.5的概率,数字计算会变得比我们更聪明,很可能在未来的一百年内,它会比我们聪明得多。所以我们需要考虑如何应对这种情况,因为很少有更聪明的事物被更不聪明的事物控制的例子。”[29]

笔者认为,现在应该及时地对“人工智能是否能够超越人类智能”这个问题给与一个确切的定义及回答,不要让某些所谓“专家”再继续误导民众,使得民众迷信“人工智能”能力无边,会超越“人类智能”,会对人类社会构成实质威胁了。

本文定义,“人工智能能够全面超越人类智能”是指:(1)对于人类(凭借自身自然生物个体/群体智能)能够清晰表达提出的每一个概念/问题,存在某个或某群人工智能系统也能够提出该概念/问题,此外,人工智能系统还能够先于人类提出人类从未提出的新概念/新问题;(2)对于人类(凭借自身自然生物个体/群体智能)能够、或者没能解决的每一个(类)问题,都存在某个或某群人工智能系统也能够、或者能够解决该问题并且在评价指标上表现出比人类的解决更好的性能;此外,在解决问题的过程中,对问题解决与否之判断以及评价,是由该人工智能系统自身做出的;(3)人工智能系统能够自主设定并解决并非由人类预先给定的问题,这些问题是人类(凭借自身自然生物个体/群体智能)不能够解决或者即便能够解决其性能也不如人工智能系统的。

在上述三个必要条件中,(1)是要求人工智能系统自身作为行为主体能够提出人类所能提出的全部概念/问题并且还能够提出人类未曾提出过的新概念/新问题;(2)是要求人工智能系统自身作为行为主体能够解决人类所能解决的全部问题并且解决的更好;(3)是要求人工智能系统自身作为行为主体具备自主设定任务目标的能力。

请注意上述必要条件中并未对人工智能系统个体有通用性万能性(像AGI那样)的要求,因为人类个体也不具备通用性万能性。亦即,如果存在有众多人工智能系统,各自贡献出的人工智能之集合整体优于人类群体智能,那么我们也可以认为是人工智能全面超越人类智能。

另一个关键点是在上述要求中强调了行为主体。因为我们试图比较“人类智能”与“人工智能”的能力,所以辨别出和区分开行为主体是必要的,否则在概念上必然是混乱的。如果人工智能系统自身做不到自主设定意图/目的/问题,自主判断问题解决与否,而必须由人类设定意图/目的/问题和判断问题解决与否,那么,人工智能系统的“智能”何在?到底是人工智能系统强于人类还是“人工智能系统加上人类”才能强于人类?

在上述问题设定之下,本文在下面将论述,“人工智能”永无可能全面超越“人类智能”。

*第三节 人工智能应用中的行为主体*

多年来,在人工智能领域被忽略的一个根本性问题是,当某个人工智能系统被应用到某个具体领域呈现出智能行为的时候,究竟谁是这种智能行为的行为主体?[30-33] 当我们要对“人工智能”和“人类智能”进行能力比较时,这个问题就凸显其本质重要性,必须对其认真探讨了。

笔者认为,姑且不论计算机系统的通用硬件器件都是人类设计制造出来的,因为任何人工智能系统(计算机系统)对其外部呈现出的智能行为都是其自动执行其系统内部预先由人类设定好的初始计算程序的结果,所以准确地说,该智能行为是人类(作为行为主体)根据自身的意图/目的和评价标准设定计算程序,以及计算机系统(作为计算任务执行者)自动执行该计算程序的共同效果。一台计算机裸机自身绝对不可能做任何事情,没有自主设定意图/目的和评价标准之能力的人工智能系统(计算机系统)自身也绝对不可能单独成为其某个应用的行为主体。只要人工智能系统不具备自主设定意图/目的和达到目的之评价标准的能力(下文有讨论),它就永远是人类智能的一种借助高速自动计算化之延伸及增强,永远只能是执行者,而绝非主体。正是基于这样的考虑,笔者才主张,所谓“机器智能”是个区分不清行为主体者与任务执行者的伪概念。

本文在前面定义“人工智能”概念时,就已经限定了“是人类作为行为主体以计算技术构筑的工程系统在执行由人类制订特定任务中体现出来的类似“人类智能”的具体能力”。

另一方面,尽管任何人工智能系统(计算机系统)对其外部显示出的智能行为都是自动执行其系统内部预先由人类设定好的计算程序的结果,但是如果没有计算机的高速自动计算,那么人类设定好的计算程序之静态存在自身也绝对不可能呈现出智能行为,并且现今一些人工智能应用所呈现出的智能行为是单凭人类自身智能而不借助计算机高速自动计算能力则难于做到的。

基于上述客观事实,我们可以更准确地说,人工智能应用所呈现出的智能行为是由人工智能系统基于人类智能并且借助高速自动计算所延伸/增强的。在此意义上我们也可以更准确地说,“人类智能”与“人工智能”之间的比较,实际上是“人类的自然生物智能”与“人类智能借助高速自动计算被延伸/增强了的人工智能”之间的比较。

** **

*第四节 计算机系统及人工智能系统的本质局限性*

首先,计算机系统在计算原理上的本质局限性是:任何计算机系统仅能够计算“可计算(可判定、存在一般算法)”形式化问题并在有限时间内给出确定的计算结果,而绝对不可能计算任何“不可计算(不可判定、不存在一般算法)”问题。因为任何人工智能系统都首先是计算机系统,所以,这当然也是人工智能系统在计算原理上的本质局限性。

由于计算机系统/人工智能系统的本质局限性,任何形式化的不可判定问题(可计算性理论教科书及专业手册中列举了许多已知的不可判定问题),都是在原理上不可计算的。

另一方面,如果一个问题,人类可以用自然语言陈述清楚,但是却还没有找到某种恰当的形式化方法将其形式化,那么,无论人类能否解决该问题,计算机系统/人工智能系统在计算原理上都不能够解决它。

这里,我们需要区分一下人类解决问题与计算机系统/人工智能系统解决问题之不同,亦即,人类解决问题的特殊性与计算机系统/人工智能系统解决问题的一般性。针对某个(某类)问题,所谓人类可以解决它,通常是意味着对于该问题的每个具体实例,人类都能够用(未必是可以完全形式化的、可能含有经验性手段的)某种方法予以解决,对于不同的具体实例可能使用的经验性手段也不同。亦即,人类解决问题的方法未必一定具有一般性而是依据具体情况具体分析的。而所谓计算机系统/人工智能系统可以解决某个(某类)问题,通常是意味着对于该问题的每个具体实例,计算机系统/人工智能系统可以用完全相同的、具有一般性的算法去解决它。实际上,计算机的高速计算能力当然是人类利用它来解决问题的缘由之一,另外一个缘由正是计算机系统解决问题的一般性方法(算法)。在没有发现/发明解决某个(某类)问题的一般性算法之前,我们通常不认为当然也不宣称计算机系统能够解决该问题。针对一个问题具体实例的每个人类成功解决方案,当然是可以编制一个对应的特殊程序在计算机上模拟出相同结果的,但是,这种模拟,在实践上显然毫无意义。在实践上我们需要计算机系统做到的是,对于任意给定的问题具体实例,计算机都能够以完全相同的、具有一般性的算法去解决。

其次,计算机系统在计算复杂性上的本质局限性是:一个形式化的问题在原理上是可以计算的未必意味着该问题在实践中就一定是“合理”地可计算的。每个可计算问题的每个算法都有确定的时间复杂性(解决问题所需的计算步骤数量)及空间复杂性(解决问题所需的存储单元数量)。尽管在原理上是有限数量,如果解决某个(某种)问题所需的时间/空间从该问题的应用意义上来说巨大到无法认可,那么在实践上该问题就不是“合理”地可计算的。

但是,任何一个(一类)问题的各个具体实例之解决未必需要同样的时间/空间。人类解决问题的特殊性使得人类可以根据每个具体实例的特殊情况选择适合该具体实例的(可能具有经验性质的)解决方法;而计算机系统/人工智能系统解决问题的一般性却没有这样的选择自由度,必须以完全相同的、具有一般性的算法去解决一类问题的每个具体实例,故而针对不同实例会“有喜有忧”。

再次,人工智能系统在行动原理上的的本质局限性是:如何设定解决问题之“意图”。

“意图(intention)”概念是现代行为哲学的核心概念[34-36],是区分“行动(action)”与“事件(event)”及动作(movement)的关键。人类有目的的行动都是有初始意图的,这种从意图到计划、行动、行为、目的达成的过程正是人类智能驱动的体现。

人工智能系统中预先由人类设定的初始计算程序,当然是作为行为主体的人类按照自己的意图和目的设定的,计算机系统仅仅是该初始计算程序的执行者。所以,问题的关键在于,人工智能系统能否在执行初始计算程序的过程中,通过由其自身生成的计算程序,逐步形成自主意图和目的。如果人工智能系统的确能够做到这一点,那么我们可以将其视为“次级主体”,视其(基于初始计算程序)自主设定的意图和目的为“次级意图/目的”。但是,这又回到计算机系统在计算原理上的本质局限性,只要自主意图/目的形成这一问题还没有被形式化算法化,计算机系统就不可能解决[37]。

最后,人工智能系统在行为原理上的的本质局限性是:如何设定问题解决与否之“评价标准”。人工智能系统中预先由人类设定的初始计算程序,当然是作为行为主体的人类按照自己的意图和目的设定好了问题解决与否之评价标准的,计算机系统仅仅是根据人类设定好的评价标准来判定并执行结束计算指令。即便是我们假设人工智能系统能够自主形成意图/目的,人工智能系统也还必须能够自主设定问题解决与否之“评价标准”。这同样也又回到计算机系统在计算原理上的本质局限性:自主设定问题解决与否之“评价标准”的形式化和算法化。

以上所述计算机系统/人工智能系统的本质局限性,都是工作原理上的,亦即,不是能够通过对计算机系统/人工智能系统的技术改良可以排除掉的。

*第五节 人工智能是否曾经部分地超越过人类智能?*

接下来,让我们考查一下,“人工智能”是否曾经部分地超越过“人类智能”?我们来看近年掀起人工智能热潮的标志性人工智能应用成功案例。

围棋世界冠军李世乭、柯洁都输给了 DeepMind 的围棋程序 AlphaGo,基于这一事实,能够说在围棋博弈上“人工智能”已经超越了“人类智能”吗?

如果仅限于围棋博弈输赢,那么 AlphaGo(以及 AlphaGo Zero)的围棋博弈能力已经远超任何人类个体并且没有反转可能性,这大概是能力绝对超越人类能力的领域之一。但是,如果从围棋技艺及文化来看,那么“人类智能”针对围棋的思维活动中体现出的理解、意图、猜测、推理、解释、说明能力,AlphaGo 都不具备。除了计算评价函数值以确定落子位置,就连对自己刚刚下过的棋局通过复盘总结解释每一手的得失也不可能,因为 AlphaGo 并不具备语义处理能力,并且当然不具备思维能力。所以,即便是在输赢上能力绝对超越人类能力,也不能说在围棋整体上能力已经超越人类能力。因为 AlphaGo(以及 AlphaGo Zero)都没有任何通用性,仅以围棋博弈输赢能力为根据就说其“智能”已经超越“人类智能”就近乎胡说八道了。

近年,随着以 ChatGPT 为首、基于大语言模型的 AIGC 工具的广泛应用进展,众多人工智能领域专家(包括图灵奖及诺贝尔奖获得者 Geoffrey Hinton)以及更多的非专业人士都在大肆宣扬这些 AIGC 工具的“理解能力”和“推理能力”所表现出的“通用智能”。

但是,实际上,从工作原理和理论基础的本质局限性来说,基于大语言模型的AIGC 工具表现出来的所谓“理解能力”和“推理能力”,仅仅是可以迷惑概念不清者的一种假象。

“大语言模型是人类生成的文本的庞大公共语料库中的标记的统计分布的生成数学模型,其中所讨论的标记包括单词、单词的一部分或单个字符,包括标点符号。”[38] 大语言模型的本质是,基于海量文本数据(原生数据源),以概率统计相关性方法(评价标准/理论根据),生成“最似乎合理”(无任何形式语义基础,概率统计上合理)的文本模式序列(任务目标/输出对象)的文本模式模拟器;其工作原理是以Transformer 架构的多头自注意力机制,对给定的一段文本前缀,预测出其下一个最可能(概率最大)出现的词(子词,token);其理论基础是概率论。[39-41]

因此,尽管大语言模型的概念框架结构中以及技术实现中必定隐含地基于(通过人类设计者及工程师的逻辑思维嵌入的)某些逻辑规律规则,但是在大语言模型整个系统中毫无明确清晰的逻辑规律规则表达作为评价标准或理论根据,这是大语言模型工作原理和理论基础的本质局限性。

首先,大语言模型的“推理”不是根据正确性及有效性的评价标准,而是根据概率统计相关性的评价标准得出的,从根本上就没有将符合逻辑规律规则这一准则纳入评价机制,当然不可能确凿地是正确的有效的。其次,即便是大语言模型的某些“推理”从前提得到新结论的一系列有序步骤碰巧是正确的,新结论也是有效的,但是这仅仅是大语言模型的偶然产物而非必然产物,并且这种偶然还是随机的。这种正确性是语言大模型从海量人类文本语料中碰巧模拟出来的,针对同样提问的重复执行也不能保证再现同样模拟结果。用俗语来说就是,“瞎猫碰上死耗子蒙上了,下次再碰上也未必蒙得到”。第三,被误称为“幻觉”[42]的、大语言模型的无中生有胡编乱造,当然也必须算作是其“推理”结果,当然不是正确有效的。第四,当我们抽象地说人类具备“推理能力”,是指人类的群体智能体现出来的“正确有效推理能力”。从个体智能的角度来说,任何人类个体都不能保证每次推理都是正确的,但是,从群体智能的角度来说,人类的推理基本上是确凿地正确的有效的。亦即,人类群体能力可以覆盖掉个体能力差异。然而,大语言模型个体能力的欠缺并非是个体差异,而是由其工作原理和理论基础的本质局限性造成的,无论有多少个大语言模型的叠加,也不可能增强其群体能力。最后,大语言模型工作原理和理论基础的本质局限性是其本质特征,修改了就不是大语言模型了。所以,大语言模型不具备“正确有效推理能力”的特征是不可能通过改进其实现技术或者使用技巧就能够改变的。[43]

所以,从其工作原理及理论基础的本质局限性来说,大语言模型实际上从未,今后也永无可能,具备真正的正确有效推理能力[43]。故而,大语言模型实际上从未,今后也永无可能,超越“人类智能”。

*第六节 人工智能究竟能否全面超越人类智能?*

目前,人工智能系统所呈现的“人工智能”当然还没有全面达到“人类智能”的水平,问题的关键在于,伴随着计算机技术以及人工智能技术的进展,今后将会如何?“人工智能”是否迟早能够全面超越“人类智能”?

(一)关于必要条件(1)

首先,本文第二节的问题设定中笔者对“人工智能能够全面超越人类智能”之定义的第一个必要条件,“(1)对于人类(凭借自身自然生物个体/群体智能)能够清晰表达提出的每一个概念/问题,存在某个或某群人工智能系统也能够提出该概念/问题,并且,人工智能系统还能够先于人类提出人类从未提出的新概念/新问题”,就是“人工智能”永无可能满足的。

表达和提出新概念新问题,不仅需要通常的智能并且需要高度的抽象思维能力。因此,即便是在人类社会,也并非每个个体都具备,而是仅仅很少一部分高智能个体具备这样的抽象思维能力。我们通常把抽象思维能力归类于“人类智能”的一种特有能力[1,6,7],因此一般不认为计算机系统/人工智能系统具备真正的抽象思维能力。冯诺依曼(John Von Neumann,1903-1957)曾经说过一句名言:“计算机就像人类一样 – 除了思考,它们什么都会做(Computers are like humans - they do everything except think)。”仅就本文前面定义的计算机系统的工作原理来说,人工智能系统,从计算原理上不可能具备真正的抽象思维能力。

那么,由人工智能系统可能呈现出的类似人类抽象思维能力的智能行为,我们权且称其为“人工智能思维能力”,是否有可能超越“人类智能”真正的抽象思维能力?这个问题的回答显然关系到本文前面言及的行为主体自主设定意图/目的和达成目的之评价标准问题,既然人工智能系统不可能成为行为主体,那么其“人工智能思维能力”就如同大语言模型的“理解能力”和“推理能力”一样,仅仅是一种假象。

所以,仅就第一个必要条件而言,“人工智能”就永无可能超越“人类智能”。

(二)关于必要条件(2)

其次,由于人工智能系统在计算原理上的本质局限性,它们当然不可能解决任何不可计算(不可判定、不存在一般算法)的形式化问题。人类对付不可计算问题的办法是具体实例具体分析,通过使用经验知识而非一般算法来各别解决。于是,基于传统计算理论的、必须使用一般算法的人工智能系统当然不可能超越使用经验方法的人类。

真正让人工智能系统在本质上更难超越人类的是那些没有被形式化的、难于被形式化的下面各类问题:

(1)创建新学问体系的问题:创建新逻辑学理论体系、新数学理论体系、或者其它新科学理论体系。毋庸置疑,创建新学问体系是拥有最强“人类智能”的少数卓越学者之所为,需要在逻辑学、数学、或者其它科学领域内的长期研究工作中发现以往学问体系的缺陷或不足、从现象中抽象出并且定义新概念、提出新原理或新基本假设、构建新学问体系的构架、指出新学问体系的发展方向、提示新学问体系的待解决问题。多少年来,世界顶级学者们一直是这么做的。在逻辑学及科学哲学领域,试图归纳出科学发现过程一般规律的调查研究已经进行了多年,至今也还未获得统一的实质性结果。创建新学问体系的问题显然还不是一个能够形式化的问题,因此,尽管有众多“人类智能”的成功实例,还绝非人工智能系统能够解决的问题。

(2)在逻辑学/数学研究中创新的问题:定义新的逻辑学/数学概念、提出新的逻辑学/数学猜想、提出并证明新的逻辑学/数学定理;这些都是一般的逻辑学家/数学家们之日常研究工作。作为并非自然界原本存在的、通过人类智能的高度抽象归纳总结而成的逻辑学和数学,它们的共同特征是高度抽象性(逻辑学比数学更为抽象),在逻辑学/数学领域的创造性工作需要极其高度的抽象思维能力和逻辑推理能力。尽管逻辑学/数学之内容都是高度形式化的(亦即,容易被人工智能系统处理的),但是,因为逻辑学/数学领域的创造性工作时常需要基于直觉的“跳跃性”思维,其过程却是极其难于被形式化的。所以,在逻辑学/数学研究中创新的问题绝非人工智能系统能够解决的问题。

(3)在诸多科学研究中创新的问题:自然/社会科学家们直接或通过实验间接观察自然/社会现象、提出新的研究方向及课题、提出新的科学概念/猜想/假说/原理/定理/预测/试验方法、验证新的科学定理、提出新的科学评价标准、提出新的科学应用;这些都是一般的自然/社会科学家们之日常研究工作。与逻辑学/数学不同,因为涉及到观察和实验,诸多科学内容本身以及研究过程是极其难于被形式化的。所以,在诸多科学研究中创新的问题也绝非人工智能系统能够解决的问题。

(4)在诸多工程领域中创新的问题:工程师们发明新的技术、设想新的项目/产品并提出新的应用、根据客户需求设计新的项目/产品、根据设计编制且监督且实施施工/生产计划、验收项目/产品、维护项目/产品;这些都是一般的工程师们之日常工程实践工作。在这些工作当中,有相当部分是需要依靠工程师们的工作经验来完成的,亦即,难于被一般化形式化的,因此也是人工智能系统不能够解决的。

(5)在医疗、教育、经营、金融交易等实践中的经验主导问题:尽管现代医学开发了大量的测试检查方法,在不少测试检查项目上,人工智能系统对结果的判别已经能够完成的甚至比医生还好,但是,医疗实践中的最终诊断还是由医生依据经验做出的。至于中医,就更是如此了。高等教育中的研究生教育,因为涉及到学术创新问题,导师个人及研究生个人的创新素质及经验对于教育效果极其重要。经营以及金融交易等实践中,经验也同样是至关重要的。所有这些人类社会生活实践中依赖于经验、由经验主导的人类智能行为,都不是能够被一般化形式化的,因此也是人工智能系统不可能具备的。

笔者在上面列举的这些问题,都是“人类智能”已经并且还将继续解决的,无论怎么定义“人类智能”,这都应该是毋庸置疑的。然而,如上所述,“人工智能”解决不了这些问题。这些“人类智能”行为的共同特征就是必须由具备自主独创性、具备自主设定意图/目的和达成目的之评价标准的人士方能完成。而计算机系统在工作原理上恰恰不具备自主独创性,不具备自主设定意图/目的和达成目的之评价标准的能力!人工智能系统当然也不具备!

除去上面列举的“人类智能”已经解决的各类问题,我们还有一个“人类智能”正在试图解决但是还没有完全解决的问题,亦即,认识、理解、究明“人类智能”自身这个问题。既然任何人工智能系统的初始程序需要人类提供,那么当人类还都没有认识和理解清楚某个关于智能的问题时,如何有可能为解决该问题的人工智能系统提供初始程序?显然不可能!并且,如果“人类智能”是持续不断发展的,那么其发展当然是一个无穷延续的过程,亦即,人类很可能永远不能完全认识、理解、究明“人类智能”自身,那么,“人工智能”何以能够超越“人类智能”呢?

关于人工智能系统“解决”问题,还有在概念上必须澄清的一件事情。我们已经定义了“‘解决问题’一词用于指称某个(某类)行为主体对于给定的某个(某类)问题找到解决该问题的切实方法并且用该方法实际解决了该(类)问题,给出正确答案,并且问题是否得到正确解决的判断是由该行为主体自身做出的。” 我们还定义了“‘人工智能系统’一词用于指称能够执行为解决某个(某类)特定问题由人类制订了初始应用程序并且在完成任务时呈现出一定类似“人类智能”行为特征的运行中的计算机系统。这里,“人工”的限定意义在于该计算机系统执行的初始应用程序是由人类设定的,尽管在完成任务的过程中该系统也可能会执行由其自身自动生成的程序指令。” 所以,任何由人工智能系统“解决”的问题,对于问题解决与否的判断,不能说是完全由人工智能系统作为行为主体自身自主地完成的,而是由人工智能系统作为执行者,依据人类作为行为主体在初始应用程序中设定的评价标准完成的。

因为我们本来就是比较“人类智能”与“人工智能”,既然我们定义了“人工”的限定意义,如果人工智能系统是根据人类通过初始程序设定的评价标准做出判定的,那么就不应该是问题了。人类是设定评价标准的行为主体,人工智能系统是依据人类设定的评价标准做出判定的执行者。所以,即便是在解决某些问题上人工智能系统做的远比人类要好,“超越”也仅仅是在结果上的超越,并非在设定评价标准上的超越,因为设定评价标准的行为主体是人类根本不是人工智能系统。

进一步的问题在于,如果人工智能系统完成任务的过程中执行由其自身自动生成的计算程序,其计算目标和评价标准是如何设定的?谁是设定被自动生成程序中计算目标和评价标准的行为主体?

借用逻辑学/语言学中表达层次概念的用语,我们可以把在计算机系统中被执行并且输出最终结果的程序称为“目标程序”,将生成目标程序的程序称为“1阶元程序”,将生成1阶元程序的程序称为“2阶元程序”,…。显然,如果目标程序是被自动生成的,那么包含在目标程序中的计算目标和评价标准应该是由1阶元程序自动生成的,如果1阶元程序也是被自动生成的,那么,包含在1阶元程序中的计算目标和评价标准应该是由2阶元程序自动生成的,余类推。

如果一个人工智能系统仅用人类设定的初始程序作为目标程序来解决问题,那么如前所述,其计算目标和评价标准是由人类在初始程序中给定的。如果一个人工智能系统用来解决问题的目标程序是其自动生成的,那么,人类为其设定的初始程序必须是1阶、2阶、或更高阶元程序。

就笔者所知,现今计算机科学领域最成功的通用程序自动生成技术是compiler-compiler技术,亦即,给编译程序生成器输入某个目标语言的形式化文法描述,编译程序生成器自动生成该目标语言的编译程序,可直接被用于编译该目标语言的源程序。支撑compiler-compiler技术的是形式化文法及编译理论。目前应该还没有能够自动生成编译程序生成器的“2阶编译程序生成器”。(请注意,近年 AIGC 工具的程序生成技术绝非切实的成功技术,因为其本质上基于统计概率及猜测并且是随机的,在理论上永无可能保证被生成程序的100%正确性。)

所以,以往,由人工智能系统解决的问题,几乎(如果不是全部的话)都是由人类作为行为主体在初始程序中设定计算目标和评价标准,由人工智能系统作为执行者根据人类设定的计算目标和评价标准做出判定的,亦即,人工智能系统基于人类设定的评价标准“超越”了人类。今后,无论人类给人工智能系统提供的初始程序是多少阶的高阶元程序,其中必须包含生成低阶元程序所需评价标准的“元评价标准”。仅就笔者所知,理论计算机科学关于计算/程序(及语言)理论的研究领域目前似乎还根本没有在这个方向上的工作。笔者的猜测是,即便设定“元评价标准”的问题可以完全形式化,也将是不可计算问题。

另一方面,如果从人类社会发展进步的角度来看,所有由人工智能系统解决的问题的重要性/价值,最终还是由人类依据有可能进化的评价标准做出最终判定的,没有(也不可能有)人工智能系统能够从人类社会发展进步的角度来判定其自身解决问题的重要性/价值。

所以,前述我们设定问题的第二个必要条件,“(2)对于人类(凭借自身自然生物个体/群体智能)能够解决的每一个(类)问题,都存在某个或某群人工智能系统也能够解决该问题且在评价指标上表现出比人类的解决更好的性能,并且在解决问题的过程中,对问题解决之判断以及评价,是由该人工智能系统自身做出的”,也是“人工智能”永无可能满足的。

(三)关于必要条件(3)

最后,伴随着理论及技术的进步,人工智能系统能否在将来具有类似于生物的自我意识、自主设定计算目标和评价标准、自主完成计算及判定、像生物一样不断进化、能力越来越强大以至于在将来会控制人类?

图灵奖获奖者明斯基(Marvin Minsky,1927-2016)曾经说过:“没有一台计算机被设计成能够意识到自己在做什么;但大多数时候,我们也不是(No computer has ever been designed that is ever aware of what it’s doing; but most of the time, we aren’t either)。”

笔者认为,上述问题的根本在于,人工智能系统能否具备自律进化的自我评价机制。无论生物的自律进化还是非生物的被动“进步”,如果要让事物向着优化的正方向进化/进步,那么一个可能需要不断修改评价标准的自律/被动评价机制是必不可少的。如果人工智能系统根本不具备自主独创性、不具备自主地制定以及修改评价标准的能力,那么它们如何可能具备自律进化的自我评价机制?当然是不可能的。

所以,前述我们设定问题的第三个必要条件,“(3)人工智能系统能够自主设定并解决并非由人类预先给定的问题,这些问题是人类(凭借自身自然生物个体/群体智能)不能够解决或者即便能够解决其性能也不如人工智能系统的”,也是“人工智能”永无可能满足的。

*第七节 结论*

综上所述,人工智能系统不可能具备抽象思维能力和逻辑推理能力,不可能提出新概念新问题,不可能解决人类能够解决的全部问题,以往和今后由人工智能系统作为执行者解决的问题,其计算目标及评价标准都是由人类作为行为主体设定的,其重要性/价值也还是由人类做出最终判定的,并非由人工智能系统自主设定计算目标及评价标准并由其自身自主地做出最终判定的,人工智能系统不可能具备自律进化的自我评价机制。

根据本文的讨论,我们可以非常肯定地说,“人工智能”全面超越“人类智能”是永无可能的;让人工智能系统像生物一样不断进化、以至于在将来会控制人类的情形也是永无可能发生的。

作为一种工具,人工智能技术和所有的其它工具一样当然具有双刃剑的特性。既然人工智能系统不可能作为行为主体做出超越人类的任何事情,那么,其双刃的哪一刃发挥怎样的作用便取决于谁作为行为主体,出于什么目的,指令它们做什么事情了。人类社会真正需要警惕的不是来自人工智能技术的危险,而是有些不怀好意之人利用人工智能技术做出危害社会的事情却把责任推卸到原本并无责任能力的人工智能技术上去。所谓“人工智能技术将会威胁人类生存”,从科学和技术的角度来说是毫无确凿根据的“杞人忧天”,从社会的角度来说是完全不负责任的“混肴视听”和“转移视线/矛盾”,必须予以驳斥和澄清。

参考文献

[1] 程京德,“智能:具体智能和抽象智能,个体智能和群体智能,以及人工智能之天花板”,微信公众号“数理逻辑与哲学逻辑”,科学网博客,2024年9月25日。

[2] The Oxford English Dictionary (OED), 2nd Edition, Oxford University Press, 2009.

[3] Merriam-Webster Dictionary, Merriam-Webster.

[4] H. Gardner, “Frames of Mind: The Theory of Multiple Intelligences,” Basic Books, 1983, 2004, 2011.

[5] M. N. O. Sadiku, O. D. Olaleye, and S. M. Musa, “Abstract Intelligence: An Introduction,” International Journal of Trend in Research and Development, Vol. 7, No. 3, 2020.

[6] 程京德,“形象思维、抽象思维及逻辑思维”,微信公众号“数理逻辑与哲学逻辑”,科学网博客,2023年8月19日。

[7] 程京德,“为什么说逻辑推理能力是人类智能中最基本的能力?”,微信公众号“数理逻辑与哲学逻辑”,科学网博客,2023年10月27日。