人类智能:有关推理、逻辑、因果、预测、学习、算法、想法与一切
人类智能的要素、运作、内涵、意义与源头是什么?
本文,将在演化脉络的视角之下,信息与结构的视角之上,结合神经科学与心理学上的概念和模型,由浅入深、层层递进、深入浅出地剖析解读,有关人类智能的方方面面(如注意力、记忆力、抽象力、创造力、可塑性、直觉、概率、模型等),包括其下层与上层、交织与交错的深刻关联。
从尺度角度来说,本文的探讨属于**“宏观黑盒”,并未涉及任何神经运作与脑区功能的细节,仅在最基本的“神经模型”之上,进行更高层级的论述,显然这把更多不确定的细节,都封装在了某个层级之下,所以令本文的观点和结论,更具有通用性和适应性**。
而本文所运用的**“解析算法”,其核心动作就是:在思考的过程中,强力思考思考的思考,于是就在这种自指调用的循环中,尽量深入递归的层级,在陷入泥潭“脑栈溢出”**之前,带着各种有趣的信息,心流地回归现实。
那么对于**“黑盒”,风险哲学家、随机性大师、“黑天鹅之父”——纳西姆·塔勒布,在《随机生存的智慧》**中,说道:
“他们——生下来被放在盒子里,回到家住在盒子里,学习时勾选一个个的盒子,乘着盒子去上班,工作时坐在盒子里,开着盒子去超市买装在盒子里的食物,乘着盒子去健身房,死后被放在盒子里。这些都是符合欧几里得定义的、四四方方的、表面平滑的盒子。”
人类历史学家——尤瓦尔·赫拉利,则在**《今日简史》**中,说道:
“人类害怕被困在盒子里,但没意识到自己早就被困在一个盒子里了——这个盒子就是人类的大脑。”
而在电影**《困在时间里的父亲》中,阿兹海默症淋漓尽致地展现了,我们被困在“黑盒”**之中,逐渐失去一切的窘迫与恐惧。
是的,黑盒之中,就是有关人类至关重要的一切,而黑盒中的智能,就是人类赖以生存的一切。
相信本文的信息量与洞见密度,将会让我们从不同的视角,重新了解与认识这个我们自身顶上熟悉又陌生的——“黑盒智能”,而越是了解这个**“黑盒”,我们就越是能够发掘和运用其中的“智能”**。
接下来,就让我们开始这趟**“黑盒之旅”**吧。
主题目录如下:
- 人类智能
- 四种推理
- 什么是逻辑
- 逻辑与因果
- 智能与预测
- 大脑的预测
- 在预测之外
- 大脑的结构
- 智能的运作
- 大脑的信息
- 可塑性学习
- 贝叶斯算法
- 想法与一切
- 结语
- 后记1:智能的源头
- 后记2:语言的作用
- 后记3:虚拟的现实
人类智能
智能,是人类最强大的神力,是让人类从自然界与动物界,脱颖而出的利剑与铠甲,是人类文明的基石,是塑造当今世界的底层力量。
人类能够像神一样统治地球,这份统治力正是来自我们的**“智能神力”**。
好消息是,几乎每个人都天生拥有智能,这是我们的祖先在几十万年前,抽中了智能的**“演化彩票”,并遗传给我们的“基因财富”**。
那么这个**“人类智能”**到底是什么,又是如何发挥作用的呢?
从浅层简单的角度来看,人类智能——就是人类的思考能力,而思考可以产生思维,思维可以产生思想,这三者的递进关系,如下:
- 思考——基于信息的推理过程(动词),如思考问题、思考一下——在想。
- 思维——基于模式的思考方法(名词),如逻辑思维、理性思维——怎么想。
- 思想——基于思维的认知结果(名词),如成熟思想、深刻思想——想出什么。
可见,思维的作用,就是承上(思考)启下(思想),而打包一些思考方法成为一个系统,就可以称之为**“工具”,如哲学思维、数学思维、科学思维等等,都是一种“思维工具”**。
那么,当审视思考本身的行为与过程的时候,我们就会发现,思考主要就是在做一件事情,那就是——推理(Reasoning)。
而从推理角度看,人类智能可主要可以进行,四种推理:
- 第一,演绎推理,又称逻辑推理,由一般到特殊。
- 第二,归纳推理,由特殊到一般。
- 第三,类比推理,由特殊到特殊。
- 第四,溯因推理,又称反绎推理(或反向演绎),由特殊到解释。
其中,类比与溯因的区别在于:
- 类比——是形式不同,但逻辑相同的连接。
- 溯因——是根据现象,寻找最可能的解释。
而在推理背后的支撑之物——就是逻辑,即:所有的推理都要符合逻辑,否则推理过程就不成立。于是,思考就是符合逻辑的推理,思维就是符合逻辑的方法,思想就是符合逻辑的逻辑。
可见,思考需要逻辑,思维内嵌逻辑,思想就是逻辑,所以抽象来看——人类智能就是由**“旧逻辑”推理出“新逻辑”**的能力。
四种推理
第一,演绎推理,从一般到特殊。
例如,已知有一袋绿豆,请问取出一颗是什么颜色?——演绎推理可得,绿色。
演绎,能够让我们对未知事物,做出准确的判断,即:只要前提结论正确,推理过程符合逻辑,推理结论就一定正确——这是人脑主动使用最多的推理方法。
而符合逻辑的意思是,结论与结论之间,不能违反逻辑规律,即满足:
- **同一律,**保证描述的是同一个事物。
- **矛盾律,**不能同真,必有一假,可以同假,即不能同时成立。
- **排中律,**不能同假,必有一真,可以同真,即至少一个成立。
- **无矛盾,**不能同真,不能同假,必有真假,即必须一真一假。
那么,“第一原理思维”与“终局思维”,就可以看成是从上到下、从后往前地运用演绎推理——但能够想到这两种思维,并在实际中运用,则需要一些溯因推理。
第二,归纳推理,从特殊到一般。
例如,已知有一袋豆子,每次取出一个都是绿豆,请问这一袋是什么豆子?——归纳推理可得,绿豆。
归纳,能够让我们提取事物,内在统一的抽象信息,但这个结论未必正确——就像上面那袋豆子,取出1000个都是绿色,并不能保证剩下的豆子都是绿色。
既然不准确,那都用演绎推理就是了,为什么还要用归纳推理呢?
原因就在于,归纳可以为演绎提供前提。
显然,真实世界的推理,常常已知前提不足,这时就可以利用归纳推理,得出一个前提,再以此前提进行演绎推理——只是此时,其结论也就是不准确的了,但总比没有结论好。
可见,归纳其实是一种经验推理,经验无法保证逻辑绝对正确,是归纳不准确的底层原因——这是人脑被动使用最多的推理。
换言之,人脑常常会无意识地运用经验归纳(如局部代替整体、个体代替群体,个例代替所有),作为演绎的前提,进行不准确的推理。
但需要指出的是,数学归纳法——是先证明第一张牌会倒,再证明任意一张牌倒了其后继也会倒,那么整个**“多米诺骨牌”(无论有多少牌)就都会倒——所以数学归纳法可以保证,无限种情况下,其结论都成立,没有例外——因此它的本质其实是,绝对准确的演绎推理**。
第三,类比推理,从特殊到特殊。
例如,细胞运作就像工厂生产,血管分布就像道路规划,基因表达就像公司管理,神经网络就像光纤网络,生物生长就像公司发展。
类比,可以理解为,抽象的外推,即:有抽象才有类比,抽象接近本质,本质通用(即底层逻辑相同)可以外推。
显然,类比的目的,不是提供准确的结论,而是提供视角、概念与启发——这是人脑自动使用的推理方法,常常自动触发,但它的效用取决于,人脑已有的抽象信息(包括经验归纳的信息)。
事实上,通才的**“学习迁移”,即是类比思维的大量使用,显然抽象信息不足,是无法进行“有效迁移”**的。
值得一提的是,在中文语境下,**“比如”和“例如”**都可以引导类比,大部分时候可以通用,但有一种情况“例如”更适合,即:从多个相似事物中给出典型——超级英雄都具有牺牲精神,例如钢铁侠——此时侧重举例,而不是类比。
第四,溯因推理,从特殊到解释。
例如,光为什么无法静止,因为光速没有参考系;单电子为什么能双缝干涉,因为它同时穿过了双缝;薛猫开箱为什么没有生死叠加,因为世界分裂出了两个平行宇宙。
溯因,可以理解为,闪念与洞见,即:大脑遥远区域的长连接,以及潜意识的计算,即直觉。
需要强调的是,颅内**“长连接”可以穿越不同功能的脑区——这不仅是“遥远”信息的连接,也是各种脑功能**的连接。
可见,溯因的结论,有时是惊为天人的创新,有时则是**“异种”——这是人脑不常使用**的推理方法,常常是随机触发,但其效用往往也是随机的。
历史上,很多伟大的发明创造,其实都是溯因推理,瞬间激发**“顿悟时刻”的结果——这也被称为“尤里卡时刻”(Eureka)或“啊哈时刻”**(Aha Moment)。
而类比来说,风险投资就是在构建**“长连接”,即把“相隔很远”的资本与创新连接起来,创造具有“洞见”的产品——所以风投的思维模式,常常具有溯因推理**。
那么值得指出的是,关于创意、创新、创造,有如下不同:
- **创意,**是一种可见的不同——有新颖感,比较表面,带来趣味,不解决问题。
- **创新,**是一种深度的不同——有惊奇感,比较本质,带来变革,可解决问题。
- **创造,**是一种创新的实践——有成就感,比较复杂,带来产品,能满足需求。
另外,著名的侦探福尔摩斯,有句名言:“当排除掉所有的不可能之后,无论剩下的是什么,不论有多么不可能,它都一定是真相。”
这像是一种“演绎版”的**溯因推理,**因为“排除掉所有的不可能”,很有演绎的“步骤感”,而有些“不可能的可能”,无法判断是不是可以排除——但“溯因”可以直接定位到它们。
事实上,纯粹的溯因推理,都会存在“跳步”,即没有明确的推理步骤,其过程的“可解释性”都是事后的解读,而这种“不可解释性”是来自于,大脑黑盒的“直觉计算”。
最后,推理的本质与意义。
综上可见,推理的本质,就是根据已知确定未知,即:
- 推理过程——是在逻辑约束下,进行模式的识别与匹配,即定性。
- 推理操作——是在逻辑约束下,进行信息的抽象与连接,即计算。
- 逻辑约束——是在已知前提下,需要关系符合逻辑规律,即合理。
其中,演绎与归纳——是基于精确逻辑的,类比与溯因——则是基于概率统计的。
从某种角度说,闪念、直觉、灵感、顿悟所带来的洞见,就是运用类比与溯因的推理结果,其过程看似没有逻辑,实则背后是大脑**“遥远连接”所激发的,信息的“自由”排列组合,其可能蕴含着深刻本质的逻辑**。
换言之,类比的逻辑——需要抽象到某个层次才能看见,而溯因的逻辑——需要抽象到更深层次才能看见。
当然,相比演绎,归纳、类比、溯因的准确率是渐次递减的,而如果前提是准确的,演绎就是准确的,所以演绎就成了逻辑的代名词,演绎推理通常就指代**“逻辑推理”**。
那么推理的意义,就在于——捕获因果,预测未来。
显然,掌握了因果关系,就可以预测未来,而预测未来是为了趋利避害,趋利避害是为了生存,生存压力演化出了预测未来的能力,即:因果推理。
而从因果推理来看,“在意料之外,又在情理之中”——就是没有推理出结果,但可以理解推理过程——这也是,**“超出预期,又符合预期”**的精彩之处,即:喜欢 = 熟悉 + 意外。
至于,推理如何捕获因果,其关键就在于,逻辑连接了推理与因果,即:推理通过逻辑捕获了因果。
什么是逻辑
为什么按照逻辑,应该是这样的?为什么你的逻辑是对的,我的逻辑就是错的?为什么这样符合逻辑,那样就不合逻辑?
原因就在于,逻辑是事物所固有的关系,更准确地说,逻辑是某个角度下客观结构所呈现的客观关系——客观结构包括一切物理结构与数学结构。
简而言之,事物的关系,是一种客观存在,可以被抽象成逻辑。
因此,正确的逻辑——就是可以客观存在的结构关系,错误的逻辑——就是无法客观存在的结构关系。
例如,应用正确的逻辑,在现实中就可以得到“可见”的结果(即预测成功),应用错误的逻辑,在现实中就无法得到“可见”的结果(即预测失败)。
例如,逻辑正确,关系存在,对应的信息就正确,而正确的信息可以消除不确定性,错误的则不行,因为错误的逻辑,对应不存在的关系,“不存在”无法确定客观运作。
可见,逻辑具有可判定的唯一正确答案。
而推理过程中,必须符合的逻辑规律(矛盾律、排中律、无矛盾),其目的就是保证结构关系的客观存在性。
例如,如果逻辑出现了前后矛盾,就必然没有客观存在性,因为矛盾是对立的关系,同一事物在某一时刻,只能客观存在对立关系中的一个,这是客观世界的现实要求——当然,不同事物,或同一事物不同时间,可以出现对立关系。
事实上,有结构就会有关系,有关系就会有逻辑,关系无法脱离结构,就是逻辑无法脱离结构,而结构是无处不在的,所有的事物都会以不同的结构呈现出不同的关系,这意味着逻辑会以不同的形式,无处不在地存在。
那么,在相同的环境和条件下,事物所呈现的各种关系,被观察、被体验、被总结、被验证、被理解,最后掌握了关系的触发与重现,这个客观关系就被称为——规律。
而每当我们对规律有了新的认识,就相当于重新定义了关系,旧逻辑就会被推翻(或变得有条件成立),新逻辑就会被建立。
不过,这里需要特别指出的是,不同的角度看同样的结构,可能会有不同的关系,即有不同的逻辑——因此,同一个事物,不同的理解角度,就会有不同的结论与意义,这有点像是**“逻辑的相对性”**(类比同时的相对性)。
究其原因就在于,不同的角度会看到不同的连接——如游戏《纪念碑谷》的视觉欺骗(应用彭罗斯三角,Penrose Triangle),而不同的连接还能连接本来无法连接的结构——如换个角度或方向,就对了、就行了、就可以了、就说得通了、就完美匹配了。
事实上,各种不同的模型,就是不同尺度和视角下的连接,而借助**“几何图像”,我们就更容看清和理解模型中的连接**,就更容搞懂模型中的逻辑——所以我们的脑海中,充满了**“几何模型”**。
那么显然,连接将会以非线性(接近平方一半,n * (n - 1) / 2)的方式增加更多(可观察)的视角,也就是增加更多(可提取)的逻辑关系。
而洞见就隐藏在非线性的连接与逻辑之中,即:可能一个不同的视角就会带来一个不同的洞见——这就是不同的理解能够产生不同的力量,也就是颅内信息多样性演化(带来不同连接、逻辑与理解)的力量。
- 例如,横看成岭侧成峰,远近高低各不同。
- 例如,温故而知新,即是在相同的结构中,发现了新的关系。
- 例如,同样的客观事实,不同的观察角度,就会有不同的观点看法。
所以,换个角度说,推理就是对事物关系的确定,即:正确的推理——得到规律,错误的推理——得到谬误。
但在此别忘了,逻辑(关系)必须蕴含在结构之中——那么获取结构,就可以获得更多的逻辑,而数据、信息、经验、知识、认知等等,都是**“某种结构”,其中蕴含着大量多样**的逻辑。
可见,“想得太多,学得太少”——就是只有推理,但缺少结构,所以大概率只能推理出,狭隘局限的逻辑关系。而所有争论(包括所有不同观点意见)的来源,都可以追溯到大脑结构的差异性,所带来的不同逻辑路径。
逻辑与因果
著名理论物理学家、圣塔菲研究所前所长——杰弗里·韦斯特(Geoffrey West),在**《规模》**中,曾指出:
“所有的物理定律、及实际上所有的科学定律,都必须可表述为比例不变的「无量纲数」数量之间的**「关系」**,尽管它们通常不会这样写就。”
无量纲数——是指两个具有相同量纲的物理量的比值,又称无量纲量。 量纲——是指物理量的基本属性,如长度、时间、质量等。
而规律可以帮助我们预测未来,谬误则无用或有害,甚至带来灾难,但有时也能带来益处,主要是心理上的正面感受,如:虚幻的确定感与自利性的偏见。
但,规律中的逻辑关系,为什么就可以预测未来呢?
答案就在于,关系意味着存在连接,连接可以传递相互作用,相互作用带来了**“因”与“果”,所以是因果关系中,现在的“因”可以预测未来的“果”**。
也就是说,逻辑保证了关系的存在性,关系中的相互作用通过因果,连接了现在与未来。
所以,其实是因果关系中的相互作用,决定了未来的演化,而逻辑是因果的基础,逻辑关系蕴含着因果路径,就是蕴含着通向未来的路径。
但如果逻辑关系非常复杂,形成的因果路径有多个选择,此时逻辑关系就不仅蕴含着因果关系,还存在着相关关系——因此,两个事物具有逻辑关系,并不一定就具有因果关系,即:相关性不等于因果性。
例如,原因的原因可能不是原因,结果的结果可能不是结果——就是因为间隔的原因与间隔的结果之间,可能会存在多条可连接、可抵达、可作用的因果路径,于是多个选择就形成了相关性,而不是因果性。
另外,还需要指出的是,这个因果相互作用所呈现的结果,可以是确定的(即无概率),也可以是不确定的(即有概率),所以逻辑可以呈现概率(如微观不确定性),即:概率是逻辑的结果(如量子力学)。
由此可见,逻辑就相当于(充当了)一个**“层级封装”**——在层之上,人脑利用推理形成了智能;在层之下,就是现实世界的各种关系,可以被抽象成逻辑,支撑智能的预测。
而更形象地说,现实世界的客观结构是一个**“整体”,人脑结构映射了“世界的部分结构”,并通过智能,推理出了“颅内数据结构”的逻辑关系,这个逻辑关系连接了颅内外的结构,从而可以预测现实世界的未来运作**。
也因此,预测未来的关键,就是获取各种结构的逻辑关系——最底层结构的逻辑关系,自然就是宇宙的基本规律,也称之为**“第一原理”**。
智能与预测
于是,我们可以得到:
- 预测未来 = 确定关系 = 结构 + 推理。
- 预测能力 = 人类智能 = 颅内结构 + 四种推理 。
- 颅内结构 = 大脑结构 + 数据结构。
可见,智能的高低(或强弱),就是体现在预测能力之上的,即:智能越高,预测能力就越强。而预测能力越强,就意味着能更好地——应对未来、适应环境、甚至改造环境——这就是进化出智能的意义。
事实上,在过去可以准确预测未来的人,都被认为是拥有魔法巫术的——“先知”,而现在可以准确预测未来的人,则被认为是具有稀缺价值的——“聪明人”或“天才”,并且人们也一直非常喜欢彰显炫耀自己的——“预测能力”(在预测正确的时候)。
当然,四种推理,分别代表了不同的预测能力,如:
- 演绎——是逻辑预测,在于逻辑力。
- 归纳——是经验预测,在于记忆力。
- 类比——是联想预测,在于联想力。
- 溯因——是洞见预测,在于洞察力。
这里需要指出的是:
- 逻辑力包含抽象力,没有抽象就没有逻辑,语言就是一种抽象,语言支撑了逻辑。
- 想象力可以想象出,毫无逻辑且没有预测效用的结果,所以想象力可以无关推理。
而这些能力,是组合运作的,如:
- 逻辑力 + 记忆力 = 分析力。
- 记忆力 + 联想力 = 直觉力。
- 联想力 + 洞察力 = 顿悟力。
- 逻辑力 + 记忆力 + 联想力 + 洞察力 = 预测力 = 推理力。
塔勒布在**《反脆弱》**中,曾洞见到:“经验不会受到思维漏洞的影响,但推理和研究会。”
这似乎就是,归纳优于演绎的地方,体现出了在复杂世界——实践经验(即躬身入局)会高于颅内模拟的准确率。
显然,真实世界的具体问题,往往都是不确定的复杂系统(包括简单的复杂和复杂的复杂),其难度不在于解方程,而在于没有方程,或不知道该用哪个方程(相比而言数学难在单纯确定的复杂)——这就是演化偏好经验归纳的原因所在。
例如,大自然用实践演化(真实世界),智能用推理演化(逻辑世界),前者是具体数学,后者是抽象数学。
那么,预测的准确率,除了在于智能的高低,还在于——时间与连接两个维度,即:预测的时间越长、连接越多,预测准确率就越低,反之亦反。
用公式表达,就是:预测准确率 = 智能 / (时间 * 连接),即:
- 时间和连接固定,预测准确率与智能成正比;
- 智能固定,预测准确率与时间和连接成反比;
- 如果没有时间就是静止系统,如果没有连接就是封闭系统;
- 静止系统不需要预测,封闭系统的预测在于其内部的连接。
例如,预测一个人在一分钟、一小时、一天后的行为,是越来越难的,而一个人与如果环境发生连接,就可能会改变他的行为,于是连接越多(即交互越多),就越难以预测他的行为;同理,蚂蚁、鸟群、沙堆、雪崩、粒子、股票等等,万物都是如此。
事实上,连接越多,局部的相互作用就有机会,由正反馈的量变积累成质变,产生非线性的涌现效应——这种不确定性,非线性地增加了预测难度。
不过需要指出的是,有连接不一定时刻都在相互作用(如你不会时刻联系朋友),但可以有相互作用(如你随时可以联系朋友)。
于此,可以将**“连接”**看成是——相互作用的通道或路径。
当然,人类智能的强大之处,就在于可以发掘事物背后的逻辑关系,这些关系即是——规律(Laws)、原理(Principles)、法则(Rules)、理论(Theories)、模型(Models)、秩序(Orders)、模式(Pattern)等等,通过它们,就可以在更多时间和连接的范围内,进行有效的预测。
例如,牛顿力学,可以有效预测天体运行;元素周期表,可以有效预测未知元素;统计规律,可以有效预测短期天气;幂律模型,可以有效预测复杂系统的演化;甚至脑神经模型与功能性核磁共振,可以有效预测人脑的即时选择。
而在此,我们还能看到一个正反馈循环,即在**“智能预测 = 结构 + 推理”中,智能预测发现的“新结构”可以增强“结构”本身,于是输出可以增强输入,结果“智能预测”**可以正反馈变强。
但同时,我们也会发现,推理是一个计算的过程,所以算力会制约智能预测的增速,尤其是人脑的算力有限,并且人脑的存储也有限,放不下所有的**“已知结构”——结果就是,人类的预测能力,不在于个人智能**(有限),而在于群体智能的叠加积累(迭代规律),以及借助外部工具的辅助。
例如,科学体系(可以看成是预测模型与预测工具)的构建与发展,就典型地体现出了群体智能的叠加积累。
例如,智能创造工具,工具扩展智能,而据**“存储 + 计算 = 预测”可得,工具提高人类预测能力**的方式有:
- 一方面,工具提供了,外部的存储、计算、或存储与计算。
- 一方面,工具开发了,大脑的存储、计算、或存储与计算。
那么,更普适地来看待逻辑与关系,我们会发现,所有的感觉都是一种逻辑关系(如饥饿与疼痛),它是本能捕获的因果,可以帮助我们预测自身与环境中的利害程度,而感受与感知(两者有思维,如愉快与危险),则是在感觉(无思维)的基础上,加入了智能预测。
所以,本能也可以进行,一定程度上的有限预测。
大脑的预测
直观上,人脑的推理行为,可以按照意识分为两种,即:有意识推理与无意识推理。
换言之,就是有意识预测与无意识预测——是的,推理就是预测未知,不仅未来充满未知,现在和过去也充满未知,所以推理可以预测——现在、过去和未来。
所以,广义的预测,就是根据已知对未知的判断——这也是解决任何问题的手段。
需要说明的是,这里的无意识是指——潜意识与下意识,它们均来自本能系统的运作。
潜意识——是本能潜在的推理预测,代表着你对环境信息的判断和情绪(来自腹内侧前额叶)。
下意识——是本能对外界刺激预设的行为反馈,代表着你对环境信息的非自控行为(来自边缘系统,尤其是其中的杏仁核)。
而从行为心理学大师——丹尼尔·卡尼曼,在**《思考,快与慢》中所说的——节能系统1与耗能系统2**——的角度来看:
- 无意识推理——属于节能系统1,类似自动驾驶模式,也就是本能预测,或称**“自下而上”的预测,也可称“热认知”**。
- 有意识推理——属于耗能系统2,类似手动驾驶模式,也就是智能预测,或称**“自上而下”的预测,也可称“冷认知”**。
那么,本能预测与智能预测的显著区别就在于,前者节能快速没感觉,后者耗能缓慢容易累。
例如,阅读文章,常用词组有错别字,或是文字顺序颠倒,都不会影响我们的阅读理解,甚至都不容易发现,因为在阅读的过程中,潜意识一直都在预测可能出现的文字组合。
例如,我们身处的周围环境,时刻都有很多运动的物体,而潜意识会按照经验中,我们所熟知的物理规律,去预测物体的运动轨迹,以至于我们都难以注意到,这些运动物体的存在。
而一旦出现预测失败——无意识就会切换到有意识,注意力对准“意外事件”,本能切换到智能,开启耗能的推理计算。
例如,面对突然高速飞向自己的皮球,我们会迅速注意到它,并试图“主动”躲避,但一般都会被击中,因为智能计算是耗能缓慢的,而有时我们却能够下意识地“被动”躲避,这是因为下意识是本能计算,它是节能快速的。
事实上,大脑无时无刻不在预测未来,以填补感官没有捕获到的模糊和空白。
例如,一段听不清的音频,听一遍清晰版本,再回去听就能够听清了;一段看不清的文字,看一遍清晰版本,再回去看就能看清了——这就是因为,人脑用预测信息填补了音频文字的空缺。
例如,电影不连贯的画面,却拥有连贯的叙事能力——这就是因为,人脑用预测信息填补了情节画面的空缺。
例如,著名科普作家——比尔·布莱森,在**《人体简史》**中,指出:
“对于每一次视觉输入,信息都要花一段微小但可感知的时间(大约200毫秒,或者1 / 5秒),顺着视神经传输到大脑当中,再由大脑进行处理和阐释。为了帮助我们更好地应对这种时间上的滞后,大脑做了一件真正非同凡响的事情,即:它不断地预测世界在1 / 5秒后的样子,并告诉我们,这就是「当下」。”
所以,毫不夸张地说,大脑一直都在进行着各种预测,甚至说没有预测,就没有判断与选择,就没法做出任何行为与动作——只不过大部预测,都是自动驾驶模式的本能预测,所以我们通常难以察觉,但刻意注意就会发现。
那么,从算法角度来看:
- 本能预测,是把先验算法**“硬编码”在神经系统中,情景(即输入信息)一旦抵达阈值,预测就会激发,但情景的反馈,无法修正这个预测,即:先验算法不可改变——如应激反应**。
- 智能预测,是把先验算法**“软编码”在神经系统中,情景(即输入信息)不仅可以激发预测,其反馈还可以修正这个预测,即:先验算法可以改变——如随机应变**。
而从时间角度来看:
- 本能预测——形成了潜意识、下意识与直觉,这是一种短期预测,时刻被动触发,如脑补。
- 智能预测——形成了思考、判断与决策,这是一种长期预测,需要主动控制,如设计规划。
可见,本能预测——就像是硬编码的**“快捷算法”,智能预测——就像是软编码的“动态算法”**。
然而在实际中,这两种预测并非是独立的,而是混合且互作用的,即:大脑预测 = 本能预测 + 智能预测。
例如,类比与溯因推理,就是本能预测与智能预测的混合计算——所以准确率不高。
例如,本能预测可以调用智能推理,所以直觉背后可以有认知逻辑(如闪念);智能预测也可以调用本能推理,所以认知背后可以有直觉引导(如洞见)。
但,本能预测是可以**“强力约束”**智能预测的。
例如,某些情景,同时激发了本能预测与智能预测,此时情景的反馈,就难以修正(本可以修正的)智能预测(因为被本能预测约束了),表现出来的就是——本能的偏差、偏见、或谬误,如:幸存者偏差、归因偏差、叙述谬误。
甚至还会出现,推理过程是智能独立的,但推理动机是被本能掌控的,这就是——动机性推理(Motivated Reasoning),即:先有了本能设定的答案,然后再寻找所需的证据,最后推理出从证据到答案的逻辑——但问题在于,这过程会忽略相反的证据与逻辑,包括刻意为之。
那么,智能预测的绝对优势就在于——动态调整与长期预测。
动态调整在于大脑的可塑性(这个后面说),而长期预测其实一种模拟,即:大脑会映射环境信息,并在颅内模拟环境信息的演化——所以,颅内模拟 = 颅内信息 + 推理预测。
事实上,模拟,是一个非常高级又非常底层的操作:用一个系统模拟系统自己就是自指(Self-Reference,非常高级),用一个系统模拟另一个系统就是计算(非常底层)——大脑意识的产生,就必须要有自指计算,而智能提供了模拟的基础。
例如,理解智能需要智能本身,这是一个自指计算,所以需要意识。
可以说,大脑一直在持续自动地构建一个——“颅内模拟的世界”,并利用感知信息作为——“模拟材料”,以及本能智能作为——“模拟工具”。
而简单的模拟是计算,复杂的模拟是预测,高级的模拟是自指——演化是随机计算,即随机(简单的模拟是)计算,它可以构造出复杂高级的预测与自指——从演化角度看,模拟就是对未来的**“超前计算”**。
更甚至,著名生物学家——理查德·道金斯,在**《自私的基因》**中,认为:
“模拟能力的演化,似乎终于导致了主观意识的产生。……意识之产生,也许是由于大脑对世界事物的模拟,已达到如此完美无缺的程度,以致把它自己的模型也包括在内。”
回到演化视角,有预测就会有误差(有误差就会有注意力),消除预测误差就会增加生存优势,于是消除误差的行为就会得到化学奖励,即:
生存优势 = 预测未来(推理) + 消除误差(行为) + 化学奖励(快感)。
可见,如果**“预测未来 + 消除误差”的能力越大,生存优势就会越大,而生存压力导致生存优势的“军备竞赛”,则促成了“预测未来”向着智能涌现**的方向演化。
例如,人类对**“盐糖脂肪和繁衍”的本能欲望,就会产生极大的预测误差**(会带来极大的内驱力),而人类智能则非常擅长消除误差(会想尽一切办法来满足欲望),以获得化学奖励。
其实,如果说大脑时刻都在预测未来,那么大脑就会时刻在试图**消除误差,**即产生某些行为的驱动力。
例如,如果你想挠痒,但手臂不动,大脑就会产生预测误差,只要你移动手臂去挠痒,就可以消除这个误差。
例如,风沙进入眼睛,就会有不适,为了消除不适,大脑就会产生预测行为,即揉眼睛,你不执行就会产生预测误差,只有执行才可以消除这个误差。
例如,某个场景下的习惯动作,如果不执行就会产生预测误差,此时会不断地下意识想要执行习惯动作,直到执行才能消除这个误差。
可以想象,本能预测产生的误差,动物可以依靠本能行为去消除,而人类可以把这个**“本能误差”转化成“智能误差”,然后依靠智能行为**去消除。
需要指出的是,误差来自现实对预测的反馈,如果行为无法消除误差,就会产生一个新的预测,新的预测会产生新的误差,新的误差会驱动新的行为——如此循环,直到误差消除,或放弃预测。
那么,本能行为——就是被本能预测(产生的感受)驱动的行为,智能行为——就是被智能预测(产生的逻辑)驱动的行为,两者可以统一(感受和逻辑统一),也可以对立(感受和逻辑对立)。
例如,本能预测到需要喝水(否则对生存不利),这就是口渴的误差,在简单情境下(如生活环境),人类和动物一样用本能行为去找水喝,但在复杂情境下(如沙漠、密室、迷宫),人类可以通过智能行为(即一系列的推理,顺着因果路径)去找水喝。
由此来看,对人类来说,所有的智能预测,其源头最终都会关联到本能预测,因为生存需求最先激发本能预测,如果处理不了才会传递给智能预测。
而在远离生存的一端,智能预测则可以专注于颅内模拟,为了单纯的(无关生存的)快乐,不断循环消除**“预测未来”的误差,从而构建出一个平行于人类世界,但关联着**现实世界的——逻辑世界。
事实上,只有可预测,才能可证伪,只有可证伪,才能算得上是科学——所以逻辑世界又支撑了科学世界,科学世界又改造了现实世界——这是一个从现实到逻辑、再从逻辑到现实,智能预测实现**“自证预言”**的故事。
而无法量化没有标准答案的,就是与科学相对的艺术世界,它由本能与智能一同构造,但似乎其中的智能只是在预测,个体不同的由本能(即化学奖励)所主导的目标设定,所以并没有统一的标准。
同理,价值观、人生观、所谓意义,都是故事世界的产物——故事是科学与艺术之外更大的世界,这里不仅没有统一的标准,甚至可以有完全相反、相冲突、相矛盾、不自洽的各种标准。
例如,赫拉利在**《今日简史》中,说道:“人类的大脑,这个盒子外面还有一个更大的盒子**,也就是充满各种虚构故事的人类社会。”
不过,艺术与逻辑是有交叉点的,那就是观察视角,即:它们的观察的重点都不是所见之物,对艺术来说——是独特视角下的不同感受,对逻辑来说——是不同视角下的独特关系。
从艺术的角度讲,摄影是一种观察的艺术,观察的重点不是所见之物,而是观察的视角和关注的重点,然后从那些日常的观察中找出趣味。
那么,就纯粹的智能预测而言,韦斯特在**《规模》中,指出:“一个基于数学或可计算的基本原理**,而构建的理论框架——这是智能最好的预测框架。”
是的,就如前文所说,大脑的预测能力是有限的,智能预测的能力不限于大脑之内,而在于消除所有预测误差之后的——逻辑世界。
在预测之外
事实上,预测只是本能算法的部分功能——所以预测能力弱,但却是智能算法的核心功能——所以预测能力强。
本能除了预测,还有诸多的控制调节功能,如新陈代谢、自我修复、呼吸心跳、昼夜节律、成长繁衍、精神情绪等等,很多都是主观意识所无法控制和难以调节的。
而智能除了预测,概括起来,可以分为两类功能:一类是支撑预测的,如抽象与计算;一类是对抗本能的,如质疑感受与控制情绪。
事实上,本能带来的负面感受,往往都是本能地**“悲观预测”,而智能对抗本能的方法,就是用积极乐观的“正面预测”,来质疑感受并控制情绪**,即:改变了思维(是智能)就改变了感受(是本能)——这是颅内模拟的**“预测博弈”**。
感觉——是对环境信息的生理反应,无思维和想象参与,有对应身体部位,如冷暖、饥饿、疼痛、瘙痒。 感受——是对环境信息的心理反应,有思维和想象参与,无对应身体部位,如恐惧、愤怒、开心、孤独。 情绪——是持续的心理状态,有持续的多种感受,可以影响思维和想象,可以抵抗环境信息的影响,维持自身的状态。
注:感受的心理反应可以被感觉到,如感觉到开心或孤独;有些生理反应可以产生心理反应,反之亦可,如紧张与痛苦。
当然,如果是强烈的本能反应,激发了强烈的电化学风暴,事已至此,智能已经无能为力,只能依靠强大的意志力——如果没有就只能服从本能的差遣了——这是来自意识的强力控制。
那么,从预测角度来看,抽象是语言的基础,抽象和语言是逻辑的基础,抽象、逻辑和计算是推理的基础,推理就是广义的预测。
如果说,逻辑是结构固有的关系,那么抽象就是找出“本质关系”的第一步(空间想象也是一种抽象),接下来有了逻辑,就可以约束四种推理(演绎、归纳、类比、溯因),而推理的具体操作,就是对信息的**“搜索、抽象、拆分、连接”,即是对信息的排列组合**,也就是计算——用一个系统模拟另一个系统就是计算(如图灵机的纸带),所以信息的排列组合就是模拟。
可见,搜索记忆空间中的**“关联信息”,就是推理至关重要的操作,显然没有“关联信息”就无法进行信息的“抽象、拆分、连接”,就无法得到“新关系”进行逻辑判断,自然也就没有推理结果**,表现出来感觉的就是——“不知道、没头绪、搞不清、不明白”,即是颅内对未来模拟的一片**“空白”**。
而搜索记忆的关键,就在于根据**“输入信息”去寻找“连接信息”,而这个过程可能会“新建连接”——想法的连接即是创新创造,“短连接”支持了演绎与归纳,“长连接”支持了类比与溯因,洞见则一定是“难连接”**,即很难连接的连接(不然很多人都会想到)。
那在大脑中,输入信息是如何去寻找连接信息的?
从生物硬件的角度来说,是神经电脉冲在神经网络结构中“运动”的传递——这其实是带电离子的浓度差,形成电化学驱动力(即扩散力与电动力的合力)驱动离子流动,从而产生电位变化的传递。
例如,一个环境信息激活了一些神经元,其电脉冲会沿着神经连接扩散传递(即同步放电),并会根据激活强度持续地传递一段时间(即幂律衰减),期间一系列的电化学反应(即电信息与化学信息)所形成的路径,就是信息的连接。
那么,输入信息既可以来自环境信息,也可以来自颅内信息,而一旦被注意力捕获,就会**“幂律连接”其它信息,这些被“点亮”**的信息,可以被注意力继续捕获,接着继续传递,然后再被捕获再传递。
通过这种方式,注意力可以不断**“链式搜索”整个记忆空间,而期间会产生各种连接信息**,如果某些连接信息符合逻辑,就可以停止搜索,并将所有的已有信息,进行**“抽象、拆分、连接”的操作,以得出推理结果**。
可以说,控制注意力,在记忆空间搜索的能力,是推理的基石,也是智能重要的组成。
当然,搜索信息的过程可能无果(包括没有满意的结果),此时就需要环境信息输入新信息,这样不仅可以带来**“新连接”,以连接本来无法连接的信息(包括直连和串联),也可以调整注意力的“搜索点”**,以防止搜索陷在记忆空间的某个局域。
例如,遇到无法解决的问题时,就需要换个环境走走、或换个事情做做,这就是在输入新信息。
例如,头脑风暴可以创意不断,就是因为头脑之间不断互相输入新信息,头脑之内不断用新信息进行信息的排列组合,再输出另一个新信息。
例如,几何证明中引入创造性的**“辅助线”,这个新信息就可以串联起**原有信息,并得到突破性的视角。
可见,大脑中的信息,并不是随时随地可以任意提取的,检索信息强依赖输入信息,因为我们只能顺着输入信息,去搜索与之关联的连接信息,所以某个信息与输入信息的连接越多或越近,就会越容易被检索到,而两个信息之间的连接越少或越远,就越难以被连接起来。
但在此,不能忽略了潜意识的计算,事实上在意识主动搜索信息的时候,潜意识也在根据输入信息进行关联信息的搜索——这会**“点亮”某些信息,以等待着注意力的捕获——为什么那些不可思议的“长连接”(创新)与“难连接”(洞见),能够突然地灵光乍现——这正是本能与智能的混合计算,也是直觉与推理**的协同配合。
那么,可以想象是,每次启动智能运作的输入信息,一定是由注意力捕获的环境信息,而在**“节能系统1”默认运作的时候,注意力其实是由本能预测控制的——也就是说,我们的行为模式大部分都是,由环境信息**刺激本能提出需求(即感觉感受上的想要),然后利用智能去实现需求。
因此,其实是环境信息,主导了大脑的预测,而预测误差主导了我们行为。
但另一方面,大脑结构会决定智能对环境信息的处理——事实上,连接就在于结构,逻辑在于结构,记忆在于结构,搜索在于结构,预测在于**“搜索到符合逻辑的连接”**也就在于结构,于是智能其实也在于结构。
大脑的结构
没有逻辑就没有智能,对于拥有智能的大脑,是如何存储逻辑的呢?
我们知道,逻辑是结构固有的关系,所以要存储逻辑,就要映射结构的关系。幸运的是,大脑演化出的神经网络,通过映射结构并抽象关系——神经结构通过环境信息映射环境结构,并抽象神经结构(颅内信息)的关系,获得环境结构的关系——实现了这个存储(环境客观)逻辑的**“硬件功能”**。
所以,逻辑就像一个中间层,在大脑中连接了智能与结构,即:逻辑源于底层的大脑结构,支撑了上层的大脑智能。
关于抽象,这里需要指出的是,映射具体的过程就是抽象,抽象具体的过程就是映射,“具体”可以不断被抽象,直到被映射成无法抽象。
换个角度来说,抽象是简化的过程,简化是映射的产物,映射是结构表征环境的方式,所以抽象是大脑的基本工作方式,只不过抽象程度会有所不同——这在于注意力对抽象的控制,也就是控制映射在不同层级(即不同尺度与角度)的重组,进而得到不同程度的抽象,包括**“抽象的抽象”**直到无法抽象。
表征——是指用信息描述某一事物的状态,即:信息符号可以代替某一事物本身。
那么,大脑是从何处来获取逻辑的呢?
粗粒度地说,就是环境信息——时刻被大脑接收的环境信息中,充满了各种结构,而通过确定结构的关系,就可以获取逻辑。
事实上,如果人类婴儿从小,就无法接触人类文明的环境信息(尤其是语言),那么长大了也不会具有人类智能(如狼孩),这就是因为没有智能的环境信息,就没有智能所需要的逻辑。
可见,大脑在最初只安装了硬编码的本能,而软编码的智能,则需要后天环境信息的训练——这即是对大脑结构的塑造。
而大脑结构与环境信息的关系,就如同——河流与河床,即:河床引导河流,河流塑造河床,河床是大脑结构(神经连接),河流是环境信息(神经电流)。
抽象来看,就是——信息塑造结构,结构引导信息。
但这并不是说,人类智能完全就取决于后天环境,而无关先天禀赋——因为先天结构,决定了环境信息的处理效率,这是无关环境信息是什么有多少的。
例如,如果抽象效率高,就可以更快地从环境信息中发现关系、获取逻辑、快速推理、建立连接,进而形成大脑结构的优势。
例如,如果存储效率高,则可以更快地形成大脑结构的优势,而大脑结构的优势,会正反馈地增强自身,最终形成压倒性的智能优势。
所以说,大脑结构(人类智能) = 先天结构(神经运作) + 后天结构(环境信息),即:
- 先天结构(神经运作)——决定了**流体智力,**取决于基因,如记忆力和算力,随衰老减退;
- 后天结构(环境信息)——决定了**晶体智力,**取决于学习,如技能和技艺,不受衰老影响;
- 大脑结构(人类智能)——决定了流体智力与晶体智力,取决于基因和学习,如推理力和理解力,受衰老和积累共同影响。
换言之,流体智力依赖神经运作——只会不断变弱,如:感知力和反应力;晶体智力依赖环境信息——可以不断变强,如:联想力和判断力;而想象力、创造力、直觉力、洞察力等——则是流体智力与晶体智力(按照某个比例)的混合。
另外,注意力与专注力比较特别:它们受环境信息的影响(如引导与干扰),也通过环境信息的积累和训练而变强(如学识成长和正念冥想),既在底层支撑了人类智能(包括流体智力与晶体智力),也会随着人类智能的增长而增长(即流体智力决定基础,晶体智力决定增长)——可以说,它们就是人类智能的重要基石。
而它们的区别在于:动物也有注意力,但只有人类才有专注力,因为专注力是意识对注意力主动强力的控制。
综上可见,人和人在智能上最大的不同,其实就是颅内大脑结构的不同,这是**“生物硬件”**的不同。
智能的运作
从结构角度来看,智能是如何运作的呢?
首先,结构与连接。
神经网络的基本结构,就是神经元及其连接,神经元的激活就是对信息的处理,而激活状态的电脉冲,只能顺着连接传递,而不能跳转——准确地说是不能没有连接路径,直接激活神经网络中的某个神经元。
这也就是为什么,我们只能从一个信息,联想到另一个信息——这个信息之间的关联性,其实是神经网络的**“硬件连接”**——宏观上,就是我们想法,只能在相关事物之间联想,事物之间没有任何关联路径,我们就无法联想到。
例如,如果我们忘记了某事,想要想起来,一般都是从记得的就近事件开始,一件件回想关联的事件,有时就能恍然想到。
例如,初到一个陌生的地方,很难有全局的道路记忆,但可以通过每一个道路的地标,回想起附近的道路记忆。
可是,平时我们经常会有,与当前所见所闻完全不相关的想法,以及突然冒出来完全脱离现实天马行动的想法,这是怎么回事呢?
原因就在于,环境信息充当了一个**“搜索点”,一个信息通过感官(如视觉、听觉、触觉、嗅觉、味觉)进入神经网络的瞬间,就会定位到记忆空间中的相似信息,接着注意力就可以在这个“位置”对周围的连接信息进行“搜索”**。
例如,尝试回忆“初恋吵架”,接着回忆“好友吃饭”,这两个输入信息,会引导注意力在记忆空间中,搜索到大量不同的连接信息。
事实上,只要我们刻意觉察,就可以发现每一个念头和想法的**“启发来源”,甚至一直追溯就可以发现一条连绵不绝的“信息路径”**,直通到我们的记忆深处,并一路都关联着我们动机与欲望。
那么,感官信息是如何在颅内定位到**“搜索点”**的呢?
答案就在于,任何信息进入神经网络,都会以特定的模式——包括强度和时间——激活特定范围内的神经元,形成**“路径结构”,所以相同的信息,可以激活相同范围内的神经元,即拥有相同的“路径结构”**——类比程序算法来看,这是哈希查找(定位时间与已有信息量无关),而不是枚举查找(定位时间与已有信息量正比)。
据此,同样一个信息(如“元宇宙”),在每个人大脑中存储的位置和连接信息,都不尽相同。
当然,这种信息定位可以有很强的**“模糊性”**,即“路径结构”的相似性,如:
- 输入信息精确,定位信息精确——这带来想起;
- 输入信息精确,定位信息模糊——这带来联想;
- 输入信息模糊,定位信息精确——这带来识别;
- 输入信息模糊,定位信息模糊——这带来想象。
例如,方言就是一种模糊输入,可以被精确识别;象征主义绘画就是一种精确输入,可以被模糊联想;天空的云朵、远处的巨石像什么,就是一种模糊输入,可以被模糊想象。
而这种**“模糊性”**产生的“衰减连接”,也会被记忆——所以联想可以成为记忆,想象可以创造记忆。
例如,一个信息在不同情景之下,会让你有不同的联想,但一旦在某个情景之下,产生了特定联想,这个信息与联想就会建立连接,下次再看到这个信息,不论在什么情景之下,这个特定联想就又会回想起来——直到这个信息被新的联想**“覆盖”或“扩充”**。
在此,别忘了环境信息进入神经网络,也可能被潜意识捕获——这些被潜意识**“点亮”的孤立神经结构,在“熄灭”**之前都可以被注意力的捕获,以产生意想不到的思考与洞察。
其次,注意力与结构。
要知道,大脑所有的功能,都存在于神经网络之中,那么注意力这个功能,也必然存在于神经网络之中。
事实上,智能只能在注意力的基础之上才能运作,即:集中注意力才能对信息进行**“搜索、抽象、拆分、连接”**的操作。
换言之,有智能一定有注意力,但有注意力可以没有智能——因为智能需要注意力输入信息,而注意力获取的信息可以不输入智能(如被本能处理)。
而注意力关注到某个信息,一定是注意力的神经结构,连接到了某个信息对应的神经结构,即:只有连接才有注意。
那么,注意力连接到某个信息的方式,就会有两种形式:
- 第一,由注意力主动搜索某个信息,这是“自上而下”,对应智能预测。
- 第二,由某个信息主动获得注意力,这是“自下而上”,对应本能预测。
例如,让你回忆童年打架,你会根据**“打架”和“童年”这两个输入信息,去记忆空间搜索相关信息,这就是自上而下的“注意力连接”;而如果你看到两个小孩打架,联想到了自己的童年打架**,这就是自下而上的“注意力连接”。
同理,潜意识**“点亮”的信息,如果自下而上主动获得了你的注意力,就可以被你注意到,即:“潜信息”**与注意力建立起了连接。
可是,这些颅内**“潜信息”是如何连接到注意力**的呢?
答案,可能在于两方面:
其一,是颅内评估系统,它是一个**“本能黑盒”,能够对输入信息进行趋利避害**的判断,然后引导注意力的关注。
换言之,输入信息会被评估系统判定为——奖励信息或惩罚信息,然后评估系统(也是神经网络的一部分)会连接注意力网络与潜信息网络——此时我们通常会感受到,“想要”或“恐惧”的本能感受,并且这种感受,往往会先于注意力的切换。
例如,在人群中出现了美女或帅哥,我们会先感觉到**“想要”,然后才会注意到;同理,在黑暗中出现了快速移动的脚步声,我们会先感觉到“恐惧”**,然后才会注意到。
其二,是颅内随机连接,简单说就是注意力随机连接到了潜信息。
具体来说,是输入信息不断**“点亮”颅内潜信息,同时注意力不断在连接信息之间“游走”**,两者会有一定概率,随机就连接上了。
事实上,每个信息从**“点亮”到“熄灭”,都有毫秒级不等的时间,其“结构范围”也有大有小,这让注意力对潜信息**的捕获,充满了不确定性——所以,闪念神出鬼没、灵感神秘莫测。
也因此,两个信息**“点亮”间隔时间较短(即一前一后发生),本能(即潜意识)就会觉得它们之间具有因果关系**,但大部分是没有关系或相关关系,只有智能才能进行准确的推理判断。
然而,还有一种相反的情况,即在注意力高度集中进行思考推理的时候,我们就会忽略大量环境信息,只专注于颅内模拟——此时注意力牢牢地被意识所控制主导,所以评估系统与随机连接就难以再引导切换——甚至意识还可以对抗评价系统的干扰,即:无视环境给予的奖励或惩罚信息。
那么,对于注意力的主动搜索,会涉及到三种记忆,即:瞬时记忆(感觉记忆)、短期记忆(工作记忆)、长期记忆。
这三种记忆,又称**“外显记忆”,还有第四种记忆是注意力无法搜索的,即:肌肉记忆,又称“内隐记忆”**,它存储在本能系统之中,所以智能检索不到。
如前所述,注意力搜索三种记忆,就是注意力网络与记忆网络建立脉冲连接的过程——这需要环境信息的**“关键词”引导,然后一步步从一个信息联想到另一个连接信息,所以我们的主动回忆是耗能缓慢**的。
在此,我们可以大胆地猜测:注意力网络必须通过瞬时记忆,才能够连接到短期记忆与长期记忆——换言之,注意力只能关注到瞬时记忆,而短期与长期记忆要与瞬时记忆连接,才能够被注意力提取。
因此,瞬时记忆就像是一个**“临时缓冲区”**,所以很容易被忘记。
更进一步来看,瞬时记忆就是存在于注意力网络之中的,所以注意力总是通过瞬时记忆来连接**“外部网络”——溯因推理可得:瞬时记忆就是注意力网络的“对外连接”**。
我们都知道,人脑的瞬时记忆只有57个**“字符”**,但应该说是57个**“连接”,即:注意力网络连接到“外部网络”**的路径。
也就是说,注意力每关注到一个信息,就需要一个**“连接”——从注意力网络到信息所对应的神经结构之间产生一个“脉冲连接”。**
例如,一串6位随机数字,我们默默记住较难,但如果念出一遍,就可以快速记住,这就是因为**“念出**”的操作,让语言网络与注意力网络建立了连接——可以测试一下,文字记忆和语言记忆,是两种不同的**“提取感觉”,显然语言的肌肉记忆**参与较多。
也因此,当注意力关注到其它信息的时候,就需要新建一个连接,当连接数超过上限时,就需要覆盖原有的一个连接,并且注意力焦点一次只能关注一个连接。
可见,瞬时记忆的遗忘,其实是连接的被**“占用”,而连接到的信息——存在于短期或长期记忆之中——既可以是一个字符(如π),也可以是一个“指针”,指向一组关联的字符(如3.1415926或出生年月日),甚至指向任意一个“记忆片段”**,如图像、概念、感受。
例如,超过7位的长字符串,我们通常会把号码分组,这样一组只占用一个连接,就可以增加记忆字符串的长度。
例如,我们可以体验一下,当注意力关注到某物的时候,我们就已经连接到了某物的记忆信息,此时就可以主动搜索某物的连接信息(如价格、来源、功能),接着切换注意力焦点,我们就会连接到了另一个记忆信息,然后尝试连续切换注意力焦点,每次都进行一些搜索回忆,那么在5~7次之后,我们可能就忘记了其中的一些连接,进而忘记我们关注过的某物。
需要指出的是,这个**“指针”是可以进行信息嵌套的,即:一个“指针”指向的记忆片段,可以嵌入另一个“指针”指向另一个记忆片段,以此类推,就可以形成一个“记忆链表”**。
例如,我们提取身份证号码的记忆,先是连接到“身份证”,接着从“身份证”按顺序一个个连接到“地区号”、“生日号”、“末尾号”,然后“生日号”又可以按顺序一个个连接到“年”、“月”、“日”等等,其中每一个连接都是一串字符整体读取,并且当注意力读取某个连接信息的时候,其它连接是被忽略的。
当然,别忘了连接从**“点亮”到“熄灭”需要时间,只要没有完全“熄灭”**,就会容易被再次连接起来。
例如,我们可以双手握住两个冰块,不要松手,坚持一段时间,冰冻感会刺激本能,剥夺所有的注意力,但不要松手,当注意力全部集中在冰块与痛感之上的时候,瞬时记忆之前的连接也就会全部切换,即:我们会清空之前的想法和感受,包括所有的思考和思路、烦恼和开心。
事实上,如果我们能有更多的短期记忆(工作记忆),就能够同时进行更多的连接(如7~10个连接,就像计算机能有更大的寄存器),这样就可以为智能运作提供更多的信息(如记忆更多推理步骤),从而就会拥有更高的智力水平。
但这个连接数,可能是来自基因的编码,很难通过训练提高,不过仍有两种方法,可以绕过连接数直接提高短期记忆的信息量,即:
- 第一,要记忆更抽象压缩、更相互关联的信息,这样每个连接都会带来更多的信息。
- 第二,要不断强化关键信息(二八原理),这样关键信息就可以被**“点亮”**更长时间。
接下来,再给出一个更加高级的,使用注意力进行启发式搜索的过程:
当我们需要一个词语,来描述某个情景的时候,大脑会下意识地根据**“关键词”,随机地从记忆中定位到很多画面,而每个画面都关联着很多信息**,并且这些信息能够让人体验到不同的感觉,这些感觉会在很短的时间内被体验评估,接着按照体验强度这些画面会被排序,于此同时,注意力在感觉感受的引导下,捕获到排序靠前的画面时,就会提取与画面有关联的信息,最后这些信息对应连接的词语,就是出现在脑海里的搜索结果。
启发式(Heuristic)——是把一个熟悉的规则应用在不同的问题上,从而得到快速轻松的处理方式,而如何想到规则的迁移,就是一种启发。那么感觉感受的强度,就是一种本能的快速排序规则。
可见,启发式搜索是非常依赖本能评估系统(以及记忆信息)的,而注意力关注到的信息,也会不断进入评估系统**“反复计算”,这会导致“评估排序”不断变化,这又会不断改变注意力关注到的信息,所以这是一个充满随机性与不确定性的相互作用的过程——而这就是大脑里的“搜索”,或说是“大脑搜索引擎”**的使用方式。
那么,如果想要记住转瞬即逝的信息(如闪念与灵感),我们就需要将瞬时记忆,与更牢固的记忆**“手动”建立一次脉冲连接**。
也就是说,要记住信息,就要把信息挂载到**“记忆树”**上(就像砌入“记忆宫殿”)——如把数字与节日或生日关联,把事件与强烈的感觉关联,把关键词与人生经验关联。
例如,为什么理解一个事物就能够记住?——因为理解,是用熟悉的事物去映射连接陌生的事物;为什么解释一个词语要用一段话?——因为这样,就可以在熟悉与陌生之间建立更多连接。
不过更简单,但效果略差的方法是,“不连接”仅多产生几次相同的神经电脉冲也行**,**如默念三遍。
最后,环境信息与结构。
环境信息会在大脑中,不断**“点亮”不同规模的结构,从“点亮”到=>“连接”再到=>“熄灭”的过程,就会带来结构的量变,不断积累量变就会产生质变,不断质变就会塑造出天壤云泥之别的结构差异**。
可以说,经验的不同、知识的不同、技能的不同、技艺的不同,都是大脑硬件结构的不同——甚至连基因结构的不同,也是远古时代环境信息所带来的选择压力的不同。
那么,人类智能的不同呢?
如前所述,人类智能的基本操作,就是对信息的排列组合,没有排列组合就没有新结构与新信息,也就没有新关系与新逻辑,也就不会有推理与预测。
事实上,排列组合具有**“从简单涌现出复杂”的强大力量——试想音节的排列组合产生语言**(带来交流),形状的排列组合产生文字(带来记录),语言与文字的排列组合产生信息(带来叙事),信息的排列组合产生智能(带来预测),等等。
以及排列组合,可以不断在当前的排列组合之上进行排列组合,并重复这个过程,从而形成可积累的量变迭代,最终这条迭代路径就会通向质变的结果。
例如,因为那个想到这个,因为这个想到那个,每一步的排列都依赖上一步的组合,一步步不断迭代,就会得到无法想象、不可思议、惊为天人,起初不曾预料的结果——这一切都只需要从最简单的排列组合开始即可。
而人类智能的特别之处,就是能够在大脑结构中,构建一棵由逻辑连接而成的**“因果树”,也只有把环境信息**(通过排列组合)挂载到这棵**“因果树”之上,形成认知模型**(即局部因果结构),才能有效地推理未知与预测未来——以获得生存的优势与先机。
由此来看,人类智能就是使用感官输入,来发现周围的结构,从而创造出对环境的表征,即:一颗**“因果树”**。
当然,颅内的**“记忆树”,除了包含“因果树”,还有“非因果树”,但只要输入足够多的信息,在理想情况下,所有的信息都会连成一棵完整的“因果树”**——因为逻辑是结构固有的关系,因果是关系之间的相互作用。
大脑的信息
记忆是存取信息,学习是建模信息,理解是融合信息,创新是连接信息(必须有路径),创造是组合信息(可以没路径)。
可以说,人脑的一切价值,都在于其中的信息,人脑的一切智能,都在于信息的处理,而颅内信息的源头,一定是来自于环境。
那么,环境信息与颅内信息的连接整合,其实是一个连续不断的过程,巧妙如下:
我们只能从一个信息,联想到另一个信息,通过控制注意力,就可以在颅内信息中四处游走,而环境信息的输入,指引了注意力的游走方向,于是我们可以一边存储环境信息,一边以环境信息为锚点,在颅内信息中随机跳跃,这样新旧信息就会不断(随机)连接起来,形成一个连通的**“信息网络”**。
例如,跨界通才富兰克林,就曾说过:“我的大部分知识,都是这样获得的,即在寻找某个资料时,意外地看到了另外的资料。”
当然,颅内信息从来不是静止的,它(也就是记忆)会根据我们的经历和体验,不断地强化、更新、修改、覆盖、连接——这也是新旧信息之间相互作用的必然结果。
事实上,颅内信息的动态性,会超乎我们想象,因为连续不断的感官信息(如光影、颜色、形状、振动、气味),会不断**“点亮”我们的信息网络(包括潜意识的操作),这意味着跟随注意力的“轨迹”**,新旧信息的交互在时刻进行着。
由此可见,颅内信息虽然来自于环境,但任何一个信息一旦进入大脑,就不会孤立存在,而一定会被连接扩展——这就是排列组合的创造(或编造),即:本能的创造是脑补,智能的创造是预测。
但同样是颅内创造,这里会有一个不对称的心理学现象,即是对于智能预测——我们会自我怀疑(表现为客观),可对于本能脑补——我们会全然相信(表现为偏见)。
例如,只看标签简介、或只看头像昵称,大脑就会脑补出一个形象,并赋予一个身份——一个信息进入大脑,一定会被连接扩展和丰富细化,但这大多都是虚幻的颅内模拟——而你赋予一个脑补形象什么样的特质,就将会直接真实地影响,你对这个信息的接受程度。
或许,耗能预测比节能脑补多出了注意力对信息的**“审查监督”——但脑补的效力,是有时哪怕你知道这段信息是脑补的,也不影响你对它的相信——或许在大脑中,本能的决策优先级**就是高于智能,这是基因的偏好。
例如,我们可以智能地——搜索记忆,但却控制不住本能地——触忆生情。
例如,看到某些人在某些情况下的强烈行为,你会深深地觉得——本能算法编写的代码真是够强,不仅优先级强、驱动力强、执行力也强!
那么,从演化角度来看,对于环境信息的**“冗余记忆”要比“节能遗忘”**,更具有生存优势。
例如,为什么我们能够记住那么多,去过的地方,见过的面孔,吃过的食物,甚至有些经历,体验过一次就会终生难忘?难道这不占用大脑有限的内存资源吗?——显然,对于我们的祖先来说,记住比忘记更有利于生存。
但为啥数学公式,就记不住还忘得快?这可能就要区分,有利生存与无关生存两种信息了——那什么叫有利生存的信息?——可能有两方面,一方面在于本能算法的判定(如繁衍需要),一方面在于是否经常使用(如工作需要)。
而换个角度来看,颅内大量的冗余信息,也为智能的运作提供了足够的支撑——因为信息越多,可以排列组合的**“素材”也就越多,而遥远信息的连接——就是创新创造**,就是类比溯因。
例如,如果我们回到记忆之中,不断重播记忆的信息流,就能够发现更多的细节信息,接着尝试进行更多的排列组合,就可能会得到更多的感受、理解和观点——或许这就是,在有限已知的情况下,反复思考同一个问题,就能得到答案的原因所在。
至此试想,我们真的会遗忘一个**“信息”吗?为什么那些我们以为忘记的事情,只要一个“关键词”**提示,就能够全部回想起来?——遗忘是彻底擦除信息(永久失忆),忘记是无法提取信息(暂时失忆)。
例如,小时候的记忆,仿佛一直就沉睡在记忆深处,平时不会想起似乎已经忘记,但某个瞬间,一个环境信息的触发调用——我们就会突然想起小时候,以及关联的点点滴滴。
例如,做梦有时候可以唤醒我们,原以为自己早已遗忘的**“成吨”**的过往与感受。
是的,一个**“关键词”,就可以(或主动或被动地)对我们的颅内信息进行一次“搜索调用”**。
这个**“关键词”,可以是任何感官信息,但容易被忽略的是,同样的光影、颜色、形状、振动、气味,可以带给不同人相似的感受,也可以是完全不一样的感受——这是每个大脑内的“独立搜索”**。
那么,一个**“关键词”可以连接多少信息——落日、云彩、海边、细沙、漫步——每个人都可以搜索到相同或不同的数以千百**的连接信息。
而据此,一个信息在颅内提取不出来,就可以尝试从不同的角度,来提供不同的输入信息,以增加激活相同信息的概率——因为一个信息在颅内的“存储结构”(即神经结构),具有广泛的关联性,即不同角度的输入信息都有可能与之连接——这与记忆存储和回忆提取时,信息连接的激活和强化有关。
例如,为什么会出现,人们不知道自己想要什么,直到看到它为止?——这就是输入信息对颅内信息,进行随机地搜索调用,直到激活了自己未曾想到的(即自己无法主动激活的)**“想要”**情绪。
反向可见,我们汲取信息的时候,如果将相同的信息,与更多不同的信息一起连接存入,就将会更容易记住和想起——如:在不同的场景多次看相同的信息,在不同的载体多次看相同的信息,在不同的上下文多次看相同的信息。
所以,回到遗忘,连接数的减少,就会增加**“搜索”的难度——因为在“关键词”**的周围都无法找到连接路径——但只有所有的连接都全部消失,才算是真正的遗忘——否则,只是无法想起并未真正忘记——所以不去想起可能从未忘记。
事实上,信息在大脑中的载体,就是神经结构,信息的排列组合,就是神经结构动态的脉冲连接——也就是说,信息是生长在大脑里的,生长不容易,消亡也不容易。
可见,大脑中的信息,有存储和提取两个维度——并且一旦存储就很难遗忘,无法提取只是暂时忘记,还可以被**“关键词”激活想起,而每次提取动作,都可以强化两者的激活强度**,即让信息更难遗忘和更易想起。
但有一点是始终不变的,即:给大脑信息,它才能给你答案,给它大量信息,它才能给你满意的答案——而一旦拥有了足够多的信息,那么人类智能,就将会拥有**“用复杂性模拟复杂性”**的非线性的无限可能。
复杂性——是指非线性的变化关系存在涌现现象,这由于积累正反馈的量变,产生局部之和大于整体的质变(如1 + 1 > 2),所以无法用局部来认识和预测整体,而复杂系统一般都存在复杂性。
是的,复杂性正是这个世界最根本的东西,因为它根植于连接又涌现于连接,唯有信息可以消除连接的不确定性,从而降低连接的复杂性。
不过,对于不同的信息,显然有不同的价值,即信息量越大信息的价值就越大,而没有信息量或降低信息量的信息就是噪声。
所以,给予大脑的信息,最好都是有价值的信息,而不是各种**“噪声”**,那么有价值的信息,其获取过程往往都是有代价的。
对此,赫拉利在**《今日简史》**中,就洞见到:
“如果你想得到可靠的信息,必然要付出昂贵的代价。如果你总是免费得到信息,有可能你才是整个商业世界的产品。”
但换个角度来看,复杂性带来的不确定性,却蕴含着可能性,并且复杂性越高可能性就越多,而无限的复杂性就拥有无限的可能性——这就是一切可能的来源,信息则通过消除可能,创造了一切。
最后,需要强调的是,大脑的信息——就是源自复杂网络结构的复杂动态连接。
可塑性学习
大脑有可塑性才有学习,有学习才有逻辑,有逻辑才有智能——那到底什么才是可塑性呢?
简单来说,就是大脑的结构可以动态改变。
具体一些,就是神经元不仅能够接受和发出信息,还能根据接收到的信息,来动态调整发出信息的强度。
更进一步,如果神经元反复收到很强的信息,那么发出的信息就会变强(即连接产生并增加);如果反复收到很弱的信息,或根本收不到信息,那么发出的信息就会变弱(即连接减少至消失)。
而如果发出很强的信息,却收到了很弱的信息,或发出很弱的信息,却收到了很强的信息——这就是神经元层面的预测误差,即:信息的历史强弱与实际反馈不同。
顺便一提,这个信息收发的功能基础,就是神经元的自身结构及电化学反应,而最终调控这一切的,就是神经元里的基因表达。
所以,神经元改变连接数量,使得大脑神经网络能不断针对外部世界,调整自己的连接路径,就是神经可塑性。
那么,可塑性如何支撑学习?
概括来说,就是通过神经连接的改变,来实现记忆和推理——记忆是信息与结构相互映射,推理是从结构抽象关系——结果是存储逻辑,形成模型,以供决策。
注意,没有选择依然可以决策,决策产生行为,行为不一定对应选择,选择是一种行为,不选择的行为可以是为了**“延迟选择”。**
显然,“逻辑、模型、决策、行为”是对生存至关重要的能力,所以神经可塑性,就是漫长生存演化过程中的必然产物,即学习能力。
由此可见,学习 = 记忆 + 推理 ,只有记忆没有推理,就没有逻辑,也不会有智能——复制粘贴,何来智能?值得指出的是:
- 机器学习 = 迭代 + 测试。
- 演化学习 = 突变 + 选择。
- 人类学习 = 记忆 + 推理。
当然,记忆包含了获取试错的反馈信息,推理包含了根据试错的校准过程,但不试错也可以学习,只不过是没有经过验证的学习,这种学习不一定是无效的——因人而异(如特斯拉的颅内模拟)、因景而异(如确定知识的学习,包括别人的试错的结果)、因事而异(如满足演绎推理的条件)。
事实上,婴儿是神经可塑性的巨星,一个婴儿的大脑并不知道自己将来——要成为什么样的人物、做成什么样的事情、取得什么样的成果,但他的大脑为所有的可能性都做好了准备,也就是说,他的大脑在未来可以——成为任何人物、做成任何事情、取得任何成果**。**
而由可塑性来看,学习会有以下六个有趣的特点:
第一,练习。
反复输入相同信息,就会加强这个信息的记忆强度,因为相关神经元会被反复激活,即提取一次即是存储一次,所以回忆(及推理)也可以强化记忆(推理需要使用记忆)。
可见,我们可以通过**“频繁提取”**的刻意操作,来加强神经网络的连接强度。
第二,复习。
同样的信息,每间隔一段时间复习一遍,总会有新的收获——这是因为颅内信息的积累,导致了对相同信息的连接,产生了不同的排列组合,即:新理解的新信息。
当然,就算在没有积累更多信息的情况下,复习也可能发现更多,以前没有注意到的细节,以及**“随机连接”带来的意外的联想与洞察**。
第三,遗忘。
当理解掌握一个信息的时候,这个信息就已经生长在了大脑里,“真正遗忘”需要超乎想象的时间,而“表面遗忘”只是无法主动提取,但它仍在那里可以被潜意识所利用,并会成为大脑思维决策的一部分。
所以,看过的学过的可以记不起想不起——尤其是看完一本书会**“忘记”**大部分细节内容——但重要的是,学习过程塑造了大脑结构(即模型),从而深远地影响了大脑未来的演化方向(即决策)。
第四,解释。
将学过的信息用自己的语言解释一遍,即**“解释性学习”(类似“费曼技巧”),将会事半功倍——因为解释的过程是一种理解,这会让信息对应的神经元之间形成广泛的连接,同时语言表述的过程,会让“相关连接”**被激活和强化。
第五,体验。
有些信息可以通过阅读学习——如数理逻辑,但有些信息只能通过体验才能学习——如游泳和恋爱,因为后者需要很多肌肉记忆参与,其运动反馈信息,只有在运动过程中才会存入肌肉记忆。
另一个层面,体验性的知识,传递了大量的细节信息,这些信息不仅提供了丰富的逻辑和关联,还蕴含着稀有的启示和洞见——所以有句话叫作,真正的知识,是只有做了才知道的信息,真正的技能,是只有在做的过程中积累的技巧。
第六,思考。
复杂信息无法通过被告知而记住,只有经过理解思考才能记住——因为复杂信息对应着复杂结构,甚至是全新的结构,而深度思考的感觉,就是是神经元**“生长”**的感觉。
综上可见,不得不说,可塑性是人类智能的“硬件支撑”,然而可塑性并非是一直**“可塑”**。
的确,最初的大脑可塑性很强(如流沙),环境信息会很容易塑造大脑的结构,但随着大脑结构的复杂性增大(如树杈),结构对环境信息的筛选过滤就会变强,这意味着信息对结构的改变难度也会增加,即可塑性的降低。
显然,信息都被筛选过滤了,自然就无法塑造结构了——那为什么结构越复杂,筛选过滤就会越强呢?
因为结构越复杂,连接就越多,这样好处在于——存储信息多(信息产生点多)、记忆效率高(信息挂载点多)、遗忘概率小(信息提取点多),而坏处就在于——这会带来**“结构僵化”**。
要知道,一个信息对应的神经连接越多,就越容易被激活,它就越容易出现在我们的脑海中,我们就越认可这个信息——就像我们从小就被反复灌输的信息,周围人都在谈论并一致认可的信息——哪怕我们没有亲自验证,也会非常确信这个信息,这是符合**“脑见为实”**的演化策略的。
例如,洗脑的重要手段,就是重复、重复、再重复——这满足了大脑天生使用的**“可得性启发法”**(Availability Heuristic)来判断信息可信度的偏好,即:重复带来熟悉,熟悉带来容易想起,结果就会让人更相信。
而从另一个角度来看,一个信息我们越是确信它,就越会依赖它去判断其它信息,接着相互依赖的信息就会形成**“认知模型”,显然我们的本能,天生就要求我们相信和维护模型**,且不能轻易随便地否定模型——那么复杂结构对应的庞大连接,则可能蕴含着更多难以被改变的模型,这可谓是**“模型僵化”**。
于是,环境信息中,那些符合我们模型的信息,就会很容易被接受,不符合的信息就会被排斥或忽略(如证实偏差、选择性遗忘等)——结果就是大脑结构的难以改变。
而从另一个方面来看,如果要接受不符合模型的信息,要么就要修改模型,要么就要容忍模型的不一致性,也就是,宏观上大脑认知的不一致性,微观上大脑结构的不一致性,逻辑上事物关系的矛盾性。
显然,后者是客观上无法存在的,接受即意味着被演化所淘汰,所以本能会以负面感受来排斥模型不一致,即:触发一种令人难受的**“误差感”**,让人想要尽快消除或逃避。
需要指出的是,大脑结构的不一致性,可能代表着如下图像:
在神经通路(Neural Pathway)上出现了不同连接之间的冲突——有些兴奋(如产生矛盾),有些抑制(如不接受矛盾)——结果就是预测误差,并且冲突越强烈(如必然得到这个信息,但就是不接受这个信息)——预测误差就越大,而消除误差的方法,就是调整通路上连接路径的激活,即接受或否定某些信息——当然,放弃整条通路的激活,即转移注意力不去思考,也是可以的。
那么,能否就接受不符信息,并修改模型呢?
答案是可以的,这意味着我们需要修改模型中与新信息不符的信息。
对此,从可塑性角度来说,大脑并不需要清除**“旧信息”,而是需要建立“新连接”,以承载“新信息”**。
例如,曾经我们确信**“一日三餐”是健康饮食,但现在我们接受“间歇性断食”才是健康饮食,而我们并不需要将“一日三餐”的相关信息从大脑中删除,只是增加了“间歇性断食”**的相关信息。
那如何才能增加这个相关信息呢?
这就需要提供**“新连接”,即输入信息:我们的祖先基因更适应间歇性断食——对,这是一个“因果证据”,并且这个证据让我们觉得越强力,即表示我们的大脑越能够建立“新连接”,也就是我们越容易接受“新信息”**。
可以想象,如果证据足够强力,都可以让人否定自己清晰在目的记忆,相信自己经历了**“盗梦空间”,所有无比确信的记忆都是幻觉——尽管这些记忆的“连接”还在颅内,但否定它们的“新连接”**已经建立。
相反,如果无法接受或理解**“因果证据”,那么“新连接”就不会产生,就不会接受“新信息”——在此不要忽略了,“旧连接”的连接越多越强,就越容易越试图否定“新连接”**。
而一旦接受了**“新信息”,在面对饮食决策的时候,我们就有两条路径可选——“一日三餐”与“间歇性断食”——并且现在,我们的认知模型**会选择后者。
可见,这里出现了一个**“死锁”,即:模型会阻碍可塑性**,而修改模型需要可塑性。
事实上,除了强力证据,我们很难改变我们的模型,而真实世界充满了没有对错或证据不足的价值观判断——因此,大脑会因为积累越来越多的**“自我价值模型”**,而越来越没有可塑性。
由此来看,大脑是先由信息塑造结构(如培养兴趣),再由结构选择信息(如追求兴趣),最后由结构所接受的信息,来决定大脑的演化方向(如实现兴趣)。
而这也是为什么,会有**“先入为主”、“思维定势”、“积重难返”**等现象的原因所在。
所以,有些悲观地说,随着大脑的成熟和训练,变得更加专业化和有效率,以执行复杂的功能和任务,但也因此变得不那么灵活,并随着时间越来越难以改变,年长者发展出了有偏好、偏见、偏差、偏误的观点,因为他们更多地积累信息了解世界,形成了更多的**“自我价值模型”,这阻碍了他们基于更少的信息,来形成具有创新假设和创造关联的能力,即:模型阻碍了新连接与新信息**——尤其是遥远的连接与新奇的信息。
需要说明的是,颅内信息之间距离,取决于神经连接之间的**“硬件距离”**,也就是说,同样的信息在不同人的大脑中,其存储距离并不相同,并且其可以连接的信息,也不相同。
显然,颅内模型越多,大脑结构就越复杂,那么信息之间的距离就会越远,同时信息可连接的分支也会越多,这就会影响到信息排列组合的“自由度”,即:信息更容易和固定、就近、一定范围内的信息产生连接,而更多的连接分支,(在耗能层面)也会限制更远的连接距离。
例如,小孩容易将不相关的事物联系在一起,因为他们的颅内模型少(信息的相对距离近),信息的连接更自由(神经电脉冲更随机);相反,成人的颅内模型多(信息的相对距离远),信息的连接会受到模型的约束(神经电脉冲更有序)。
换言之,你知道的越多,你就越依赖于你知道的东西(如你有锤子看什么都像钉子),而对新的东西则不能保持一个开放的态度(如力证自己否定别人),即:越专业个性的大脑就越难以改变。
但,真的是这样吗?
如前所述,大脑不可塑的表现,往往是因为对自身模型的偏爱,而在强力证据面前,是可以建立**“新连接”**并接受新信息的,不过有两种情况除外:
第一种,是需要建立大量**“新连接”**,完全超出了现有结构的连接能力,如成年学外语或学10门外语。
这里需要指出的是,复杂结构的庞大连接——是具有强大模型迁移能力的,也就是说,“新连接”可以从“旧连接”中排列组合而来,并不需要从0开始生长,因为很多概念和模式是可以在更底层的映射层级上**“共用连接”**的。
例如,柠檬、柠檬茶、柠檬炸弹(一种柠檬的吃法)、柠檬问题(经济学上的柠檬原理)是共用**“柠檬”这个连接的——换言之,大脑可以通过激活“柠檬”**连接到与之有关的诸多概念。
第二种,是无论有多强力的证据,也都无法改变某些人的模型,甚至他们宁愿选择心理崩溃或认知失调,也无法重塑大脑结构。
认知失调(Cognitive Dissonance)——是指一个人的行为或想法,与之前正面积极的自我认知,相矛盾不一致,即要么否定现在的行为或想法、要么否定过去的自我认知,从而产生不舒适不愉快的负面情绪。
这种情况,常常是因为长期不学习训练,形成了大脑生理性的**“硬件僵化”,即:神经元的基因表达已经适应了维持现状,而不是生长连接。此时,神经系统已经从“硬件层面”不再具有可塑性。所以,无视强力证据**,其实是无法建立理解证据的**“新连接”,而不是对自身模型的“绝对忠诚”**。
由此可见,大脑的可塑性其实包含了**“是否需要可塑”的内涵,也就是说,学习压力可以加强可塑性,无学习压力则可以减弱可塑性,直至不再可塑——这就像是神经可塑性**的规模放大。
事实上,大脑的可塑性是一生都可以存在的,对应到人就是一生都可以学习、调整、成长、转变的——关键是,环境信息是否可以一直不断激发,大脑可塑性基因表达的适应性潜能。
那么,从宏观角度来说,一个人的习惯,就是其大脑神经回路的外在表现,而打破旧习惯、养成新习惯,就是大脑可塑性的外在体现。
所以,如果你想要改变某个习惯,就需要一定的毅力来生长出新的神经通路,以支撑新的行为选择,但只要你能够坚持地足够久,这个坚持的环境信息,早晚会迫使你的大脑明白你的意图,然后以可塑性的形式来满足你的要求,而你的大脑一旦在硬件结构上长出了新的神经通路,你就不再需要毅力与坚持,因为一切都将会变得简单、轻松和自动。
在此,不得不提到本能系统,因为我们大部分的注意力、目标、行为,其实都来自于本能预测,它带来了数不尽的预测误差,并要求我们消除这些预测误差,否则就会让我们体验到痛苦与压力等各种负面感受。
例如,盐糖脂肪和繁衍,无时无刻不在给我们制造**“误差感”**。
不过,为什么吃药很苦、打针很疼、治疗很痛,本能十分抗拒,但我们却可以欣然接受,而小孩却哭闹不愿呢?
显然就在于,我们的智能系统通过学习,拥有了可以对抗本能系统的**“新连接”,即拥有了不同神经通路**的选择权——否则,就只能(像其它非智能动物一般)完全听从本能的发号施令。
那么,我们可以对抗**“盐糖脂肪和繁衍”**的本能预测吗?
这取决于,通过可塑性学习,我们的大脑能够生长出怎么样的——结构、连接和网络。
而这个过程的关键,就在于——环境信息,因为大脑并不能任意提取记忆中的信息,而只能以就近环境作为**“跳点”来搜索关联信息,于此同时本能系统与就近环境又“拉扯”得太过激烈,结果就是我们,不是无法控制地回忆过去,就是无法控制地想象未来,唯独缺少了对当下时刻**的注意力投放与智能运作。
因此,我们需要有意识地去选择就近环境,并通过学习将环境信息对大脑所施加的深刻影响,转化为**“可控的可塑造”**。
贝叶斯算法
简单来说,贝叶斯算法——就是想法随着现实而不断改变。
具体来说,贝叶斯算法是根据先验概率,进行概率计算,结合客观信息,调整先验概率,以此迭代循环,从而让后期预测,不断逼近准确的客观现实。
对应到大脑,先验概率来自大脑结构,后期预测来自大脑预测,连接两者的就是信息——这即是:信息积累结构(先验概率)结构处理信息(后期预测)的河床(结构)河流(信息)模式。
那么通俗地说,人脑的推理模式就是:预测随着新信息而不断改变,结论随着新证据而不断改变——或者说,新信息或新证据,会加强或减弱曾经的信念。
但不可忽略地是,已有的信念系统(源于历史塑造的大脑结构),会选择过滤我们看待事物的视角,从而左右约束我们对一个事物的认知、理解、推理及接受。
例如,看到卧室有猫毛(信息),一般第一反应是猫进卧室了(理解),但如果你家猫(历史经验中)从不进卧室(信念),你就会考虑是(抱猫后)衣服上的猫毛被自己带入了(信念决定视角),此时有人告诉你看见猫进卧室了(新信息),你可能会说不可能(坚持信念),并试图确认此人是否在开玩笑或看错了(为信念推理),最后证实猫进卧室了(新事实),你就会思考猫为什么会反常(认知学习)。
另外需要指出的是,算法是解决问题的策略,包含若干可执行的步骤,而贝叶斯算法中的概率计算是基于贝叶斯定理的,即:后期预测(未知条件概率)= 概率计算(贝叶斯定理)+ 先验概率(已知条件概率)。
贝叶斯定理——又称“贝叶斯推理”,它是一个数学公式,可以用来计算随机事件发生的条件概率。
这似乎看起来很契合,但为何大脑会基于一个数学定理(即贝叶斯定理)来推理呢?
首先,是概率。
面对复杂世界,在很多情况下,大脑显然都无法准确预测,而只能得到一个概率——这个概率就是大脑对预测的信心,或反过来说,信心就是大脑对一个预测是否正确的感受,即**“概率感”**。
例如,我们在做选择的时候,其决策依据,一般都是达成趋利避害的概率大小,即:趋利的概率与避害的概率,进行加权计算——这可以由本能计算(考虑感受权重,感受好可以害处大,感受差有好处也不行),也可以由智能计算(考虑得失权重,仅看数学期望无视感受),或由心智(本能与智能混合)计算。
另一个层面,在面对输入信息时,大脑激活的神经结构,会根据上下文状态产生随机的长短连接,而这种随机概率带来了诸多好处,如:联想、闪念、直觉、创意等。
可见,大脑只能基于概率工作,并演化出了基于概率的运作优势。
其次,是模型。
大脑通过组合经验概率来得出结论,从而创造出各种假设,并随着接收到的新信息而连续调整,最终就得到了越来越准确的——概率模型。
从某种角度看,模型是系统的模式,模式是运作的逻辑,而经验是运作的记忆——于是,由经验可以抽象出运作的逻辑,进而得到模式,并构建出模型,即:经验概率可以构建概率模型。
所以,大脑是用模型模拟来预测未来,并用预测误差来改进模型,这种不断对现实世界进行建模并迭代模型的策略,使得大脑的预测能力,具有了可叠加积累的进步和优势。
也因此,基因要求我们相信模型(追求确定感),并可以改进模型(调整期望值),但不能轻易否定模型(放弃确定感),尤其是根深蒂固的认知模型(包括经验感知),以及基因构建的本能模型(无法被可塑性修改的硬编码)。
顺便一提,相对论与量子力学都是**“反直觉”的模型,由于无法切身的体验感知**,所以只能从纯逻辑的角度去构建模型(即反本能直觉,符合智能推理),于是在生活中,符合体验直觉的牛顿力学模型,则更容易被更多的人理解和接受(即在颅内构建出牛顿力学模型)。
对于,**“反直觉”的科学模型,弦理论专家——布赖恩·格林,在《宇宙的结构》**中,清晰中肯地说道:
“对人类体验的明显事实,保持深刻而健康的怀疑态度,带着这样的怀疑态度,孜孜不倦地跟着数学走,看看它将把我们带到哪里。只有那时,我们才能正确评价和诠释,物理定律和常识之间的不匹配之处。”
由此可见,按照你的逻辑你是对的,也许你的逻辑就是对的,但你的逻辑是建立在你的模型之上的,而你的模型却可能是错的。
而如果大脑,没有构建出有效模型,就不能进行有效决策,就无法获得有效优势,最终就会对生存产生各种负面影响。
最后,是学习。
在大多数情况下(尤其是在自然环境中),学习的过程,其实是一种不确定的推理,学习的结果,其实是一种不确定的信息,但学习与试错连接起了大脑中的概率与模型,即:通过学习试错来构建概率模型。
因此可以说,学习总是伴随着可量化的概率,这个概率感,也就是可量化的信心。
而大脑的预测准确性,就取决于学习试错的过程,其可量化成迭代试错的训练次数——迭代包含了复杂推理,推理包含了对试错反馈的计算——这相当于大脑具备了,克服环境不确定性的演化优势。
综上可见
大脑具备的概率、模型与学习,天然地实现了贝叶斯算法的步骤,即:概率模型是先验概率,模型模拟是后期预测,学习试错是迭代误差。
那么,对于人脑执行贝叶斯算法的过程,未必就一定使用贝叶斯定理,而可能是各种贝叶斯衍生定理,即某些条件概率的权重不同——由本能系统决定参数,产生本能预测偏差——但这个算法模式是相同的,即:客观事件会不断调整我们的认知模型。
事实上,应用贝叶斯算法来预测评估大多数随机事件,其结果都是十分有效的,所以人脑可以从容应对生活中的大多数事件——但复杂与罕见的事件则无能为力,如:“灰犀牛”与“黑天鹅”、或任何“长尾事件”。
而从演化角度来看,人脑的模型和决策,一开始并不需要完美无错,只要可以生存下去,并不断从环境信息中迭代试错,人脑的模型和决策就会越来越强大。
而从客观角度来看,人脑会经常犯错,并且在各个层面、各个尺度、各个时间、各个地方、各个事情上都犯着不同的错,但只要不是致命的错误,长期来看,这些错误不仅可以忽略不计,还都促成了人脑的复杂、健壮与稳定。
因此,之所以人脑在错误面前,可以表现出**“反脆弱性”,这正是贝叶斯算法**特性的体现,即:起点不重要,重要的是迭代,信息不能少,越多越可靠。
想法与一切
结合前文所述,我们将从信息与结构的视角,来重新看待一些我们耳熟能详,且与智能密切相关的大脑功能——如:想法、想象力、创造力、直觉、理解、误差感、可塑性、质变。
想法
第一,想法是源自环境。
通常,人们认为自己的想法,是源于自身的独立产生。但其实,大脑并不能凭空创造想法,任何想法都需要信息的参与才能构成,而颅内信息的源头,一定是来自颅外的交互环境。
换言之,大脑中所有的想法都只是环境信息的抽象表达——这个信息不仅在于就近环境,还在于历史环境。
那么,一个环境信息,通过感官进入大脑结构,需要经过筛选过滤、排列组合、本能评估,最后结合感觉才能够形成想法,而每一个想法都**“伴生”着一个感觉强度,以驱动行为对环境信息主动地选择获取,从而大脑就可以连续不断有选择性地,将环境信息转化为想法并存入**记忆——所以我们可以回忆得起,产生过的念头想法。
从电生理学角度来看,每个观点想法,都是大脑神经电脉冲的复杂运作。
因此,想法,并不是我们感觉上的**“虚幻”与“虚无”,**其对应着客观的物质实在,即:电化学反应在颅内运作的一系列参与物。
而更进一步来看,电化学反应的传递随机性与衰减随机性,则带来了信息随机组合的各种可能性,这些可能性就是各种想法产生的**“生化源泉”——其代表了神经结构所存储的潜在逻辑性**。
那么理论上,只要不断接受新信息,大脑就可以不断产生新想法。而就算闭上眼睛,躲到黑屋子里,不接受任何环境信息,颅内已有信息的排列组合,也可以产生相当数量的**“新想法”**。
事实上,有时候在思考的时候,刻意感知便可以体验到,大脑**“神经雪崩”同步放电产生的信息流,从万千可能性的路径组合中,由于随机性积累而涌现的一个确定的路径结果,即“想法”——这是一种被“点亮”**的感觉。
神经雪崩(Neural Avalanche)——是指神经网络活动,产生不同尺度的同步放电现象,其规模大小和持续时间,以及大小和时间之间的关系,都满足幂律分布。
有趣的是,如果把想法通过语言或文字记录下来,想法就从颅内信息变成了环境信息,而想法在不同的大脑之间传播,则意味着不同的大脑结构里,映射出了相似的颅内信息,也就是激活了相似的神经结构,或说相似的电位变化,即电位信息的排列组合。
但显然,想法的局限性就在于,从未以任何形式接触过的信息,就没法参与想法的构成,即:颅内没有的信息,就是智能的无能为力,这是未知的未知。
想象力
第二,想象力是排列组合。
想象力的边界,就是颅内信息排列组合的上限。
换言之,想象力,只是根据颅内已有信息,进行的排列组合。而排列组合越随机,得到的结果就越罕见,体现出来的就是想象力越丰富。但想象力再丰富,也是基于已有信息的排列,无法超越其组合的上限。
例如,做梦,其实就是把白天接收的信息(包括潜意识捕获的信息)与记忆中的信息,进行随机地排列组合——睡着时的感觉信息也会参与其中,如冷了会在雪地,热了会在沙漠,疼了会在战斗,等等——所以梦里,无法出现完全没接触的事物,但可以随机组合已有的信息,从而创造出在现实里不存在的怪诞事物与荒诞行为。
例如,梦里是无法出现没见过的人的,而出现的陌生人,一般都是在白天主观意识没察觉到,但被潜意识所捕获到的人脸信息,亦或是**“想象力”**随机组合了记忆中不同人的五官,所形成的人脸信息。
可见,做梦是对颅内信息**“可能性”**的连接,这也是想象力的工作模式——只不过做梦时的想象更随机,而清醒时的想象更有序。
当然,想象力排列组合的信息,可以是任何类型,包括但不限于:概念、画面、声音、味道、模式、甚至是感受和情绪,等等。
而对想象力的试错成功,就会得到创意,甚至创新——试错是无需推理的演化力量。
那么,从某种角度来看,人脑想象得到的事物,其实在宇宙中就一定对应某种实现,只需要将源于环境的颅内信息,返回到颅外**“重现”即可——不过这可能会有大量的现实细节,需要填补与完善,甚至为了服从某些自然规律的要求,需要“曲线绕路”或“自建新路”才行,但终究是可以完成的,只是时间长短的问题——其实科学的演化脉络,就是走在“想象力延伸至现实”的这条道路上——更准确来说,是现实激发想象然后改变现实的“回路”**。
例如,人类想象着飞翔,科学就发明了飞行器;人类想象着炼金术,科学未来就可以通过核聚变技术来实现“点石成金”。
事实上,我们很难放空大脑不去想象(这需要修炼专注力),就如有事没事一不留神(即缺少颅外的注意力焦点)就会展开想象——不是回忆过去,就是畅享未来——这其实是一种颅内模拟(即注意力在颅内),这样一方面可以巩固记忆,另一方面可以拼接可能,而睡眠中的梦境模拟——也是想象力施展同样作用的时刻。
但想象力的效用,远远可以更为强大,比如可以通过极其逼真的想象,来模拟体验某种身临其境的感受(即排列组合出真实体验时的颅内信息),并由此激发**“体验自我”去拥有某种前所未有的状态,又如设定一个颅内的上下文情景,并从“全景”的角度,去“全排列”**其中事物发展的完全可能。
创造力
第三,创造力是推理组合。
人人都可以想象,但不是人人都可以创造,虽然想象力与创造力,都是把表面“不相关”的信息连接在一起,但创造力是需要在推理基础之上进行的,也就是说,创造力比想象力更需要智能的参与。
也因此,想象力的产物往往缺少客观逻辑,也不需要追求硬性逻辑,但没有硬性的客观逻辑,就没有办法进行有效的创造,所以创造力——其实是颅内信息的推理组合。
就如,著名传记作家——沃尔特·艾萨克森,在**《列奥纳多·达·芬奇传》**中,所指出:
“达芬奇在笔记中写到:若要让想象中的动物看起来自然真实,譬如龙,你可以参照獒犬或者猎犬的头、猫的眼睛、豪猪的耳朵、灰狗的鼻子、狮子的眉毛、公鸡的太阳穴和乌龟的脖子。”
那么,达芬奇这是在想象,还是在创造呢?
答案是,在创造——因为想要让想象中“龙”自然真实,就要符合一定的构造逻辑,而不是随机组合起其它动物的身体。
艾萨克森还指出,达芬奇曾提出过这样一个观点, 即:“真正的创造力,包含了将观察与想象结合在一起的能力,它能模糊现实与幻想的界限,这是创造力的关键。”
那么试问,创造力是如何——连接了观察与想象、模糊了现实与幻想的呢?
答案就是,人类智能所带来的推理能力。
艾萨克森在传记中,对达芬奇总结道:“融合观察与幻想的能力,让他实现了一种出人意料的跨越,将已见与未见联系在一起。所谓天才击中目标,见人之所不见。”
是的,天才如何,见人所不能见——得依靠强大智能的预测能力。
而概括来说,“创意、创新、创造”都需要将遥远的信息进行连接,只不过需要的推理难度是渐次递进的,但它们都需要三个基础点,即:一要有遥远、二要有信息、三要有连接。
所以,没有距离遥远的信息,没有大量不同的信息,没有推理连接的信息,就没有非凡的革命性创造。
可见,自由是创造力的前提,没有自由就没有创造力,因为只有自由才能带来自由的信息与自由的连接,但自由只是前提,有自由并不一定就有创造力。
对此,韦斯特在**《规模》**中,感同身受地指出:“挫折、低效、走入死胡同,及偶尔的顿悟时刻,组成了创造过程。”
是的,这就是**“耗能系统2”,运用推理预测“捕获未来”**的真实场景。
那么,根据创造力的来源——推理出遥远的信息连接,我们可以“因地制宜”地给创造力创造出更多的条件,即:
通过刻意引入适当的不确定性——如环境、行为、习惯、注意力等,任意大范围地短暂切换——来增加随机信息的随机连接,以让潜意识的推理有更多的机会,能够同时激活遥远的信息,并意外地产生连接。
但不要忘了,创造力与想象力有着一样的上限,即大脑不能创造宇宙中——没法排列组合出的东西。
直觉
第三,直觉是潜意识的计算。
直觉与想象力关系不大,但却与创造力密切相关——它可以带来,不可思议的新想法、难以置信的预见性、以及前所未见的创造力。
事实上,有效的新想法、预见性、创造力,往往是通过智能计算才能够获得的,其背后需要的是推理与逻辑。
可见,直觉必定可以进行“某种推理”,才能获得符合逻辑的结果(随机的概率太低,如乱想、瞎猜、幻想)——这即是潜意识的计算,由潜意识主导并引导意识关注,所以直觉的产生过程,不可主动控制和运用,只能被动触发,是一种**“被动推理”——属于“本能黑盒”**。
而潜意识的计算,显然并不总是有效的,其有效性常常因人因景因事而异,卡尼曼在**《思考,快与慢》**中,曾指出:
“直觉,在这两个条件下会更有效:第一,一个可预测有规律可循的环境;第二,通过长期训练,学习过这些规律。”
换言之,大脑过往积累的信息越多越正确,其信息内在结构的连接就越有逻辑,从而直觉就越准确。
那为何,有时由直觉得到的结论,会比智能主动地思考判断,更为准确和有预见性呢?
这是因为,智能主动通过注意力获取的信息极其有限——不仅依赖“就近信息”作为跳点,还只能依循“就近连接”进行搜索;而潜意识可以处理的信息则极其庞大——不仅搜索范围更广,连接数量也更多,如遥远的记忆、深处的记忆、最近的记忆,进行所有逻辑上可能的组合。
所以,直觉的优势与潜力,就是以(注意力)意想不到的方式,对颅内信息进行**“连接构造”,其结果就可能带来——创新创造与预见预言**。
但为何直觉搜索连接更多的信息,还能够快速得出结论呢?
简单来说,原因可能有两个方面:
第一,直觉一直在**“后台”处理信息,存在类似“预加载”与“预处理”**的过程,也就是说,那些未被意识察觉的信息,会被潜意识留意并默默加工,以备后用。
第二,直觉基于**“节能系统1”,用“感受权重”来处理信息,而感受是“历史逻辑”的快捷方式,也就是说,用感受排列组合信息,会忽略很多细节,这是在更高的逻辑层面运作——所以直觉往往是先得出一个“感觉很好”的结论,然后再以后见之明,逆推这个结论的逻辑细节**。
实际上,人们在解决各种各样的问题时,不仅会运用智能,常常也都会下意识地借助“**闪念、直觉、灵感、顿悟”**的力量,这些看起来是非计算的过程,但其实只是,步骤被潜意识隐藏起来的计算过程。
而对艺术的热爱(如绘画与音乐),则可能增强直觉的准确性——因为艺术追求体现了潜意识的“算力”(即排列组合),艺术训练增强了潜意识的“审美”(即模式识别)。
那么从演化角度来看,大脑的主要任务,是确保你能安全地生存下去,所以它的组成功能,除了自我与智能,潜意识也时刻都在留意去保护你,这即是潜意识的计算——你的直觉。
理解
第四,理解是信息的融合。
记住一个信息,未必就理解这个信息。要理解一个信息,首先大脑中要有能与之关联的信息,其次这个信息要通过关联信息,融合到已有模型之中。
显然,一个信息要是在大脑中找不到任何的**关联信息,**即无法想象、无法类比、无法解释,就是完全没有办法理解的,但可以死记硬背。
而通过关联信息,可以想象、类比、解释之后,这个信息还需要与已有模型兼容,即符合已有模型的逻辑关系不能出现冲突,并与模型建立连接,即成为模型的一部分(或说扩展了模型),才算完成了理解。
那么所谓理解,就意味着这个信息融合进了大脑结构之中,因此当这个信息被激活的时候,与之关联神经结构,即模型的一部分,也会被关联激活。
所以,对于一个理解的信息,我们可以从认知模型的角度,提取丰富的关联信息,进行不同角度的想象、类比、解释。
事实上,为什么有些信息,会让我们有种**“不证自明”的感觉,就是因为它们能够与我们的认知模型**,进行很好地关联和融合。同理,那些我们可以快速理解的信息,也都是如此——如来自他人经验的常识,可能会与我们共享某些模型——但这些信息并不是真的就**“不证自明”**,只是符合我们已有的模型。
当然,如果信息是错的导致无法融入模型,或信息是对的但模型需要重构,甚至需要新建一个模型——这样的信息(如量子力学),就很难在短时间内被理解,或说不经过深度思考,就无法轻易理解(包括理解错误)。
换个角度来看,信息就是对具体的**“抽象压缩”,而理解信息的过程,就是在颅内中对信息的“具象解压”**,其结果就是信息的具体,被还原到大脑结构之中。
所以,越是具体的例子就越容易理解,越是抽象的概念就越难以理解,因为颅内**“具象解压”的过程不同,而如果颅内已经拥有大量的具象信息**(例子),就可以提高对抽象信息(概念)的理解。
由此可见,思想其实是一种**“信息压缩”,如果颅内没有相关的信息积累,就无法解压思想的细节——此时再伟大深邃的“思想”,也仅仅只是一个无法颅内解压的“压缩包”**。
而从**“理解”的角度,我们可以看到“难度”和“复杂”**,是两种不同的概念,即:
- 难度——是搞不清其中的步骤,无法理解其中的抽象。
- 复杂——是理解抽象,但是步骤太多,无法记忆具体。
换言之,难度是不理解步骤,复杂是记不住步骤,能理解步骤就没难度,能记住步骤就不复杂,所以有难度可能不复杂,不复杂可能有难度。
例如,所有事情(包括知识)的**“难点”**,就都存在着——让人难以理解的步骤,而通常不理解就记不住,所以难度会让人感到复杂,但复杂却是“虚幻”的难度——因为记不住是“虚幻”的不理解,一旦真地去尝试理解每一步时,可能虚幻的难度就自动消失了。
那么,“抽象层级”(或说抽象屏障)就可以在理解的基础上——隔离复杂(或说不用考虑层级以内的步骤)。
例如,编程并没有难度,难度在于数学(即抽象思维和抽象模型),但编程会很复杂,而这个复杂,可以通过抽象层级来屏蔽与隔离,即:调用封装好的代码包,无需了解其实现步骤的细节。
例如,人类智能是高度复杂与极端难度的混合,但这种混合都被封装在了脑壳之内,对外的交互界面是非常简单易用的,即:人脑生物学上的抽象层级,屏蔽与隔离了人类智能功能实现的细节。
事实上,高度抽象可以做到——既简洁又深刻,这是利用难度消除复杂的一种方式。
从某种角度看,所有真正的天才,都具有追求简洁的本能与天赋,如牛顿、爱因斯坦、乔布斯等等——这是抽象能力的标识,而世界如此复杂,人类智能需要用难度去消除复杂。
不过,所有的复杂都只是过程,结果永远是简单的——换言之,我们可以跨越复杂过程,只使用简单结果,即:“构造黑盒”,就如基因并不理解大脑运作,却在使用**“大脑黑盒”**。
那么,更简单地来说,理解就是用熟悉的事物来解释陌生的事物——可见,熟悉的事物越多,能理解的事物就越多,这会形成理解的层级,即:每一层的理解都依赖下一层的理解。
而不同的人对同一个事物(如电影、小说、定理、定律)不同的理解,就是不同的大脑结构从不同的角度对相同事物结构的不同连接与建模——这是属于一个人自己的独特理解,正是这种独创性的理解,赋予了这个事物独创性的内涵,即不同乃至全新视角下的“结构”。
但由此来看,有智能、会统计、可预测不一定就能理解——因为,已有结构与输入结构、熟悉事物与陌生事物,不连接不融合,也一样可以进行有智能的统计预测或经验预测。
例如,我们不需要理解公式模型,就可以利用公式模型,代入数据进行有效的智能预测。
换言之,智能、统计、预测不等于理解——当然在同等条件下,理解(即结构的连接融合)可以产生更出色的智能、统计与预测。
那么,理解的限制就在于,理解必须依赖颅内模型,而模型再复杂都是简化,所以现实与模型总有误差,这即是理解的误差,也是真实与虚拟的误差。
误差感
第五,误差感是智能的驱动力。
我们为什么要运用智能,是为了解决问题,为什么要解决问题,是为了达成目的,为什么要达成目的,是为了消除误差感。
事实上,误差感,就是本能“遥控”智能的“提线”,即:本能算法在颅内创造出误差感(以神经递质的形式),接着引导注意力关注,然后如果本能行为无法轻易消除它,最后智能行为就会想尽办法去消除它。
那么,如果颅内没有发生误差感,我们就会没有驱动力去做任任何事,“耗能系统2”的智能运作更是无从谈起。
当然,误差感是很容易产生的,就如前文所述,大脑时刻都在预测未来,而预测就会产生误差,接着误差感就会油然而生。
这也就是为什么,我们会有源源不断的驱动力,去驱动我们几乎连续不断的各种行动——只不过在智能上,有些我们想要的行动,其误差感难以获得,有些我们不想要的行动,其误差感又难以抑制,结果就是**“无法自律”**。
可以想象的是,有些**“客观误差**”,是无论怎样运用智能都是无法消除的,如无法挽回地失去某人或某物,其误差感就会带来失望与失落,甚至是悲伤与悲痛。
或许时间可以消除一切**“误差感”,但如果带来误差感的记忆,所对应的大脑结构(即神经连接)比较稳固,那么这个消除过程**就将会漫长的多。
于是理性上,过去的就应该让它过去,但客观上,结构的误差感不让它过去,所以感性上,过去的就过不去。
不过关于误差感,有一个本能的不对称性,即:失去的误差难以消除,但得到的误差会很快适应,前者需要避害(所以印象深刻),后者需要趋利(所以忽略既得)。
可塑性
第六,可塑性是路径依赖。
愿景,就是心中愿力与图景,是愿景积累了行为的差异,导致了信息积累的差异,从而形成了现实的差异,所以,人和人之间最重要的不同就是愿景——那么,愿景来自何处呢?
事实上,由于可塑性的加持,任何人的大脑经过特定路径的训练,都可以完成变化有趣的复杂工作,也可以完成重复无聊的简单工作。
别忘了,刚出生的婴儿大脑,都几乎拥有相同的可塑性,此时只有本能反射,没有智能模型,但随着环境信息第一次激活大脑开始,大脑结构与环境信息的相互作用,便给可塑性的演化,设定了一条**“路径依赖”**。
路径依赖——是指一旦进入某一路径,就会依赖这一路径进行演化,从而一直在这路径上走下去。
换言之,可塑性并没有方向,但**“结构选择信息,信息改变结构”的过程,为它设定了方向,而“结构依赖之前的信息,信息依赖之前的结构”**就是一种路径的依赖,直指结构第一次被信息激活的起点。
试想,是探索宇宙、黑洞、粒子,还是心智、意识、认知,亦或是数学、算法、智能,最终还是超市、快递、带货——我们的神经网络可塑,但它有的选择吗?——如果有的选,也并不是真的**“有的选”,而是有“有的选”的选项,这个选择项来自“没得选”**。
从某种角度说,你的未来取决于之前的历史,你的历史决定了之后的未来,之间的每一步,都走在路径依赖的道路上,而现在能做的——就是依赖上一秒、上一分钟、上一刻、上一小时、以及前几时、前几天、前几周的大脑结构——做出它的可塑性模型,准许的判断与选择。
例如,越不锻炼就越容易累,越容易累就越不想锻炼,最后就会在“不锻炼”的路径上,越走越远,直至虚弱到“木已成舟”。
从某种角度说,别人产生的那些有趣的、有创意的想法与洞见,是因为别人所接触到的信息,进行排列组合的结果,那么我们为什么会看到这个、想到这个、好奇这个、搜索这个、关联这个、创造这个——这是之前信息积累的效用,所形成的路径依赖。
例如,任何依赖上下文的判断、决策、选择、行为、状态、甚至是语义——其实都是对**“路径”**的依赖。
这就是所谓的,神经现实要回归人生现实,一个头脑比另一个头脑优秀,只是**“可塑性路径”的不同,而左右路径依赖**的强大力量,最终是运气——可以展开想象,但运气是不可想象的——运气是超越模型的概率,是被宇宙规律掌控的演化。
那么一个人的愿景,一定是来自环境信息,它是大脑结构被环境信息所塑造的依赖,依赖的是环境信息被大脑结构所选择的路径。
是的,大脑就像是一个筛子,它会把环境信息以特定的形式,过滤出来——就像大卫雕像不是被创造出来的,而只是去除了不需要的部分——但为什么只有米开朗基罗知道,应该去除掉大卫雕像那块大理石的哪些部分呢?
这就是大脑的——可塑性与路径依赖,即:在神经与演化层面上,选择是一个幻觉。
质变
第七,质变是盗火神力。
从量变积累到质变,是无处不在的自然现象,它同样也会发生在大脑之中,即:随着信息积累的量变,到一定程度越过某个临界点,就会发生大脑结构的质变。
质变的结果与力量,是经常会爆发出不可思议的:闪念、直觉、灵感、顿悟——这其中,不仅有通过已知(即通过我们所知道的事情)得出的结论,还有改变已知(即改变我们所知道事情)本身的调整。
那么,从神经网络的角度来看,颅内质变就是——更多的连接、更长的连接、更远的连接,其动力学基础就是,神经脉冲更慢的衰减速度,对应到整体上,就是神经网络同步放电更慢的幂律衰减。
我们知道,幂律分布(如cx^n)有三个决定因素,底数(x)、指数(n)与系数(c)——其中底数代表规模大小,指数代表层级规律,系数代表环境影响,即:在某个层级规律(如n = -2)与环境影响(如c = 100)之下,规模大小(x)所呈现的幂律分布(如P(x) = 100x^-2)。
对应到神经网络的**“神经雪崩”,其幂律衰减**的模型(P),可以简化如下:
- 规模大小——是同步放电的神经元数量,在于连接数量(x);
- 层级规律——是神经元的基因表达效率,在于连接强度(n);
- 环境影响——是电化学反应的能量支撑,在于心流时间(t)。
于是,P(x) = t * x^-n,即:衰减分布 = 心流时间 * 连接数量^-连接强度——负号表示衰减与数量呈反比,因为规模与耗能成正比。
也就是说,心流时间越长,连接数量越多,连接强度越大,衰减分布就越长尾——而这个**“长尾”就是颅内质变**的量化体现。
那么,由于大脑的心流状态是可以激发的,连接的数量强度是可以训练的,所以颅内质变就是可以通过积累量变来获得的——也只能通过后天的积累量变来获得。
而具体来说,幂律衰减的长尾,其核心价值就是带来了,神经网络**“长连接”的可能性——“长连接”可以突破(结构对应逻辑上的)“层级封装”,涌现出洞见,洞见是就穿透“无知之幕”的神力,神力可以穿越脑壳,造就颅外世界**的质变。
对应到数学上,幂律分布要求,随机变量之间具有关联性(即神经连接),关联性容易产生正反馈(即连接强度),正反馈容易积累量变(即连接数量),量变不断积累(即心流时间),就可能产生质变(即涌现出**“长连接”**)。
因此,“长连接”就是智能的“质变力”——它拥有“盗火”般的神力,即:盗火神力。
而换个角度来看,每个**“层级封装”都拥有一个“质变点”,其分割的是量变与质变不可逾越的鸿沟,唯有“质变力”才能够穿越“质变点”**,获得质变的力量。
有趣的是,洞见的洞见还是洞见,这是一种标度不变性,也就是自相似性,所以**“长连接”**具有分形结构。
韦斯特在**《规模》中,认为:“分形维数,是一个物体褶皱度的体现,也有人将之解读为该物体复杂性**的体现。”
分形维数(Fractal Dimension)——是指分形结构的维度,其代表了分形结构在规模缩放时,在双对数坐标下对应直线的斜率(固定比例),即不随规模和时间改变的比例,通常是非整数可由公式计算。
那么,大脑的复杂性,就在于它的生理褶皱和思想褶皱——前者是连接结构的分形维数,后者是洞见结构的分形维数。
事实上,智能之间数量级的差异性,就在于**“长连接”**所捕获的洞见——它来自于宏观上,信息的积累、刻苦的训练、心流的激发。
换言之,人和人之间的智能水平(或说预测能力)是完全不同的,甚至可以有多个数量级之间的差异性。
或许,我们并不知道,颅内质变何时才会发生,以及它是否真的会发生,但这就是**“质变力”不确定性的禀性,然而一旦它发生,你一定就会感受得到,它那股强大到用“预见未来”的力量与“透彻心扉”**的体验混合而出的——盗火神力!
原创与超越
最后,何为原创,如何超越。
原创就是——只有你的大脑结构才能排列组合出的信息连接!——换言之,没有原创,只有组合,前所未有的组合,就是原创(创新同理)。
那么,科学的想象力,会超越科幻的想象力——就因为科幻是**“已知信息”的排列组合,而科学则通过数学的结构与关系**,开拓了**“未知信息”的排列组合,结果即增加了更多的视角与维度,这其中便蕴含着“不可想象”**的想象力。
注意,哲学需要在数学的边界内进行演绎,即不能与数学相矛盾,但可以演绎人类数学仍未定义的领域——所以,哲学也可以引领想象力,超越科幻的想象力,并在思考与思维的深度上支撑科幻。
可见,超越的关键——就是**“用未知原创”**,而未知来自未知的未知,以此类推。
另外退一步,所有迭代试错的行为,都可以排列组合出的新连接——而这就是为什么,在各个领域工作前沿的实践中,总会诞生层出不穷的新想法、新观点、新见解、新思维与新思想。
结语
概括来说,大脑结构的可塑性,是人类智能的物理基础,环境信息的逻辑性,是人类智能的预测基础;结构关系的统一性,是人类智能的演化基础,抽象映射的有效性,是人类智能的模型基础。
形象地来说,电光石火的神经脉冲,塑造了复杂网络的适应性,这就是人类智能的生物动力学。
从进化角度说,要突破就近环境的限制,就必须创新——要么改变系统的物质组成,要么改变系统的结构设计,要么两者同时发生——但创新的底层操作,都是无差别的排列组合。
由此来看,人类智能就是大脑的创新,并且是一种“可以自行创新”的创新,因为大脑结构的动态性,让创新的智能可以不断地改变自身的结构设计,从而进行递归的创新——这带来了前所未有的适应性——相比较,本能无法递归的创新,其适应性是极其局限的,但基因具有一定的动态性,如表观遗传。
所以说,大脑是一个复杂适应性系统,具有**“用复杂对抗复杂”的能力,可以不断进化,但进化的不是大脑功能**(神经运作),而是大脑结构(神经连接)所对应的信息。
那么,支撑人类智能的动态性,就是体现在**“连接”之上,连接带来了信息的提取存储、排列组合、以及抽象映射——最终就是推理预测**。
可见,连接才是关键,尤其跨越距离的长连接,是一种稀缺的神力——因为耗能,且演化通常只考虑就近环境。
在此别忘了,距离即是时间,在不同距离上的连接,带来的是跨越时间的连接,其连接的是不同的,信息获取的时间与信息创造的时间。
而连接还可以穿越脑壳,在人与人的之间、人与物之间,来带相互作用,此时跨越信息载体的长连接,同样是一种稀缺的神力——如观念、思想、文化的碰撞。
事实上,信息的流动在底层,上层是物质、能量、资源的流动,而道路、铁路、航路、网路等等,都是信息连接的通路——显然,网络的超链接,是实现颅外**“长连接”**的一种高效模式。
因此,人类智能(包括贝叶斯算法)需要连接、需要信息、要需更多、越多越好,只要顺应这一点(如城市与网络带来连接与信息),智能就会在规模效应下,非线性的越来越强(如大型城市与万物网络)——可见,搜索引擎与推荐算法,应该提供更多相关(甚至不相关)的细节信息。
而如果用一句话,来阐释人类智能的意义与效用,那就是:捕获因果,预测未来。
当然,有了因果就可以解释过去,但解释过去的目的还是为了确定未来——因为知道了过去为什么会这样,就可以确定未来可能会怎样——而预测了未来,就可以决策现在,并选择一个趋利避害的未来。
换个角度来看,对于过去,人脑其实充满了不确定性的各种解读(包括强行解读),而对于未来,能否准确预测,以及能否连续准确预测,则具有可证伪的确定性。
那么在未来,我们是否可以完全理解,大脑所构建人类智能的全部底层细节呢?
对此,有这样一句哲学名言:“如果我们的大脑简单到可以被智能理解,那么我们的智能就会愚蠢到无法理解。”
就像,果蝇与蚯蚓的大脑足够简单,但简单到它们不足以理解自己(不过人类可以理解)——或许,这就是用人类智能去理解人类智能本身,所必然产生的自指悖论(服从哥德尔不完备性定理)。
但试想,大自然是如何从简单的元素周期表,组装出了超越元素周期表的复杂大脑的呢?
答案就是,这需要走上一条长长的进化征途,并跨越多个**“创新层级”——如寒武纪生命大爆发,就是生命跨越“创新层级”的涌现——是的,进化是漫长的过程,关键的结果是可以不断地创新,那么人类智能**是否可以不断创新呢?
答案是显而易见的,但是人类智能的创新能力,是否会存在一个无法理解其自身的上限呢?
这就要回到,信息可以穿越脑壳进行连接创新的视角,即:我们可以利用全人类的大脑,在时间轴上进行群体信息的积累与创新,来破解一个大脑的运作。
更甚至,我们可以让人类智能离开大脑,在机器中继续创新,就可以解决人类智能在颅内的自指悖论了——要知道,信息的排列组合是无关载体的——而大自然创造大脑与智能,也并不需要了解其工作原理。
据此,机器也可以拥有人类还不了解的**“黑盒智能”,再反过来用这个“黑盒智能”去了解人类智能本身——这里人类就像大自然,机器就像大脑,黑盒智能就像人类智能,这也是一种递归模式——就像大自然创造了“可以自行创造”**的大脑一样。
至此试想,大脑还是宇宙了解其自身的唯一方式吗?
或许智能才是,大脑只是智能一个载体,就像大脑是信息的载体一样,而大脑结构与环境信息之间的相互作用,则决定了(个人与人类)智能的进化。
就如,丹尼尔·凯斯在小说**《献给阿尔吉侬的花束》**中,所描述的:
“你现在像是一块巨大的海绵,不断地吸收——事实、数据和常识。不久之后,你也能开始将它们互相关联,你会懂得不同的学科是怎么联系起来的。查理,这种阶段有好几个,就像是踏上一个巨大的阶梯,你走得越高,视野就越来越宽阔,身边的世界也越来越大。查理,我只能看到一小部分,我也不会比现在走得更高了,但你会一直一直往上爬,看得越来越多,每一步都会打开新世界,而你从来不曾知道它们的存在。”
显然,这种巅峰表现的心流时刻很棒,但维持不了多少时间,几时几天或几年,但沉浸其中就是**“智能体验”**的意义(即本能对智能的奖励),不是吗?——不要头痛只要心流,除了天赋还要信息。
可是,“黑盒智能”明明就可以很好地工作了,探索并了解人类智能的意义又何在呢?
除了更好地发掘和运用我们自身的智能之外,这就涉及到了另一个有趣的问题,即:人类智能产生的源头是什么?
后记1:智能的源头
人类智能的演化,有一个奇怪的现象,即:可以追求**“不实用**”,也可以沉迷于**“不真实”**。
事实上,人类智能有一种精神追求,就是纯粹地想知道:世界(及一切)到底是怎么回事?世界(及一切)的底层逻辑是什么?世界(及一切)的源代码在哪里?
可是,知道了遥不可及的结局、无法接受的真相、不可避免的宿命,又能怎么样呢?——显然最大的收获就是:成就感、意义感、以及智力的愉悦——当然,还可能因此毁灭了人类和世界及一切。
但,这是和演化原则**“随机试错 + 就近环境 + 够用就好”**不相符的。
要知道,演化出智能的初衷是——捕获因果、解释过去、预测未来,但最后的“落脚点”还是在于——确定现在,即:确定与生存息息相关的现在。
那为什么人类智能会追求**“不实用”与“不真实”**呢?
答案就是,好奇心——如果没有好奇心,人类智能就会失去探索一切的动力,表现出来的就是:没兴趣、没意思、懒得想——也正是好奇心,在引导着人类智能去探索那些**“不实用”与“不真实”**,如纯逻辑的构造。
那为什么好奇心会对**“不实用”与“不真实”产生兴趣呢?——这需要继续回溯**好奇心的来源是什么?
我们知道,凡事追问原因是人类的天性,而这个**“追问原因”就是好奇心的表现与形式**,那为什么我们总要追问原因呢?
因为只要找到原因,哪怕是未经验证的原因,甚至是错误的原因——人们就可以对抗不确定性,就不会感到恐慌——换言之,内心就拥有了**“确定感”——事实上,哪怕是“虚幻的确定感”也可以有效抑制心理上的恐慌**。
所以,好奇心的目的,其实为了找到**“确定感”——其过程就是驱使我们,通过寻找因果关系**,来把不确定性转化为确定性。
但,为什么又需要**“确定感”**呢?
答案就是,“安全感”——它意味着生存概率,这是演化唯一在乎的目标了,因此演化透过基因本能构建了这样一条算法,即:追求安全感 => 追求确定感 => 产生好奇心。
例如,在“安全”的前提下,如果过程是确定的——我们就会感到无聊(如厌倦重复),如果过程是不确定的——我们就会产生好奇(如游戏宝箱)。
接下来,好奇心的直接产物就是学习试错——强烈的好奇心,不仅能激发更多的学习试错,还能战胜担心害怕,勇于尝试更多的学习试错——而学习试错可以,完善智能的概率模型,提高智能的预测能力,最终获得生存概率的优化,即本能算法的目的达成。
可见,好奇心的重要作用,就是给学习试错提供探索的驱动力,以提高与生存相关的预测能力——所以,本能会给予好奇心愉悦感的化学奖励。
而我们也可以想象,好奇心的演化初衷,肯定没有计划让人类智能去探索诸如——“我们是谁,我们从哪里来,我们要到哪里去”——等等这样的**“纯粹问题”**。
之所以,好奇心会引导人类智能去探索**“纯粹问题”,原因就在于——“冗余性”(会带来“多样性”与“差异性”**,以供随机地排列组合),这是演化最强大的力量。
那,好奇心为什么会出现这种**“冗余性”**呢?
其原理就在于,本能算法的**“适应性”**,即:过于好奇会害死自己,所以好奇心需要有一个度,也就是,只有足够安全,才会足够好奇,并且越安全就可以越好奇。
例如,生存受到威胁时(如生病、穷困、无助),就很难再有好奇心去探索未知,而参与科学探索的前提,就是先要保证衣食无忧的生存,之后好奇心才能够**“魔力登场”**。
于是,智能越高,生存概率越大,就会越安全,此时就会越好奇,而越好奇,就会越学习试错,结果智能就会越高——显然,好奇心与智能形成了一个正反馈的循环增强。
最终,随着好奇心与智能循环增强地演化,好奇心的**“冗余性”,就对应了本能对探索未知的过度奖励**,或说是过度奖励了对预测误差的消除,其结果就是人类的某些**“精神追求”,即:人类智能对纯粹问题的纯粹追求**——既可以**“不实用”,也可以“不真实”——这可以消耗掉人类智能的“冗余性”**。
所以说,好奇心其实一种**“安全冗余”,产生的“奖励冗余”,来自大脑的奖励系统**,属于**“功能冗余”——演化最擅长使用冗余性来对抗不确定性**。
至此可见,智能的源头,就是本能算法所编写的——好奇心、确定感与安全感。
换言之,智能底层操作**“排列组合”**的需求,就是来自本能的好奇心,对确定感与安全感的追求,即:智能为什么要排列组合,是因为好奇,为什么好奇,是为了确定,为什么要确定,是为了安全。
但换个角度来看,人类也喜欢**“适度”的随机性——如:喜欢(好奇) = 熟悉(确定已知) + 意外(随机未知)——这显然是因为,把随机未知变成确定已知,是一种进化优势沉淀而成的进化偏好**。
可以说,人脑对随机与确定有着同样的渴望,也就是不断把随机变成确定,以形成**“积累确定,应对随机”的生存模式——同时这也是,在环境与精神上,以确定熵减对抗随机熵增**的过程。
事实上,好奇心不仅是一种最古老的追求乐趣的方式,也是哲学、科学、文明的驱动力与引导力之源;而确定感与安全感,则是我们精神与情绪的底层秩序,没有它们好奇心与智能都将不复存在。
对此,积极心理学奠基人、“心流之父”——契克森米哈赖,在**《心流》**中,认为:
“在此必须强调一个经常被人忽略的事实:哲学与科学的兴盛与发展,只因思考带给人愉悦。如果思想家,不能从逻辑或数字创造的意识秩序中,找到乐趣,我们现在就不会有数学或物理等学科了。……换言之,如果科学家不能从(科学)中得到乐趣,就不可能有什么发现可言。”
例如,物理学家大多都有这样一个信念,即:宇宙的基本理论,必然是简洁优美的,而对美的追求,就可以发现宇宙的基本理论——所以物理学热衷构造对称性(如超对称),因为对称,就是人类本能上所感知到的一种美。
有趣的是,有些动物也具有好奇心,有好奇心就可以学习试错,但它们的大脑硬件具有**“层级限制”,所以尽管它们拥有好奇心与学习试错**,却永远也无法产生人类智能。
而我们的祖先,亦是在同样的本能路径上演化,只不过因为随机性,幸运地跨越了**“创新层级”,最终才获得了可以支撑人类智能的“大脑硬件”**。
那么,在这个**“创新层级”之后,“安全感、确定感、好奇心”都可以由颅内模拟“自给自足”,而不必再与颅外的真实世界紧密关联与同步**,也因此,人类智能可以沉浸于一个——由颅内模拟所构建的纯逻辑的虚拟世界。
这里依然有一个,正反馈的循环增强,即:颅内的虚拟世界越复杂,就需要吸收越多的环境信息,而越多的环境信息,又会让颅内的虚拟世界越复杂。
据此,再来看演化原则:
- 随机试错——可以在逻辑世界里进行。
- 就近环境——可以是颅内的虚拟世界。
- 够用就好——需要探索可模拟的一切。
可见,人类智能的演化,是完全符合演化原则的——只不过它已经从自然世界,部分的转移到了颅内由信息构建的虚拟世界。
所以,我们为什么想要了解人类智能的本质?
因为,好奇心会得到本能的化学奖励,这是本能对智能的奖励,即智力的愉悦,其终极奖励就是——“心流体验”。
最后,回到智能的源头,本能要求我们追求确定感,而数学就是确定性最高的表现形式,这就是人类智能对数学的迷思所在,但想要终极的确定感,难道不就是接受**“强决定论”**——放弃自由意志吗?
不管怎么样——“好奇心”会指引连接的路径,将我们连接到一个我们好奇却不曾想象的世界、未来与结局。
后记2:语言的作用
人类智能与人类语言密切相关,因为人类的思考能力直接取决于,是否知道能够表达有关思想的词汇,如果不知道这些词汇,就无法表达这种思想,对应的思考也就无从谈起。
从某种角度说,知识就是概念的层级嵌套直至映射具体,所以掌握知识的本质就是掌握概念,而概念需要语言来抽象承载。
很难想象,如果没有语言能力,人类智能会以怎样的形式,来获得抽象能力——显然,语言对世界的描述,就是一种抽象——而抽象是逻辑的基础,逻辑是智能的基础,所以语言就是智能的基础。
换个角度来看,语言是一种信息工具,它可以高效传播又有效传意,而人类智能的运作就是接受信息、处理信息、学习信息、创造信息,所以语言顺理成章的,就成为了人类智能的功能支撑与发展途径。
事实上,每个人智能水平的成长,总是首先从学习语言开始,接着在语言之上形成叙事与思考——前者构造故事,后者构造模型——然后随着表达力与思考力的不断提升,最终带来了复杂叙事与复杂思考,这才能表现出人类智能,独一无二又无比强大的——“通用智能”。
当然,除了语言,通过感官也能获得大量的体验信息(即各种感觉,如画面与味道),但这些信息非常具体、个体独有、无法传递、难以准确、依赖尝试、不易连接(相比抽象概念),虽然体验信息也可以形成逻辑与推理(包括本能预测),但不能构建出复杂的叙事与思考。
例如,没有语言如何才能将一种感觉,描述出来并传递给别人,可能最好的方法就是让其体验一次,但你并不知道你们的体验是否一致,或一致到什么程度,关键是有些特殊情景,难以重复尝试,这种体验信息就不能轻易传递。
例如,任何一个事物(包括事件、现象、行为、体验、人或物等等),如果不知道它的名字,我们就会很容易遗忘和忽略它,而一旦知道了它的名字(如**“心流”或“熵”),我们就会很容易联想和回忆它——也就是说,一个事物只有映射到我们的语言,它才能够在我们的脑海中“敏感高效”起来,所以我们热衷于给一切事物都“命名”**——命名是对概念或定义的抽象压缩。
例如,没有语言你无法将一系列的感觉,组合成一个连贯的描述,来激发别人的感觉(如虚构故事);并且你也无法发掘出,不同感觉背后相同的原因,以及相同感觉背后不同的原因(如抽象推理);还有最重要的是,你也无法理解超越感觉之外的逻辑关系(如相对论与量子力学)。
换个角度来看,感觉可以传递信息,语言可以描述感觉,所以语言不仅可以传递信息,还可以传递信息的信息——这就像洞见一样(洞见的洞见还是洞见),具有标度不变的自相似性。
可以想象,一个人如果没有掌握任何人类语言,那么他将无法获得人类智能,所应有的功能与水平,而一个人如果不能很好地掌握人类语言(包括词汇和语句),他就不能发展出人类智能,所应有的复杂性与适应性。
但值得指出的是,没有语言,依然可以进行简单的思考推理,以及运用形象思维的创作。
例如,婴儿在会说话前,就可以做出判断和选择,但不排除此时婴儿可以听懂语言,即大脑中具有语言思考能力,只是还不会说。而就算婴儿的确是,抛开语言进行了思考推理,其过程也是需要抽象的,即把**“具体”**抽象成感觉,然后利用感觉去推理,即什么感觉对应什么行为。
类似的,某些**“聪明”的动物(如牧羊犬),可以听懂人的指令,执行相关的动作,甚至可以认识人类命名的物品,显然在它们的大脑中,形成了人类语言的抽象映射,尽管它们不了理解人类语言**的内涵,但可以把语音对应到物品或动作,以及利用自身的感觉去进行推理(它们自身没有语言以进行推理)。
但没有语言的感觉推理,是比运用语言的抽象推理,在效率上要低效得多的,甚至有数量级上的差距。
例如,每个人对**“车”都有各种想象画面,但对于“没赶上车,所以迟到了”这句话,“车”具体是什么样子对应什么画面,可以完全被忽略,此时关注的重点是这句话的语义,“车”**只沦为一个概念,无需具体或对它有什么感觉。
例如,每个人熟背的乘法口诀,不会背诵也可以数手指具体计算,但计算效率极其低下。
例如,黑猩猩通过训练,可以掌握上百个手语,利用手语它们可以表达词汇,利用词汇它们可以进行交流,但它们始终无法掌握语法以将词汇连接成句子,进而形成复杂的抽象叙事,这种语言能力的限制与它们的智能上限是密切相关的。
事实上,语言带来了大量抽象的概念与定义,如方向、时间、距离、价格等等,缺少这些信息的封装,一切都用具体的事物和感觉来表征,不仅会降低思考的速度和连贯性,甚至会让深度思考,成为极其困难以至于不可能完成的事情。
类比来看,这就像计算机编程不使用编程语言,而是直接使用——“01010101”,显然依靠这样的具体数字,完全没有可能构建出复杂程序。
那么,绘画与音乐的创作,往往并不需要语言,只需要画面和旋律所对应的直觉,所以这种形象思维也不需要很强的逻辑性,其结果能够让感觉系统,体验到美好美妙即可,而不是逻辑上的是否正确。
而另一种情况,在借助语言把思考推理内化之后,遇到类似的情景,就不再需要语言,可以直接给出结果,这相当于直接激活了内化的神经回路,跳过了思考推理(即产生新连接)的过程,所以也就不需要语言了。
但对于**“词不达意”或“用词不当”**的情况,为什么语言会无法表达思考结果呢?
这可能有两方面的原因:一方面是,存在可以正确表达的词汇,但并没有被掌握;另一方面是,对于一种感觉或思想,的确可能会出现无对应的词汇——在不同语言之间的翻译,也经常会出现这种情况——这是语言历史并没有形成对应的表达。
但思考的过程是依赖语言的,只是思考的结果出现了**“意外”**,否则这个思考过程,要么是简单的,要么就是缺少推理的(会符合经验逻辑)。
显然,有些感觉或思想,用语言来解释是很费劲的,需要长篇大论的详细描述——这是因为,这些感觉或思想比较罕见或难以理解,没有形成大多数人的共识,而一旦形成共识,就可以在语言中,创造出新的概念或定义——要知道,语言中的一切都是对**“共识”**的抽象创造。
例如,“禅定”与“无我”的感觉,最初只有很少的人体验过,但随着体验了解的人数增多,变成了共识之后,这种罕见的感觉,就会在语言中形成对应的抽象概念,对于共识人群也就不需要解释——“禅定无我是怎样一种体验”。
可见,语言不仅支撑了复杂思考,其可扩展性,也为深度思考的无限复杂性,做好了准备。
因此可以说,人类智能(包括思考、思维、思想)的认知边界,其实就是我们自己的语言,在语言之外,我们并没有智能,只有本能(包括本能预测)。
就如著名哲学家——维特根斯坦,在**《逻辑哲学论》中有一句名言:“我的语言的极限,即是我的世界的界限。”**
换言之,语言的极限就是智能的界限,界限与极限,就是智能与语言关系的一种形象表述。
有趣的是,不同的人类语言,却支撑了相同的人类智能——这说明了,语言拥有相同的抽象作用,即映射具体描述关系,而这种抽象作用,就是智能的底层逻辑需求。
换言之,语言通过抽象(结构)的同态性(即结构相似,存在不对应),表达了智能(结构)的同构性(即结构相同,逻辑性一致)。
那么,语言的符号化延伸,如文字、数学、程序等等,也具有一脉相承的抽象作用,所以人类智能,可以完美地转移到符号系统之上,无缝地抽象运作。
米哈赖在**《心流》**中,指出:
“文字在控制体验上的重要性,是建造象征体系的「积木」,使抽象思考成为可能,并扩大了心灵储存刺激因素的空间。若缺少整理信息的体系,即使最清晰的记忆,也不能阻止意识陷入混沌。”
要知道,任何思考的结果,都需要用符号系统表述,不然就没人可以知道和理解这个结果,此时就没法判断区别,你是真有“无法表述”的结果,还是根本没有结果。
所以,语言是智能的基石,是信息的基石,是故事的基石,也是文明的基石。
顺便一提的是,语言还承载着人类各种文化的底蕴、内涵和历史,从在不同语言中的成语、俚语、敬语、以及禁忌、忌讳之间,难以准确互译,就可以看出端倪。
后记3:虚拟的现实
布莱森在**《人体简史》**中,说道:
“对你的大脑来说,世界只是一股电脉冲,就像一连串的摩尔斯电码敲击。从这赤裸裸的中立信息中,大脑为你(不折不扣地)创造出一个充满活力、三维立体、在感官上引人入胜的宇宙。你的大脑就是你。其它一切都只是管道和支架。”
换言之,在接收到感官信息后,我们的大脑会对这些信息做出诠释,重新创造出一个类似外在世界的**“虚拟现实”,而我们的感官经验,就是这个虚拟现实**,我们也只能直接接触到这个虚拟现实,由此可见,我们所谓的真实世界,其实只是真实世界在(大脑所创造出来的)虚拟现实里的映射而已。
所以,为什么——明明知道是假的也会害怕、明明知道小概率也会恐慌,明明知道不可能也会担心、明明知道想多了也会烦恼——因为你**“活在”大脑为你创造的虚拟现实之中,自我所触及的一切都只是模型与模拟**。
就此,赫拉利在**《今日简史》中,洞见到了“内观冥想”**的奥秘,即:
“内观技巧背后的道理,是认为心智的流动与身体的感觉密切相关。我和这个世界之间隔着的是身体的感觉。我真正反应的对象不是外界事件,而是自己身体的感觉。”
那么可以说,虚拟现实 = 颅内模型 + 颅内模拟——其中模型是抽象(对过去的简化建模),模拟是预测(对未来的逻辑计算),所以虚拟现实是对未来的抽象预测,即:简化逻辑的建模计算。
而从物理学角度来看,我们在真实世界里的生活,只是一堆原子与另一堆原子相互作用,没有**“色受想行识”,只有运动与作用,然后通过(由光子与分子传递的)抽象信息,一堆原子的运动模拟了另一堆原子的运动,就形成了模型**,最后大脑根据各种模型,虚拟出了多姿多彩的一切**“现实”**。
可见,我们对真实的感知,必须经过抽象信息所支撑的简化模型,所以大脑必须竭尽全力地去相信和维护自己的模型,而模型只能感知到抽象信息而不是真实世界,但它却是我们赖以生存的唯一交互界面与交互工具。
所以,你看到的一切都只是模型,你在别人颅内也只是一个模型,而你的本质就是你的认知模型,它是你与真实世界的交互模式——代表着你过去的积累、现在的表现、以及未来的发展。
换言之,你的一切行为和价值都来自于你的认知模型,塑造你的认知模型就是塑造你本身,你就是你的认知模型。
而所有人与世界的关系,就在于思想与模型之间循环的相互作用,即:世界因为思想而改变,思想因为模型而改变,模型因为世界而改变。
试想,人脑为什么可以想象出还不存在的事物呢?为什么宇宙规律不去限制人脑对永动机的想象呢?
原因就在于,人脑是在利用宇宙输入的环境信息,自行去模拟一个虚拟现实的**“颅内宇宙”,这个宇宙随机出了“颅外宇宙”所没有的信息组合——可以说这是不同的“平行宇宙”**。
那么,在模型之上的层面,“故事”就是集模型之大成的“非常模拟”,透过虚拟的**“故事现实”,我们将会体验到一个极其逼真的“文明世界”**。
再从演化角度来看(演化之中蕴含着进化),进化是以生存为目标的求存,而不是以看清真相为目标的求真——所以,大脑构建出虚拟世界的模型模拟就不足为奇到顺理成章了——在认知心理层面,表现出的就是**“事实扭曲立场”**,即把事实扭曲为立场。
而在物理之上、模型之下的生化层面,我们可以将各种神经递质,视为微剂量的颅内**“神经虚拟现实”的“调节参数”——因为它们可以左右、改变和扭曲,我们对真实世界的感知、体验和理解——尤其苯乙胺与色胺**,可谓是“超频参数”,因为它们可以创造出罕见独特的精神世界。
据此可见,某种人造**“激素盒子”就可以通过调节“激素与递质”的参数,渲染出极其逼真的——颅内模型与颅内模拟**,所以**“激素盒子”就是我们的“神经虚拟现实”,也就是我们的“生物学现实”**,即:
激素盒子 = 颅内模型 + 颅内模拟 = 神经虚拟现实 = 生物学现实。
或许更一般地说,当人造虚拟现实,提供了足够“以假乱真”的环境信息时,神经现实就会认为这是物理现实,这可以被称为——“生物学强等效原理”。
是的,大脑用什么去分辨虚拟与现实呢?眼见就一定为实吗?
布莱森在**《人体简史》中,说道:“大脑的一大悖论是,你对世界所知的一切,都来自一个从未亲眼见过**这个世界的器官。”
这准确体现了虚拟现实的——“虚拟法则”,即:万物皆模拟,一切皆计算。
主题相关文章: