从生物信息角度:深度理解“少即是多”的8个含义
少即是多——是由建筑大师路德维希·密斯·凡德罗提出的——Less is More。
但后来,这个理念从建筑设计,被延伸到了其它各个领域——包括生活的方方面面,并且得到了人们广泛的实践和认可。
而其背后的奥义,还有着很多相似的概念——比如:断舍离、做减法、舍即是得、极简主义、精要主义、化繁为简等等,另外:
- 列奥纳多·达芬奇,就曾说过:大繁至简(Simplicity is The Ultimate Form of Sophistication)。
- 老子在道德经里,也曾说过:少则得,多则惑。
- 乔布斯注入苹果的设计理念:正是少即是多。
这一切似乎都在说明,少比多更好,简单比复杂更好,并且少可以变成多,简单可以超越复杂。
而少即是多——就是一个充满哲理、具有指导意义、可实践、可获得收益和力量的经验总结。
本文,我们将会从8个不同的角度去看看,少即是多的生物信息原理是什么,其背后少的是什么,多的是什么,并且少又是如何变成了多的?
相信本文的视角,将会揭秘少即是多的奥义所在。
主题目录如下:
- 1,信息处理效率
- 2,信息处理模式
- 3,有效信息量
- 4,关键信息权重
- 5,信息抽象压缩
- 6,想象力
- 7,从量变到质变
- 8,第一原理
- 结语
- 后记:新算法
1,信息处理效率
人脑在一定时间内处理的信息量是有限的,更多的信息,如果超过了人脑处理能力的极限,就会造成信息处理效率的急剧下降。
当然,每个人单位时间内处理信息量的阈值是不一样的,但只要超过了阈值,接下来——更多的信息就意味着更少的处理,而更少的信息则能够处理完全,这就相当于获得了更多的处理。
事实上,“多”——无论是什么,其本质最终都要转化为更多的信息,需要人脑去处理。
而更多的信息,就会形成信息压力,对大脑的处理效率造成冲击,形成负担,接着就是降低效率,最后连正常的处理水平也无法达到。
可见,这里少的是信息量,多的则是信息处理量。
而这在信息论中,其实是对香农第二定理的服从和应用,因为理论表明,超过**“大脑带宽”的信息传输,其信息编码的错误率是100%的(即大脑是无法处理的),而合理降低信息传输率(即单位时间内的信息量),则可以正确传输信息(即大脑是可以处理的)——注意,“大脑带宽”**受到诸多生物学因素影响,是动态的。
香农第二定理——是指信息的传输率不可能超过信道的容量,这个容量上限即带宽。
所以,更少的信息,我们就可以获得更多的处理结果,而更多的信息——尤其是超过了处理阈值,我们就会得到越来越少的处理结果。
而从宏观来看,人脑对信息的处理过程就是——理解、联想和判断,对信息的处理结果就是——选择和记忆。
那么,高效的信息处理,就会让我们感觉到:更容易的理解、更多的联想、更清晰的判断、更合理的选择、和更深刻的记忆——而这些就是我们想要的“多”,也是对我们有益的“多”。
2,信息处理模式
成人的大脑占自身体重的2%,但每天却要消耗掉20%的全部能量。这是为了支撑人类智能——860亿个脑细胞的正常工作,所必须要付出的代价。
然而,这么多密集的脑细胞,其静息电位的能量消耗就十分高昂,也就是说人脑在不进行任何信息处理时,就会消耗掉(20%中的)大量能量。
静息电位(Resting Potential)——是指细胞膜未受刺激时,存在于细胞膜内外两侧的外正内负的电位差。它是一切生物电产生和变化的基础。
那么这样,留给神经元细胞放电——以传递和处理信息的能量,就十分有限。结果就导致了,即使是在大脑的某一区域,一小部分神经元细胞被激活,其峰值的能量消耗,都会让大脑剩余的能量供给,无法长时间负担。
因此,大脑不得不进化出了高效的能量利用模式——就是用更少的脑细胞,在更短的激活时间内,传递更多的信息。
也就是说:
- **首先,**大脑能不激活脑细胞,就不激活脑细胞;
- **其次,**大脑为了完成信息传递,会选择脑细胞激活最少的路径;
- **最后,**被激活的脑细胞,会尽可能的以最快的速度恢复到“静息”状态。
而在数学上,这种信息处理的模式被称为——稀疏编码。
稀疏编码(Sparse Coding)——就是找到一组基向量 ,使得我们能将输入向量表示为这些基向量的线性组合。其优点在于:存储能力大,具有联想记忆能力,并且计算简便,使自然信号的结构更加清晰。其结果,既符合生物进化普遍的能量最小经济策略,又能满足电生理实验的结论。
那么,在宏观上,人脑的思维模式必然就会受到底层系统的制约,于是:
第一,为了减少激活。
这会让人们不喜欢主动思考,不喜欢复杂性的思考——需要长时间激活,不喜欢需要更多脑细胞的思考——比如处理关联性低的信息或是不同种类的信息——这时需要不同区域的更多脑细胞被激活。
并且,找到差不多的“答案”,就会立马停止思考——因为此时激活脑细胞的数量更少。所以,最终表现出的就是,人们倾向于缺少主观能动性。
第二,为了更短的激活路径。
这会让人们的思维、推理、以及联想,喜欢走捷径、排斥复杂、接受将就,并且找到自认为差不多的“答案”就会立刻停止思考,而不倾向于刨根问底的寻找“确切”——因为此时激活路径更短。
所以,最终表现出的就是,人们下意识和不自知的选择和偏好。
就像几乎所有人,都喜欢金钱(至少没有不喜欢的),但金钱只是一种货币和符号,是人类文明共同所编制的故事,其绝对不是人们喜欢的本质。
- 而更多的思考,就会发现人们喜欢的其实是金钱所购买的产品或服务(包括安全感);
- 接着更多思考,就会发现其实喜欢的是使用产品或服务的时候,体内上演的生化反应和电化学风暴;
- 再继续思考,就会发现人们是被本能所驱使的,本能是基因编写的算法,基因是进化的产物,进化是宇宙演化方向的产物,宇宙的演化的方向是能量转化,那宇宙的最终目的是什么呢……?这就是科学家需要思考的问题了。
所以,科学家是可以在实验室或研究所里,对抗大脑的**“捷径感”,但在生活中就未必了。而大部分人,还是倾向于简单的把金钱与喜欢直接划上——“捷径的等号”**。
试想,给一个人很多钱,但是不给他用,他还会喜欢吗?不排除有些人看到金钱,体内就产生化学反应,但这只是长期的**“捷径感”**,所训练出来的条件反射。
第三,为了尽快恢复静息态。
这会让人们的记忆除非不断强化,否则就很容易遗忘,并且不擅长处理关联性低的不同信息,以及同时或穿插,执行不同种类的任务。
因为当需要用到不同区域、跨度距离较远的脑细胞时,就会消耗更多能量,就很难长时间同时维持激活放电的状态。
于是,这就有可能会造成,必要的一部分脑细胞已经静息了,另外必要的一部分才开始激活,更或是在同时激活的过程中,一部分脑细胞被强行(无法控制且不自知的)静息了。
而如果这样,信息路径就会形成短路,结果就是信息处理能力和效率的随机快速下降——最终表现出的就是,人们主动却不擅长。
当然,经过训练,是可以稍稍克服以上问题的,但无法彻底解决生理限制(除非修改基因或上传意识到机器里)。
而大部分人,在大部分情况下,注意力都十分有限,一次只能关注一个焦点,无法有效进行多任务、不同种类信息的处理,并且无时无刻不倾向于选择“捷径”,忽视“真相”,停止一时无果的思考,放弃一时无法解决的问题,等等。并且这些下意识的偏好选择机制,都在虚幻确定感的包裹下,让人不易察觉和不自知。
或许,天才大脑的能量供给水平——代表了血管分布密度和血流量,脑细胞的激活耗能和持续时间——与常人有所不同,才产生了更高效的大脑利用率,以及更深层次的大脑开发度。
所以,我们可以看到,更少的信息:减少了选择判断、降低了复杂度——包括信息的种类、关联性和数据量,**从而得到了更多的:注意力、专注力、处理时间、处理意愿和信心、以及因为擅长(符合大脑信息处理的模式)**所带来的效率和正确率——这又会反作用于人们的处理意愿和信心,从而增加处理时间,和更容易克服“捷径感”,让人一路坚持和探索,最后找到一个更“正确”的结果。
可见,这里少的是信息的复杂度,多的则是信息处理的正确率。
也就是说,更少往往意味着简单容易理解,并且也容易做到正确,和判断正确;更多则意味着复杂难懂,这意味着潜在的错误、误解、和无法做到正确;所以,更少更接近正确,更多则更接近错误,而正确更多才是我们想要的“多”,也是对我们有益的“多”。
3,有效信息量
更多的信息,如果处理不过来就是更少的结果,而更多的处理结果,如果不能保证正确率就没有任何意义。
**但如果我们通过训练大脑,可以做到处理更多的信息,并且还保持较高的正确率呢?**这样是不是更多的信息,就比更少的信息,更好了?
事实上并不是,因为信息越多,其无效信息也就更多,大量的信息必然会夹杂着更多的信息噪声。
噪声和噪音,意义相同,可以混用。但在通信领域主要使用噪声,通俗口语使用噪音。而从某种角度来看,噪音来自于人类(或主观想象的,如余音绕梁),噪声来自于物体(或客观存在的,如声声入耳)。
这些信息噪声,不仅会影响信息处理的效率和正确率,还会耗费大量的能量(包括体力和精力),但却不能产出合理的效果。那么,此时就不如去执行其它不同类型的任务,或处理不同类型的信息,来的更加合理高效。
**这里的有效信息量,也是二八定律的一个体现,**在处理的所有信息之中,关键有用的信息可能只是那少数的20%,而剩下的80%都是不重要的干扰信息、无用信息,和低价值信息。
但我们不得不从大量的信息中,找出那至关重要的20%的信息。于是,显然这里就有一个筛选信息的最佳“性价比”。
这个“性价比”是一个平衡点,其影响因素在于:大脑的信息处理模式和信息处理效率、体力精力、以及信息量的规模,甚至还有有效信息其自身的价值。
但无论如何,在这个平衡点之后,处理更多的信息,都只会让行动付出和收获成反比。
可见,这里少的是信息处理总量,多的是有效信息量的比率。
比如,就像搜索引擎根据关键字,给我们的是几百页的相关信息,但我们只会看前几页,并且往后面看的越多,得到有用信息就越少。
再比如,10000条留言、评论、私信、邮件,我们并不会每条都看,或许里面有重要的信息,但如果花时间看完所有,必然就会影响我们去处理其它的信息,而两者产生的效果对比,根据二八定律,显然我们会失去的更多——因为未处理的信息里有20%的有效信息,经过处理的信息里远远小于20%的有效信息。
那么,再试想,是10万条信息呢?是100万条、1000万条呢?我们必然会毫不犹豫的,放弃处理所有这些信息的念头——否则浪费的就是我们的人生和生命。
所以,显然少处理一些信息,就会获得更多的有效信息比率。
同时可以想象,**断舍离或是做减法,其潜在的好处——就是在剔除更多的无效信息,**并且无效信息可能还隐藏着错误,那么剔除无效信息,也就意味着是在剔除错误。
事实上,信息处理越简单越好,复杂会导致意想不到的连锁反应——就是错误,并且我们试图去干预和控制复杂,就会更容易导致不可预测的结果,从而让错误变的更糟和难以控制。
而在数学上,也能找到对应的体现:
例如,算式:(x^2 - 1 ) / (x - 1),当x = 1时,如果我们直接代入,则就会得到 0 / 0 这个无意义的结果。但如果我们对算式进行简化,以剔除冗余的无效信息,则就会得到一个新的算式:(x + 1)(x - 1) / (x - 1) = x + 1,那么此时再代入x = 1,就可以得到有意义的结果2。
接着,另一个递进的好处即是:如果提高了有效信息的比率,就会很好的顺应并配合了——大脑的信息处理模式和信息处理效率——这就会更容易得到我们想要的正确。
显然,综上可见,更多的“有效信息比率”,才就是我们想要的“多”,也是对我们有益的“多”。
4,关键信息权重
从某种角度来看二八定律,其实是**“少的”20%,占用或决定了“多的”**80%,例如:
- 20%的富豪,拥有了80%的财富,
- 20%的员工,导致了80%的问题,
- 20%的客户,带来了80%的收入,
- 20%的大病,消耗了80%的积蓄,
- 20%的努力,产生了80%的效果,
- 20%的权力,控制了80%的人口,
- 以及等等。
由此可以看出,二八定律正是说明了少即是多——这里少的是数量,多的是权重,即少数控制了多数。
正如俗语所说,让人无法抵达远方的,往往不是遥远与曲折,而是你鞋子里的小石子——显然,石子虽然看起来“少”,但其拥有的影响权重却是“多”。
对此,塔勒布在**《反脆弱》**中,就坚确地指出:“对系统进行1%的改善,可以降低99%的脆弱性(或增加反脆弱性),只需几个步骤,很少的几个步骤,并往往以较低的成本,就能使事情变得更好、更安全。”
所以,在二八定律的框架下,我们更应该做的就是——把握住“少的”高权重信息,以获得“多的”我们想要的结果。
那为什么二八定律会无处不在?——这是因为我们的世界,其本质规律之一,是遵循——幂次法则的。
具体解读参看——主题相关文章[3]。
5,信息抽象压缩
事实上,更少的信息,不一定代表着信息量少,或是有效信息量少,而还可能是信息经过了高度的抽象压缩,令其中包含着丰富的有效信息。
- 比如,一本很厚的书,经过反复的阅读,就会让人在心理上觉得这本书变薄了。
- **比如,**电脑上的压缩文件尺寸很小,但解压后其内容尺寸却可以很大。
- **比如,**数学物理公式可以简洁又优雅,但却同时可以蕴含着丰富又深邃的内涵。
- **比如,**圆周率π一个字母的信息,用具体数字表示,可以算到几百亿位,并且其数字序列随机毫无规律,可能蕴含着无限的信息(正规数特质)。
- **比如,**我们可以用一段话,抽象概括:一本书,一部电影,一个人的一生,一个时代,甚至是文明历史,等等。并且还能让人们对这段话所传递出的信息,达成某种共识。
这些都说明了,信息是可以抽象压缩的,而学习知识的过程,就可以看成是把信息,抽象压缩到大脑神经网络结构之中的过程。
可见,这里少的是信息的空间,多的则是信息的密度。
而高密度的抽象压缩信息,其实代表的就是删繁就简,去除一切不必要的繁杂,并且在纷繁、混乱与无序之中建立高度的有序。
这也就是做减法的意义,追求简洁的意义——获得高密度的有序,这其中隐藏的是丰富与精妙。
为什么说,完美的设计——不是无法再增加一样特性,而是无法再去掉任何一个特性——因为这就是高密度的抽象信息压缩,所代表的高度有序。
而这种高度有序,不仅是信息高效处理和传递的“捷径”,也是人们达成合作与共识,所必要的上下文背景。所以,这种高度有序,就是我们想要的“多”。
另外,当信息高度有序时,其结果也是在——剔除更多的无效信息和可能的错误,提高有效信息的比率。
6,想象力
更少的信息,其潜在特性就是——留白,而留白则就给想象力留下,可以自由发挥的空间和可能。
试想一下,小说 => 漫画 => 动画 => 3D动画 => 真人电影,这个变化过程中的区别与感受。
事实上,这个过程,就是**一个留白不断减少,由抽象到具体,由想象到现实的一个过程。**在这个过程中,想象力发挥的自由度越来越少,信息的传递越来越多,也越来越丰富。
所以说,小说不仅靠作者的想象力,也靠读者的想象力,两者合作,才能在大脑里创造一个虚幻的世界——并且作者与读者,每个人大脑里的世界都是一个独一无二与众不同的世界——这个世界关联并掺杂着一个人点点滴滴的独特经历。
而电影,在很大程度上则依靠编剧、演员、场景与特效一起构建出一个具体的唯一的世界。观影过程中,观众想象力能有所作为和脑补的地方并不多。
可见,一个电影有想象力可以与观众无关,而一个小说有想象力,其实能体验到小说想象力的时候,每个读者都已经用自己的想象力参与其中了——甚至有时读者还能体验到,连作者都无法想象和感知到的元素。
另外,如果一个信息是抽象压缩的,那么在大脑里进行解压信息的时候,想象力也必然会参与到其中,并起到影响结果的至关重要的作用。
同时,这也说明了,信息的解压未必就有完全一致的结果,人脑不是计算机,无法精确的做到复制拷贝和粘贴,所以人脑进行信息处理的过程中,必然会伴随着信息的突变——而这就是一种在智能之间传播的信息,称之为文化基因(meme)。
事实上,进化正在从基因信息的进化,慢慢转向了文化基因的进化。
所以,这里少的是具体,多的则是想象力。
然而,很多时候,少给人简单的感觉,不容易受到重视,并且人们还喜欢用复杂的方法(捷径带来的负效应,由“将就”积累出的无序和混乱),试图去解决简单的问题,这是行不通的(有序无序不兼容,路径不对),反而还会一无所获。
但如果能够重视更少,并用想象力去处理显而易见的更少——留白和抽象信息,或许反而就会获得更多——想象力带来的正效应。
那么显然,更多的想象力,才是我们想要的“多”,也是对我们有益的“多”。 也因此,有时看不清比看得清看的更广阔,甚至更清晰。
7,从量变到质变
万事万物,从量变到质变,从0到1,从少到多,这是一个积累的过程,也是任何人都无法避役的一个过程。
结合前面的观点可知:“少”——其实就是我们能够处理,并能够更好处理的量变——其中(抽象信息)甚至还可能蕴藏着未知的力量与精妙——代表着信息的排列组合。
而量变,则是我们必须要经历的步骤——或说是路径。因为只有经历了量变,才有可能来到质变,而得到了质变,才能会带来翻天覆地的变化——产生幂次增长,而这就是变革与进化的结果。
那么,如果不断的重复这个从0到1,从量变到质变的过程,就会不断的抵达质变,从而更快的创造、更快的推动、和更快的发展——最后得到我们想要的一切。
由此可见,这里少的是停滞,多的则是积累——因为少的变化,能够获得正确,积累量变; 多的变化,更大概率的获得错误(包括路径与方向),停滞不前。
而积累量变产生质变,就会带来深入、精通与专业,这显然就是我们想要的“多”,也是对我们有益的“多”。
而试错,也会带来积累,但最终我们积累的还是正确,从错误中获得的正确。因为错误中隐含着正确的信息,并且排除掉错误的路径,就会更接近正确的路径。但无论如何,错误在宏观上,是在原地停滞。
另外,如果我们减少了停滞,增加了积累,但却把积累分散到了各个领域或方面,那么这样每个积累就都难以产生出质变,结果更多的积累,却没有产生出更多的质变,最后反而变成了多而全、广而不专的情况。
那么这时,我们就需要减少积累的广度,增加积累的深度,以促使质变的产生。
所以,这里少的是广度,多的则是深度。
但这个少和多并不是绝对的好或坏——主要在于个人的取舍,因为社会分工需要深度与广度,局部与整体,微观与宏观,工匠与政客,产品与管理等等,一起并存合作与协作。
8,第一原理
事实上,所有的一切——万事万物,都是由同样的信息比特,在自然演化的算法下,一步步在宏大时间的作用下,从简单到复杂,逐渐进化所形成的。
宇宙擅长应用简单、重复的基本操作,作用在不同的简单信息结构之上,来产生不同的复杂结果。
那么,这里**“少”——就是第一原理中的基本法则或算法,“多”**——就是由第一原理法则所构建的上层(任意复杂度的)结构。
第一原理(First Principle)——是一个最基本的命题或假设,不能被省略或删除,也不能被违反——相当于是在数学中的公理。而在物理中,是指从头计算,不需要任何参数,只需要一些基本的物理常量,就可以得到体系基态的基本性质。
- 就像,利用薛定谔方程,在一些近似方法下解电子结构,但不从实验数据得到拟合参数的从头计算法。
- 就像,人类的手构造简单——只有四个手指和一个大拇指,但它却足以被智能所驱动,从而制作和使用各种工具。
最后,万物皆比特。
具体解读参看——主题相关文章[4]。
结语
本文一共从8个方面的视角,探讨了少即是多(Less is More)的内涵和意义。
- **信息处理效率:**少的是信息量,多的是信息处理量。
- **信息处理模式:**少的是信息的复杂度,多的是信息处理的正确率。
- **有效信息量:**少的是信息处理总量,多的是有效信息量的比率;少的是无效信息,多的是有效信息;少的是可能的错误,多的是更多的正确。
- **关键信息权重:**少的是信息数量,多的是信息权重。
- **信息抽象压缩:**少的是信息的空间,多的是信息的密度;少的是无序,多的是有序;少的是错误,多的是正确。
- **想象力:**少的是具体信息,多的是想象信息;少的是已有,多的是创造;少的是固定,多的是发散;少的是约束,多的是自由。
- **从量变到质变:**少的是停滞,多的则是积累;少的是广度,多的则是深度。
- **第一原理:**少的是基础算法,多的则是万物的构造。
可以想象,对于少即是多,肯定还有很多其它的视角和解读,是本文没有涉及和想到的。
例如,塔勒布在**《反脆弱》**中认为,“少即是多:一方面,研究得越多,就越容易忽略基础但根本的事情;另一方面,行动能将事情剥丝抽茧,直至剩下尽可能简单的模型。”——换言之,少研究多行动,就能够获得对基础根本事情尽可能简单的模型。
例如,灭霸的“宇宙生命五折计划”——可能就是在试图使用**“少即是多”**的原则,来恢复宇宙的和谐与秩序。
最后,非常有趣的是,“少即是多”尽然会有这么的内涵和意义,而其本身又是如此的简洁又充满哲理,这似乎正充分体现了:少即是多——其本身也就是——少即是多。
更或许,**“少即是多”**不仅是真理的形式,也是真理本身。
后记:新算法
现实,往往是可选择的少;而理想,往往则是不可选则的多,并且事后的不可选在事前看起来常常都是可选。
例如,一个成功率较高的约会匹配算法,即是:屏蔽掉概率低的“可选”理想,专注于概率高的“可选”现实。
换言之,“系统”根本就不应该,向用户展示更多的“理想型”,而应该让用户只能看到更少的“现实型”——也就是,用算法去引导用户完成注意力、选择、及付出有效分配的**“少即是多”**。
其实这里**“少即是多”**的内核,还是前文所提到的——有效信息量,即:少的是无效信息,多的是有效信息。
那么,如果现实是选择多,那么理想会变成选择少吗?还是更多?
我们的本能,演化于(可使用)资源稀缺的时代,所以我们的理想无关现实永远是多,或说是我们的欲望无关拥有永远是多,多肯定有其益处,但凡事有度过犹不及,而**“少即是多”就是——智能站在本能之上,演化出的应对现在及未来资源富足时代的——“新算法”**。