从生物信息角度：深度理解“少即是多”的8个含义

发表于： 2022-01-05 分类于：知乎

字数： 8874 阅读：≈ 18分钟浏览：

少即是多——是由建筑大师路德维希·密斯·凡德罗提出的——Less is More。

但后来，这个理念从建筑设计，被延伸到了其它各个领域——包括生活的方方面面，并且得到了人们广泛的实践和认可。

而其背后的奥义，还有着很多相似的概念——比如：断舍离、做减法、舍即是得、极简主义、精要主义、化繁为简等等，另外：

列奥纳多·达芬奇，就曾说过：大繁至简（Simplicity is The Ultimate Form of Sophistication）。
老子在道德经里，也曾说过：少则得，多则惑。
乔布斯注入苹果的设计理念：正是少即是多。

这一切似乎都在说明，少比多更好，简单比复杂更好，并且少可以变成多，简单可以超越复杂。

而少即是多——就是一个充满哲理、具有指导意义、可实践、可获得收益和力量的经验总结。

本文，我们将会从8个不同的角度去看看，少即是多的生物信息原理是什么，其背后少的是什么，多的是什么，并且少又是如何变成了多的？

相信本文的视角，将会揭秘少即是多的奥义所在。

主题目录如下：

1，信息处理效率
2，信息处理模式
3，有效信息量
4，关键信息权重
5，信息抽象压缩
6，想象力
7，从量变到质变
8，第一原理
结语
后记：新算法

1，信息处理效率

人脑在一定时间内处理的信息量是有限的，更多的信息，如果超过了人脑处理能力的极限，就会造成信息处理效率的急剧下降。

当然，每个人单位时间内处理信息量的阈值是不一样的，但只要超过了阈值，接下来——更多的信息就意味着更少的处理，而更少的信息则能够处理完全，这就相当于获得了更多的处理。

事实上，“多”——无论是什么，其本质最终都要转化为更多的信息，需要人脑去处理。

而更多的信息，就会形成信息压力，对大脑的处理效率造成冲击，形成负担，接着就是降低效率，最后连正常的处理水平也无法达到。

可见，这里少的是信息量，多的则是信息处理量。

而这在信息论中，其实是对香农第二定理的服从和应用，因为理论表明，超过**“大脑带宽”的信息传输，其信息编码的错误率是100%的（即大脑是无法处理的），而合理降低信息传输率（即单位时间内的信息量），则可以正确传输信息（即大脑是可以处理的）——注意，“大脑带宽”**受到诸多生物学因素影响，是动态的。

香农第二定理——是指信息的传输率不可能超过信道的容量，这个容量上限即带宽。

所以，更少的信息，我们就可以获得更多的处理结果，而更多的信息——尤其是超过了处理阈值，我们就会得到越来越少的处理结果。

而从宏观来看，人脑对信息的处理过程就是——理解、联想和判断，对信息的处理结果就是——选择和记忆。

那么，高效的信息处理，就会让我们感觉到：更容易的理解、更多的联想、更清晰的判断、更合理的选择、和更深刻的记忆——而这些就是我们想要的“多”，也是对我们有益的“多”。

2，信息处理模式

成人的大脑占自身体重的2%，但每天却要消耗掉20%的全部能量。这是为了支撑人类智能——860亿个脑细胞的正常工作，所必须要付出的代价。

然而，这么多密集的脑细胞，其静息电位的能量消耗就十分高昂，也就是说人脑在不进行任何信息处理时，就会消耗掉（20%中的）大量能量。

静息电位（Resting Potential）——是指细胞膜未受刺激时，存在于细胞膜内外两侧的外正内负的电位差。它是一切生物电产生和变化的基础。

那么这样，留给神经元细胞放电——以传递和处理信息的能量，就十分有限。结果就导致了，即使是在大脑的某一区域，一小部分神经元细胞被激活，其峰值的能量消耗，都会让大脑剩余的能量供给，无法长时间负担。

因此，大脑不得不进化出了高效的能量利用模式——就是用更少的脑细胞，在更短的激活时间内，传递更多的信息。

也就是说：

**首先，**大脑能不激活脑细胞，就不激活脑细胞；
**其次，**大脑为了完成信息传递，会选择脑细胞激活最少的路径；
**最后，**被激活的脑细胞，会尽可能的以最快的速度恢复到“静息”状态。

而在数学上，这种信息处理的模式被称为——稀疏编码。

稀疏编码（Sparse Coding）——就是找到一组基向量，使得我们能将输入向量表示为这些基向量的线性组合。其优点在于：存储能力大，具有联想记忆能力，并且计算简便，使自然信号的结构更加清晰。其结果，既符合生物进化普遍的能量最小经济策略，又能满足电生理实验的结论。

那么，在宏观上，人脑的思维模式必然就会受到底层系统的制约，于是：

第一，为了减少激活。

这会让人们不喜欢主动思考，不喜欢复杂性的思考——需要长时间激活，不喜欢需要更多脑细胞的思考——比如处理关联性低的信息或是不同种类的信息——这时需要不同区域的更多脑细胞被激活。

并且，找到差不多的“答案”，就会立马停止思考——因为此时激活脑细胞的数量更少。所以，最终表现出的就是，人们倾向于缺少主观能动性。

第二，为了更短的激活路径。

这会让人们的思维、推理、以及联想，喜欢走捷径、排斥复杂、接受将就，并且找到自认为差不多的“答案”就会立刻停止思考，而不倾向于刨根问底的寻找“确切”——因为此时激活路径更短。

所以，最终表现出的就是，人们下意识和不自知的选择和偏好。

就像几乎所有人，都喜欢金钱（至少没有不喜欢的），但金钱只是一种货币和符号，是人类文明共同所编制的故事，其绝对不是人们喜欢的本质。

而更多的思考，就会发现人们喜欢的其实是金钱所购买的产品或服务（包括安全感）；
接着更多思考，就会发现其实喜欢的是使用产品或服务的时候，体内上演的生化反应和电化学风暴；
再继续思考，就会发现人们是被本能所驱使的，本能是基因编写的算法，基因是进化的产物，进化是宇宙演化方向的产物，宇宙的演化的方向是能量转化，那宇宙的最终目的是什么呢……？这就是科学家需要思考的问题了。

所以，科学家是可以在实验室或研究所里，对抗大脑的**“捷径感”，但在生活中就未必了。而大部分人，还是倾向于简单的把金钱与喜欢直接划上——“捷径的等号”**。

试想，给一个人很多钱，但是不给他用，他还会喜欢吗？不排除有些人看到金钱，体内就产生化学反应，但这只是长期的**“捷径感”**，所训练出来的条件反射。

第三，为了尽快恢复静息态。

这会让人们的记忆除非不断强化，否则就很容易遗忘，并且不擅长处理关联性低的不同信息，以及同时或穿插，执行不同种类的任务。

因为当需要用到不同区域、跨度距离较远的脑细胞时，就会消耗更多能量，就很难长时间同时维持激活放电的状态。

于是，这就有可能会造成，必要的一部分脑细胞已经静息了，另外必要的一部分才开始激活，更或是在同时激活的过程中，一部分脑细胞被强行（无法控制且不自知的）静息了。

而如果这样，信息路径就会形成短路，结果就是信息处理能力和效率的随机快速下降——最终表现出的就是，人们主动却不擅长。

当然，经过训练，是可以稍稍克服以上问题的，但无法彻底解决生理限制（除非修改基因或上传意识到机器里）。

而大部分人，在大部分情况下，注意力都十分有限，一次只能关注一个焦点，无法有效进行多任务、不同种类信息的处理，并且无时无刻不倾向于选择“捷径”，忽视“真相”，停止一时无果的思考，放弃一时无法解决的问题，等等。并且这些下意识的偏好选择机制，都在虚幻确定感的包裹下，让人不易察觉和不自知。

或许，天才大脑的能量供给水平——代表了血管分布密度和血流量，脑细胞的激活耗能和持续时间——与常人有所不同，才产生了更高效的大脑利用率，以及更深层次的大脑开发度。

所以，我们可以看到，更少的信息：减少了选择判断、降低了复杂度——包括信息的种类、关联性和数据量，**从而得到了更多的：注意力、专注力、处理时间、处理意愿和信心、以及因为擅长（符合大脑信息处理的模式）**所带来的效率和正确率——这又会反作用于人们的处理意愿和信心，从而增加处理时间，和更容易克服“捷径感”，让人一路坚持和探索，最后找到一个更“正确”的结果。

可见，这里少的是信息的复杂度，多的则是信息处理的正确率。

也就是说，更少往往意味着简单容易理解，并且也容易做到正确，和判断正确；更多则意味着复杂难懂，这意味着潜在的错误、误解、和无法做到正确；所以，更少更接近正确，更多则更接近错误，而正确更多才是我们想要的“多”，也是对我们有益的“多”。

3，有效信息量

更多的信息，如果处理不过来就是更少的结果，而更多的处理结果，如果不能保证正确率就没有任何意义。

**但如果我们通过训练大脑，可以做到处理更多的信息，并且还保持较高的正确率呢？**这样是不是更多的信息，就比更少的信息，更好了？

事实上并不是，因为信息越多，其无效信息也就更多，大量的信息必然会夹杂着更多的信息噪声。

噪声和噪音，意义相同，可以混用。但在通信领域主要使用噪声，通俗口语使用噪音。而从某种角度来看，噪音来自于人类（或主观想象的，如余音绕梁），噪声来自于物体（或客观存在的，如声声入耳）。

这些信息噪声，不仅会影响信息处理的效率和正确率，还会耗费大量的能量（包括体力和精力），但却不能产出合理的效果。那么，此时就不如去执行其它不同类型的任务，或处理不同类型的信息，来的更加合理高效。

**这里的有效信息量，也是二八定律的一个体现，**在处理的所有信息之中，关键有用的信息可能只是那少数的20%，而剩下的80%都是不重要的干扰信息、无用信息，和低价值信息。

但我们不得不从大量的信息中，找出那至关重要的20%的信息。于是，显然这里就有一个筛选信息的最佳“性价比”。

这个“性价比”是一个平衡点，其影响因素在于：大脑的信息处理模式和信息处理效率、体力精力、以及信息量的规模，甚至还有有效信息其自身的价值。

但无论如何，在这个平衡点之后，处理更多的信息，都只会让行动付出和收获成反比。

可见，这里少的是信息处理总量，多的是有效信息量的比率。

比如，就像搜索引擎根据关键字，给我们的是几百页的相关信息，但我们只会看前几页，并且往后面看的越多，得到有用信息就越少。

再比如，10000条留言、评论、私信、邮件，我们并不会每条都看，或许里面有重要的信息，但如果花时间看完所有，必然就会影响我们去处理其它的信息，而两者产生的效果对比，根据二八定律，显然我们会失去的更多——因为未处理的信息里有20%的有效信息，经过处理的信息里远远小于20%的有效信息。

那么，再试想，是10万条信息呢？是100万条、1000万条呢？我们必然会毫不犹豫的，放弃处理所有这些信息的念头——否则浪费的就是我们的人生和生命。

所以，显然少处理一些信息，就会获得更多的有效信息比率。

同时可以想象，**断舍离或是做减法，其潜在的好处——就是在剔除更多的无效信息，**并且无效信息可能还隐藏着错误，那么剔除无效信息，也就意味着是在剔除错误。

事实上，信息处理越简单越好，复杂会导致意想不到的连锁反应——就是错误，并且我们试图去干预和控制复杂，就会更容易导致不可预测的结果，从而让错误变的更糟和难以控制。

而在数学上，也能找到对应的体现：

例如，算式：(x^2 - 1 ) / (x - 1)，当x = 1时，如果我们直接代入，则就会得到 0 / 0 这个无意义的结果。但如果我们对算式进行简化，以剔除冗余的无效信息，则就会得到一个新的算式：(x + 1)(x - 1) / (x - 1) = x + 1，那么此时再代入x = 1，就可以得到有意义的结果2。

接着，另一个递进的好处即是：如果提高了有效信息的比率，就会很好的顺应并配合了——大脑的信息处理模式和信息处理效率——这就会更容易得到我们想要的正确。

显然，综上可见，更多的“有效信息比率”，才就是我们想要的“多”，也是对我们有益的“多”。

4，关键信息权重

从某种角度来看二八定律，其实是**“少的”20%，占用或决定了“多的”**80%，例如：

20%的富豪，拥有了80%的财富，
20%的员工，导致了80%的问题，
20%的客户，带来了80%的收入，
20%的大病，消耗了80%的积蓄，
20%的努力，产生了80%的效果，
20%的权力，控制了80%的人口，
以及等等。

由此可以看出，二八定律正是说明了少即是多——这里少的是数量，多的是权重，即少数控制了多数。

正如俗语所说，让人无法抵达远方的，往往不是遥远与曲折，而是你鞋子里的小石子——显然，石子虽然看起来“少”，但其拥有的影响权重却是“多”。

对此，塔勒布在**《反脆弱》**中，就坚确地指出：“对系统进行1%的改善，可以降低99%的脆弱性（或增加反脆弱性），只需几个步骤，很少的几个步骤，并往往以较低的成本，就能使事情变得更好、更安全。”

所以，在二八定律的框架下，我们更应该做的就是——把握住“少的”高权重信息，以获得“多的”我们想要的结果。

那为什么二八定律会无处不在？——这是因为我们的世界，其本质规律之一，是遵循——幂次法则的。

具体解读参看——主题相关文章[3]。

5，信息抽象压缩

事实上，更少的信息，不一定代表着信息量少，或是有效信息量少，而还可能是信息经过了高度的抽象压缩，令其中包含着丰富的有效信息。

比如，一本很厚的书，经过反复的阅读，就会让人在心理上觉得这本书变薄了。
**比如，**电脑上的压缩文件尺寸很小，但解压后其内容尺寸却可以很大。
**比如，**数学物理公式可以简洁又优雅，但却同时可以蕴含着丰富又深邃的内涵。
**比如，**圆周率π一个字母的信息，用具体数字表示，可以算到几百亿位，并且其数字序列随机毫无规律，可能蕴含着无限的信息（正规数特质）。
**比如，**我们可以用一段话，抽象概括：一本书，一部电影，一个人的一生，一个时代，甚至是文明历史，等等。并且还能让人们对这段话所传递出的信息，达成某种共识。

这些都说明了，信息是可以抽象压缩的，而学习知识的过程，就可以看成是把信息，抽象压缩到大脑神经网络结构之中的过程。

可见，这里少的是信息的空间，多的则是信息的密度。

而高密度的抽象压缩信息，其实代表的就是删繁就简，去除一切不必要的繁杂，并且在纷繁、混乱与无序之中建立高度的有序。

这也就是做减法的意义，追求简洁的意义——获得高密度的有序，这其中隐藏的是丰富与精妙。

为什么说，完美的设计——不是无法再增加一样特性，而是无法再去掉任何一个特性——因为这就是高密度的抽象信息压缩，所代表的高度有序。

而这种高度有序，不仅是信息高效处理和传递的“捷径”，也是人们达成合作与共识，所必要的上下文背景。所以，这种高度有序，就是我们想要的“多”。

另外，当信息高度有序时，其结果也是在——剔除更多的无效信息和可能的错误，提高有效信息的比率。

6，想象力

更少的信息，其潜在特性就是——留白，而留白则就给想象力留下，可以自由发挥的空间和可能。

试想一下，小说 => 漫画 => 动画 => 3D动画 => 真人电影，这个变化过程中的区别与感受。

事实上，这个过程，就是**一个留白不断减少，由抽象到具体，由想象到现实的一个过程。**在这个过程中，想象力发挥的自由度越来越少，信息的传递越来越多，也越来越丰富。

所以说，小说不仅靠作者的想象力，也靠读者的想象力，两者合作，才能在大脑里创造一个虚幻的世界——并且作者与读者，每个人大脑里的世界都是一个独一无二与众不同的世界——这个世界关联并掺杂着一个人点点滴滴的独特经历。

而电影，在很大程度上则依靠编剧、演员、场景与特效一起构建出一个具体的唯一的世界。观影过程中，观众想象力能有所作为和脑补的地方并不多。

可见，一个电影有想象力可以与观众无关，而一个小说有想象力，其实能体验到小说想象力的时候，每个读者都已经用自己的想象力参与其中了——甚至有时读者还能体验到，连作者都无法想象和感知到的元素。

另外，如果一个信息是抽象压缩的，那么在大脑里进行解压信息的时候，想象力也必然会参与到其中，并起到影响结果的至关重要的作用。

同时，这也说明了，信息的解压未必就有完全一致的结果，人脑不是计算机，无法精确的做到复制拷贝和粘贴，所以人脑进行信息处理的过程中，必然会伴随着信息的突变——而这就是一种在智能之间传播的信息，称之为文化基因（meme）。

事实上，进化正在从基因信息的进化，慢慢转向了文化基因的进化。

所以，这里少的是具体，多的则是想象力。

然而，很多时候，少给人简单的感觉，不容易受到重视，并且人们还喜欢用复杂的方法（捷径带来的负效应，由“将就”积累出的无序和混乱），试图去解决简单的问题，这是行不通的（有序无序不兼容，路径不对），反而还会一无所获。

但如果能够重视更少，并用想象力去处理显而易见的更少——留白和抽象信息，或许反而就会获得更多——想象力带来的正效应。

那么显然，更多的想象力，才是我们想要的“多”，也是对我们有益的“多”。也因此，有时看不清比看得清看的更广阔，甚至更清晰。

7，从量变到质变

万事万物，从量变到质变，从0到1，从少到多，这是一个积累的过程，也是任何人都无法避役的一个过程。

结合前面的观点可知：“少”——其实就是我们能够处理，并能够更好处理的量变——其中（抽象信息）甚至还可能蕴藏着未知的力量与精妙——代表着信息的排列组合。

而量变，则是我们必须要经历的步骤——或说是路径。因为只有经历了量变，才有可能来到质变，而得到了质变，才能会带来翻天覆地的变化——产生幂次增长，而这就是变革与进化的结果。

那么，如果不断的重复这个从0到1，从量变到质变的过程，就会不断的抵达质变，从而更快的创造、更快的推动、和更快的发展——最后得到我们想要的一切。

由此可见，这里少的是停滞，多的则是积累——因为少的变化，能够获得正确，积累量变；多的变化，更大概率的获得错误（包括路径与方向），停滞不前。

而积累量变产生质变，就会带来深入、精通与专业，这显然就是我们想要的“多”，也是对我们有益的“多”。

而试错，也会带来积累，但最终我们积累的还是正确，从错误中获得的正确。因为错误中隐含着正确的信息，并且排除掉错误的路径，就会更接近正确的路径。但无论如何，错误在宏观上，是在原地停滞。

另外，如果我们减少了停滞，增加了积累，但却把积累分散到了各个领域或方面，那么这样每个积累就都难以产生出质变，结果更多的积累，却没有产生出更多的质变，最后反而变成了多而全、广而不专的情况。

那么这时，我们就需要减少积累的广度，增加积累的深度，以促使质变的产生。

所以，这里少的是广度，多的则是深度。

但这个少和多并不是绝对的好或坏——主要在于个人的取舍，因为社会分工需要深度与广度，局部与整体，微观与宏观，工匠与政客，产品与管理等等，一起并存合作与协作。

8，第一原理

事实上，所有的一切——万事万物，都是由同样的信息比特，在自然演化的算法下，一步步在宏大时间的作用下，从简单到复杂，逐渐进化所形成的。

宇宙擅长应用简单、重复的基本操作，作用在不同的简单信息结构之上，来产生不同的复杂结果。

那么，这里**“少”——就是第一原理中的基本法则或算法，“多”**——就是由第一原理法则所构建的上层（任意复杂度的）结构。

第一原理（First Principle）——是一个最基本的命题或假设，不能被省略或删除，也不能被违反——相当于是在数学中的公理。而在物理中，是指从头计算，不需要任何参数，只需要一些基本的物理常量，就可以得到体系基态的基本性质。

就像，利用薛定谔方程，在一些近似方法下解电子结构，但不从实验数据得到拟合参数的从头计算法。
就像，人类的手构造简单——只有四个手指和一个大拇指，但它却足以被智能所驱动，从而制作和使用各种工具。

最后，万物皆比特。

具体解读参看——主题相关文章[4]。

结语

本文一共从8个方面的视角，探讨了少即是多（Less is More）的内涵和意义。

**信息处理效率：**少的是信息量，多的是信息处理量。
**信息处理模式：**少的是信息的复杂度，多的是信息处理的正确率。
**有效信息量：**少的是信息处理总量，多的是有效信息量的比率；少的是无效信息，多的是有效信息；少的是可能的错误，多的是更多的正确。
**关键信息权重：**少的是信息数量，多的是信息权重。
**信息抽象压缩：**少的是信息的空间，多的是信息的密度；少的是无序，多的是有序；少的是错误，多的是正确。
**想象力：**少的是具体信息，多的是想象信息；少的是已有，多的是创造；少的是固定，多的是发散；少的是约束，多的是自由。
**从量变到质变：**少的是停滞，多的则是积累；少的是广度，多的则是深度。
**第一原理：**少的是基础算法，多的则是万物的构造。

可以想象，对于少即是多，肯定还有很多其它的视角和解读，是本文没有涉及和想到的。

例如，塔勒布在**《反脆弱》**中认为，“少即是多：一方面，研究得越多，就越容易忽略基础但根本的事情；另一方面，行动能将事情剥丝抽茧，直至剩下尽可能简单的模型。”——换言之，少研究多行动，就能够获得对基础根本事情尽可能简单的模型。

例如，灭霸的“宇宙生命五折计划”——可能就是在试图使用**“少即是多”**的原则，来恢复宇宙的和谐与秩序。

最后，非常有趣的是，“少即是多”尽然会有这么的内涵和意义，而其本身又是如此的简洁又充满哲理，这似乎正充分体现了：少即是多——其本身也就是——少即是多。

更或许，**“少即是多”**不仅是真理的形式，也是真理本身。

后记：新算法

现实，往往是可选择的少；而理想，往往则是不可选则的多，并且事后的不可选在事前看起来常常都是可选。

例如，一个成功率较高的约会匹配算法，即是：屏蔽掉概率低的“可选”理想，专注于概率高的“可选”现实。

换言之，“系统”根本就不应该，向用户展示更多的“理想型”，而应该让用户只能看到更少的“现实型”——也就是，用算法去引导用户完成注意力、选择、及付出有效分配的**“少即是多”**。

其实这里**“少即是多”**的内核，还是前文所提到的——有效信息量，即：少的是无效信息，多的是有效信息。

那么，如果现实是选择多，那么理想会变成选择少吗？还是更多？

我们的本能，演化于（可使用）资源稀缺的时代，所以我们的理想无关现实永远是多，或说是我们的欲望无关拥有永远是多，多肯定有其益处，但凡事有度过犹不及，而**“少即是多”就是——智能站在本能之上，演化出的应对现在及未来资源富足时代的——“新算法”**。