心得分享第26季:统计学的真相:价值可以客观地量化,这才是最大的迷信
世界上有三种谎言:谎言,该死的谎言和统计数据,他们自以为是、先入为主地为历史静态事件设定各种有利于结果的条件后,在黑板上总结出一个个自欺和欺骗的结果...马克·吐温
统计,在日常生活中无处不在。你算一下这个月到底花了多少钱,其中子女教育、水电费、外出聚餐到底有多少,看看有哪些开支可以节省,这就是统计。企业统计一下收支情况,利用货币价格计算出成本与收益,以决定下一步的经营策略,也是统计。
所以谁都会统计,都在统计。每个人都是统计数据的供给者,同时也是他人提供的数据的消费者。统计的作用在于掌握以往的历史状况,明确下一步的行动方向。
但是很明显,统计属于历史的范畴。统计数据是历史数据、静态数据,而人的行动是动态的,面向未来的,纯粹依靠统计数据来做决策,是不靠谱的。
诺基亚要是凭借历史数据认为,下一步应当维持手机的产量,那它就错了,因为苹果会将它打得满地找牙。消费者的主观偏好、以及市场价格,是在不断变化的,若是认为有一个“客观”的价格、不变的价格,那你就等着亏损和破产。
所以统计绝无可能统计出企业家才能、默会知识、主观价值这些东西。一个企业家决定如何经营,这种还没有产生的数据,你如何统计呢?我说我喜欢苹果胜于桃子,你统计个毛线?这些范畴是不可能用数学方式量化的,也不可能跨人际比较和加总、平均,因此是无论如何也没法统计的,然而它们对于人的行动和市场经济却至关重要。
而且,统计数据本身并不能揭示任何问题和规律性,数据本身就需要被解释。同样的数据,用不同的理论,可能得出的是截然相反的结论。因此必须用正确的理论去解释,进行历史的个性化理解,发现其中的因果关系。
企图从统计中发现任何规律性,以为人的行动领域可以用数学方式表达,以为价值可以客观地量化,这才是最大的迷信。
一个统计学家尽可以去统计汉武帝开疆拓土带来的战马、兵器生产而产生的GDP,还可以统计出那时候就业率非常高。跟屁虫历史学家会说他雄才大略并且使其成为主流叙事,但是有点常识的人都能解读出这叫穷兵黩武民不聊生;就业率那么高,不过是因为青壮年都去战场送死去了。
从统计数据这个结果中,你既无法发现数据形成的过程,也不能知道组成这个数据的结构形态,更不消说人们的心理状态。
例如一家企业的固定资产项目,你要是光看统计数据,可能疫情三年内并没有什么变化,可是这家企业的经营状况却早已发生了巨大变化,那些数据只是账面数据,资本结构已经发生重大变化,现在要卖的话可能已经一文不值。
统计数据看到居民存款还在大幅增加,要是以为民众变得更有钱了,所以要刺激消费,那就非常扯。货币供应量一直在增长,然而有些人拿到了巨额的信贷资金,有些人没有拿到,你把二者加在一起,这就相当于把姚明和潘长江加总在一起,这不是胡闹吗?而且,那些数据也并不是储蓄增长,而是减少了投资、从投资中撤回资金,增加现金持有,表明对未来的信心下降。这种微妙的心理变化,对经济的影响意义重大,但是你咋统计?统计个寂寞?
以上是第一个问题,我们首先要认识到统计的局限性。
但不论怎样,企业和个人的统计,风险是自担的,你把数据利用错了,决策错了,自己承担亏损即可。
然而另外一种统计数据,就非常要命,那就是有关部门统计的数据。
比方说失业率。
这个数据的统计方法采用的是调查问卷。这个方法本来就令人充满疑惑。人是会说谎的,人的真实偏好只能通过行动、而不是语言反映出来。这是一。第二,即便不说谎,既然是问卷,就是抽取一部分数据,样本有限,必然无法反映全貌,影响统计的准确率;第三,抽样范围的不同,就会影响最终的数据。
其次它的计算方法也极不科学。只要你在调查时间点前一周,工作了1小时以上并且取得报酬,或者虽然你供职的企业都已经停工了不发工资了,但你仍然在职,那就不算失业。还有,没有工作意愿的人,属于非劳动力,不计算进入劳动力总数。
这就问题很明显了。没有人会认为一周工作了一小时就是就业;也没有人认为有个劳动合同在身就是没失业。至于所谓工作意愿,就更扯了,你一个月给我1500,我就没有工作意愿,不如躺在家里吃救济或者啃老,但你一个月给我1万,我肯定从床上爬起来有意愿了。
所以失业本身并不是问题,以什么样的工资率就业才是问题。
另外失业本身也反映不出经济的状况。一个经济极度落后的地区,丈夫妻子和未成年的儿童都在工作;而一个经济高度发达的地区,男人一个人去奋斗就可以让四口之家生活优渥,女人完全可以失业在家做全职家庭主妇。这样,前者的失业率很低,而后者很高。然并卵。
最重要的一点是,在自由市场上,失业都是主动失业。广阔的市场上,总有资源未被利用,总有没有被满足的需求,只要你想就业,就必然能就业。之所以失业,是因为你要价太高。就像一个苹果市场价就值5块,你非要6块,那就卖不出去,这个苹果就“失业”了。而一个人之所以选择失业状态,是因为他现在的日子还过得下去,要么有积累,要么可以啃老,饿不死,当一个人为生计所迫必须工作时,他当然就能工作。
这话听起来挺“冷血”的。但是科学总是冷冰冰地把真相揭示在你面前,“冷血”的科学,要比“热血”的谬误好太多。
当然还有一种是被动失业,那就是在干预破坏自由市场的情形下。
一个低技能的劳动者,每个月劳动的市场价值是2000块,但是“热血”而“富有同情心”的人们说最低工资必须是3000。那他就找不到工作了。
这种情况的一个变种是各种休假和福利待遇。比如为了鼓励生育,由法律规定给女职工超长产假。产假休多长本身不是问题,问题在于休假期间工资不能少,那这实际上就是设定了最低工资。你一年的市场工资是10万,但是休了半年假,还要10万,那除非你半年就能创造出10万的边际价值产品,否则你就会被解雇。
你不要说老板“黑心”,你要是老板也会这样干。凭什么你工作半年我要给你发一年的工资呢,你是不是在剥削我?如果不解雇你,消费者就要解雇这个老板——他会亏损和破产。
这就是老板们现在招人的时候得先问一下女职工你生完孩子了没有、生了几胎的原因。这不是市场的过错,也不是谁故意歧视女性,而是干预主义制造出来的问题。有人打着关心女性的旗号,实际上是在害女性。
再比如GDP。建方舱、拆方舱,都是GDP;增加货币供应量,物价上涨,还是GDP;大干快上搞个几万亿,更是GDP。但是那些东西跟老百姓有关系吗?GDP增加了20%,你的腰包鼓了20%吗?所以没有人看着GDP增长了就认为自己生活变好了。许多人热爱GDP,那根本不是经济的理由,而是莫名其妙的高潮感。
还有价格指数。你把“一篮子商品”放在一起,又是加权又是平均,可是最大宗的支出例如房地产,根本就不计算在内。涨价最厉害的不算在内,没涨的算了,玩啥呢?每个人“篮子”里的商品都不一样,你主观武断地选几样商品算怎么回事?把一公斤棉花和一公斤铁加在一起,把几种商品的价格进行平均,简直就是匪夷所思。另外马云对一颗白菜的评价跟我一样吗?我今天喜欢白菜,就永远喜欢白菜?一个家庭主妇能迅速地感受到物价变化的情况,她随便选两种商品计算出来的价格指数,并不比那些统计学家计算的更加武断。谁又会盯着价格指数去生活呢?
所以,基于错误的理论进行的统计,即便公式设计得再高端再复杂,那也是无用的,其实是有害的。统计学家搞出的那些复杂的模型和公式,弄出一大堆与民众认知和切身感受不符的数据,无非就是想垄断统计,并且高高在上地告诉民众:你们都比较傻。
以上是第二个问题:绝大多数统计数据,对民众来说,是无用的。
第三个问题是:为什么对民众无用,一大批穿制服的和他们雇佣的经济学家和统计学家,却在乐此不疲地搞统计呢?
因为那对他们有用。
他们说,统计是经济的眼睛。语言腐败了!他们不诚实,故意漏掉了两个字:
统计是干预经济的眼睛。
我们首先要问一个问题:假如一个古典自由主义的政府,严格恪守其职能界限,即只保障财产权,假如谁的钱是来自于盗抢,那么你保障财产权打击盗抢行为就可以了。你要数据做什么?
什么都做不了。没用。
谁工作着,谁失业了,关它什么事呢?我工作,是企业给我安排的,工资是老板给我发的;他失业了,你也没有理由用工作着的人的钱去补贴他,所以你要失业率数据干什么?
GDP无非就是终端消费的合计数,就是买卖双方交易的结果,只要是自愿交易,没有侵犯产权,它是高是低,关它什么事呢?有的人想投资,有的人不想,GDP数据就变化了,投不投资,又关它何事呢?
价格指数。价格按照供求关系变动,有涨有跌,各种商品涨跌幅度还不同,这是再正常不过的市场现象。我买东西,愿意花多少钱就花都少钱,有钱难买爷高兴。你算那玩儿想干什么?
进出口贸易出超和入超。我卖了一堆衬衫给一个宁夏人,然后又向一个美国人库克买了一部苹果手机,这在国家进出口贸易数据上显示的是,进口大增,入超了,可是这对我来说是一个问题吗?根本不是。关你进出口啥事呢?
基尼系数?马云有1000亿,我有100块,又关你什么事?这些钱只要是服务他人诚实交易所得,都是合法正当的,你凭什么掌控所有人的收入呢?你统计这样的数据,让我觉得我很穷,意欲何为?
所以不断收集各种数据,目的到底是什么?
就是为了干预经济提供“依据”。
失业率高了,那就从工作着的人那里征税,给失业的人发补贴,这样他们就不闹了。强制要求企业不准裁员,搞一个罗斯福式的以工代赈,或者用勺子挖运河,大家就都有工作了。甚至,拙劣的菲利普斯曲线要登场了,要扩张信贷了,因为睁着眼睛说瞎话地认为高通胀与高失业不可能同时发生。
GDP下降了,所以要刺激消费,说“把钱花光为国争光,拿出三分之一存款买房”的专家就登场了,发消费券,搞假日经济,家电下乡。你要是还不花,那我就替你花,征税、举债、压低利率信贷扩张大放水,“铁公鸡”立即登场,GDP就蹭蹭涨。
价格指数高了,商家黑心,必须实行价格管制,谁要是敢涨价,5斤芹菜罚6万6。要抬高利率了,把价格压下来,降低经济“过热”。价格低了也不行,低了商家不是没利润了吗,不是要通缩了吗?总之价格指数要“稳定”,否则你知道了价格高是因为货币多了购买力下降,价格低实际上是好事这种秘密,该怎么办?
出口少进口多,入超了,搞产业保护啊,你们都交点税,给出口企业优惠政策,发补贴,这样的话出口数据就好看了。像拜登那样,对中国汽车征收100%关税,这样美国进口就少了,能够保护美国的汽车产业集团,换取他们的选票了。
看到了吗?这时候它就不是一个古典意义的国家了,它的权力大大扩张,可以对经济生活的一切进行干预和规划了。所以,统计,是计划统制的好朋友。
这些统计数据最大的问题并不是准确与否的问题——它也不可能准确。准确反倒从来不是考虑的重点,为了达成相应的目的,甚至可以先打枪后画靶子,根据自己的想法和取向,处心积虑地去找数据。
所以造假才是常态,不造假反倒不正常。
例如我为了去证明最低工资法不会造成失业,反倒增加了就业,可以去那些工资本来就高于最低工资、且处于扩张期的企业去搞统计,这样得出来的数据绝对能达成预定的目的。我不喜欢的数据我不统计了就行了。你要是说我造假,没有的事,我这数据都是有真实来源的。
这世界上最大的谎言,不是直接向你撒谎,而是只告诉你一部分“真相”。一大堆数据垃圾就这样制造出来了。
现在充斥在我们生活中的大量统计数据,其生产者和消费者是同一个人,那就是神龙。既然是它生产和消费的,那就必然服从和服务于它的目的。
绝大多数经济学家和统计学家都委身于它,他们可以从玩弄数据中服务于它,分享稳定而优渥的收益。维持一个干预主义的世界,对他们是有利的。假如在一个自由市场上,谁会雇佣这种人啊。
贫富差距的统计骗局
现在统计数据充斥在我们的生活中,似乎什么事情不用几个数据和图表说事,就不够科学和精准。
问题在于,在人行动选择的领域,你没法科学和精准。我偏好苹果胜于橘子,他偏好香蕉胜于菠萝,而且我们俩都会变,这你怎么“科学”?你要是再问我,喜欢苹果是喜欢橘子的多少倍,橘子和苹果之间有什么函数关系,由此达到精准,那就是个神经病。
认为只有数据才代表科学,这才是最大的迷信。有人故意制造这种迷信,目的在于将每个人像机器一样规范起来。
另外一个重要的问题是,统计数据的背后,是统计者的价值偏好,取决于他能不能用正确的理论去统计。绝大多数统计数据,是统计者先形成一定的概念和思想定式,然后先入为主地去寻找数据,如果有些数据不符合他的价值偏好和所谓的理论模型,他就不统计进来。
例如诺贝尔经济学奖得主戴维·卡德,他通过大量的“实证研究”,“证明”最低工资法并不会造成失业,反倒是提高了劳动者的工资。他这么一搞,似乎要把价格原理和需求定律都要推翻了,不知道的人还以为他有多牛逼。
可是他的统计方法是,搞了一个“对照组”,一组是有最低工资法的地区,另一组是没有最低工资法的地区。于是他有了一个“惊天的发现”:那些有最低工资法的地区,不但工人工资高,而且就业率要明显高于没有最低工资法的地区。数据摆在那里,看起来的确是这么回事。
可是你要是统计一下朝鲜和中国的工人工资,就会发现,中国有最低工资法,朝鲜没有,但是中国劳动者的收入远远高于朝鲜。“所以”,最低工资法能够提高工人待遇。进而抛出一项政策措施:如果朝鲜能够规定最低工资是每月1万美元,朝鲜人民生活水平马上就世界第一了,哪里还用为吃不饱发愁。
所以他犯了一个非常低级的错误:幸存者偏差。他统计了那些实行了最低工资法之后,仍然在岗的工人工资,而那些因最低工资法而失业的劳动者被他无视了。这类似于“没来的请举手”,以及“方圆二十里没穷人”。
如果让戴维·卡德这种人去调查俄罗斯轮盘赌,他会继续宣布一个“重大发现”:俄罗斯轮盘赌一点儿都不危险,我调查的人都活得好好的。可是死人不会说话。
就是这么拙劣。
难怪马克·吐温说:谎言有三种,谎言,该死的谎言,和统计数据。
最常出现在我们的视线中的统计数据,就是所谓的贫富差距。
当我还是一个社民派的时候,看到托马斯·皮凯蒂的《21世纪资本论》里说,资本主义加剧固有的收入不平等,资本回报率与GDP增长率之间有差额,所以贫富差距会越来越大,“现如今,较贫穷的一半人口和过去一样贫穷,2010年他们的财富仅占总财富的5%,与1910年一样”时,我曾经深信不疑;当他说世界上最富有的1%的人处在等级制度和不平等结构的顶端时,我自然而然地相信了他的建议,对这些富人征收资本利得税,然后所得税边际税率80%!
但是他简直就是一堆狗屎。当然,过去的我也是。
一个很简单的问题是,难道那1%的富人,和最贫穷的一半人,一直是同一批人吗?
当然不是。同样的实证数据清晰地揭示出,最底层的那些人只在很短时间内处于收入最低的阶层,其中有29%的最底层人,后来成为最顶端的20%的一份子。而那些最富有的人,只有在很短时间内占据最顶端,绝大多数后来默默无闻甚至跌落到了最底层。
绝大多数人,都是从较低的岗位开启他们的职业生涯,后来积累了更多的经验和技能,工资和财富就增长了,这有什么好奇怪的?
你一直拿每一年中收入最高的人与收入最低的人作比较,比较的结果当然是永远存在巨大的财富差距,这能比较出个毛线?把一颗苹果树上最大的苹果专门挑出来,与另一棵苹果树上最小的苹果作比较,这不是脑残吗?
美国的有色人种促进会(NAACP),最爱搞数据统计。
他们经过“长时间”的统计,发现黑人家庭的贫困率达到了22%,而白人家庭只有11%,于是顺理成章的结论出现了:由于种族歧视,所以黑人收入低;贫富差距太大,必须管一管。
可是,另一项实证数据揭示,已婚黑人家庭的贫困率要低于白人家庭,仅为7.5%。
那么问题来了,难道白人种族主义者非常在乎一个黑人是已婚、未婚还是离婚吗?他们专挑没结婚的黑人歧视?黑人入职的时候白人专门要查一下结婚证吗?
更重要的是,为什么要用家庭收入、而不是个人收入作为统计单元,得出一个令所有人都惊骇的结论:白人家庭收入平均是黑人家庭收入的2倍!
因为他们是故意的,这是一个统计骗局。
收入最高的20%的家庭,如果按照总收入来计算,就是比收入最低的20%家庭的收入总额高出若干倍。可是,家庭和家庭的人口是不一样的,根据美国人口普查的数据显示:底层的20%的家庭有4000万人口,而顶层的20%家庭有7600万人口。
收入最高的20%家庭中,有收入的人口数,是最低的20%家庭的4倍。好了,4个人工作比一个人工作,平均来看家庭收入更高,有什么好奇怪的?
而恰恰是,白人家庭普遍都是父母双全儿女双全,而黑人家庭单亲的比例达到了64%,都“缺爹”。
那么计算结果就很有意思了,一个白人家庭,5口人,父母双方工作,年收入20万美元;而黑人“家庭”,64%的单亲母亲带一个孩子,年收入5万美元。不得了了,白人家庭的收入是黑人家庭的4倍!种族歧视坐实了!
而且还有一个因素,黑人的平均年龄远远低于白人。那么一个25岁的人收入大概率低于45岁的人,这很奇怪吗?
所以你说这种贫富差距统计,不是耍流氓是什么?
实证主义者最不实证,他们根本就不实证自己不喜欢的数据,都是“先打枪再画靶子”——脑子中已经有了一个结论,然后根据这个结论去找数据,一找一个准。
这些人不是在搞统计,他们是在搞政治。
他们一点儿都不傻,搞这些统计,目的就在于服务特定的政治目标。对于戴维·卡德这种知识分子来说,他们要充当权力的知识卫队,为政府干预背书,这样可以得到稳定而优渥的收益,还能得到荣宠。对于美国有色人种促进会而言,目的更明确,就是千方百计统计出黑人的收入远远低于白人,由此才能掀起舆论风浪,要挟政府,为黑人争取补贴和特权。
他们说,黑人处处受歧视,本来就穷,买房贷款的时候银行还歧视,又搞出一个统计数据:白人住房贷款的被拒率为22.3%,而黑人是44.6%。巧了,又恰好是2倍。
他们才不管,实际上申请住房贷款的黑人中,有52%都信用评分很低,他们要么有犯罪记录,要么没有资产,要么还有大量欠款根本就不还。他们更不管,其实黑人办的银行照样不给他们的黑人同胞贷款。总之我就认定你银行种族歧视又实锤了。
于是,联邦政府给银行下指标,要求不得对黑人的信用记录进行审查,只要承诺会还款,那就必须贷,否则就是种族歧视。这就是“谎言贷款”。后来,甚至为了“居者有其屋”,对信用很差的黑人首付款都直接给补贴。社会主义分房子了。
他们的手段似乎达成了目的。可是那只是短期的虚幻泡沫,后来的结果是,雷曼兄弟破产了,次贷危机爆发了。然后,那些贫困的黑人破产了,背负了更加沉重的债务。
米莱为什么关闭了阿根廷的国家反歧视、仇外心理和种族主义研究所呢?就是因为这种机构接受税金的资助,然后他们必须千方百计证明这个国家有严重的种族问题和歧视问题,即便没有也要统计出来有,即便是个案也要说成是普遍现象,因为不这样搞,就搞不到经费,就无法要挟阿根廷政府,他们就没有了存在的意义。
当下,最大的数据生产和统计机构是谁呢?就是各国政府。它的所有统计,都服务于自己干预经济的目标,为了这个目标的达成,数据成了他们手里的橡皮泥,想捏成什么样就捏成什么样。
前几天我的同道好友古原写的好文章香港这个时候,应该想起这个人中,记述了1960年代香港财政司长郭伯伟的一件壮举:
郭伯伟直言:贫穷地区要脱贫,首要“应废除统计部门”;他认为对经济状况作统计十分危险,因为政府会不知不觉地根据数据作出干预,并阻碍市场自然复苏的机制。
郭伯伟甚至曾言“国民经济核算是学者而不是官方研究的课题”,虽然这些意见曾受到英国政府的强烈反对,但这种态度在其任内没有改变过。
这项成就也被大名鼎鼎的米尔顿·弗里德曼大加赞赏:
最为人津津乐道的事,是他拒绝收集经济统计,怕数据只会让官僚有更多藉口去作出更多干预,他的继任人夏鼎基创造的“积极不干预”一词,所描述的正是郭伯伟的施政原则。
所以,绝对不可以被统计数据所迷惑,它更多的是一种政治,是一种骗术。
最根本的是,统计数据不能揭示任何经济理论和规律,恰恰相反的是,统计数据需要用正确的理论去解释。统计属于历史的范畴,揭示的是历史的、静态的数据,而人的行动偏好变动不居且面向未来。人的价值是主观的,它只能排序,不能量化,既不能跨人际比较,也不能加总和平均。任何统计数据,都会淹没一个个活生生的人的真实处境和状态。
这就是方法论上的深刻差别,它直接决定了经济研究到底是贴合真实世界,还是在自以为是、先入为主的黑板上自欺和欺骗。正如米塞斯所言:
奥地利学派拒绝数学方法,不是因为对数学的无知或厌恶数学的准确性,而是因为它不强调对假设的静态平衡状态进行详细描述。奥地利学派从来就没有过价值可以衡量这种错误的观念。让其确认无误的是:统计数据只属于经济史,而与经济理论无关。