从彩票预测说起

近两年,翻开报纸、打开电视、点击网页,会发现形形色色的“彩票预测”节目日益火热,随着彩票业的兴盛,“彩票预测”这门“学问”热闹起来,一大批“概率学家”有了饭碗。

电视中的彩票预测节目一般紧接着彩票开奖后播出,我闲来无事时竟看过几期。专业的“彩票学家”很是厉害,他们可以花上几十分钟去“分析”前几期的号码,懂得利用计算机比较各号码出现的频率,而且经常能够以高超的灵感将各种信息组织起来——例如构造出一个奇妙的号码方阵,把之前几期的中奖号码巧妙地安置并用各种颜色做标记,然后——“瞧,这里有一条线,然后,这里是一条对角线……跳过这里,沿向这里……喏,这个号码最近很活跃!还有以下几组组合频率较大,我建议关注以下几个号码……”

在网上好像还有提供三维分析图的,比如“××网最新推出3D排列三定位胆码预测,每期每位提供2个胆码,并承诺:一个月一个位置最少预测成功6期,达不到6期则退还服务费!”听着挺玄,还有“承诺”,口气真是不小。不过似乎一个月的费用是上百元,我当然不会去尝试。

那么,他们的“承诺”可信吗?如果不可信,他们的“学说”与科学有何不同?如何否证他们?

科学定律的发现同样也是从经验事实中归纳“规律”,休谟早已指出:这种归纳并没有可靠的逻辑基础。而且,有些科学——尤其是社会科学,也关注概然性事件,并且用概率进行科学预测。

同样是根据过去几天的信息进行整理,按照某种规则计算出未来出现某种情况的可能性,天气预报与彩票预测有什么本质区别?

我们知道,彩票的开奖是随机的,就如同抛硬币,每一次正面朝上的概率都是50%,之前的结果与下一次抛硬币毫无关联!问题是,我们如何证明这一点?

在概率论中,这叫“拟合良度检验”,具体过程为:“(1)先假定此器械是没问题的;(2)计算出一个标准机械将产生的平均结果;(3)比较实际数据与计算出的平均结果的偏差;(4)计算出一个标准器械的结果具备同样(或更大)偏差的概率p;(5)如果p很小,则否定前假定,否则认为没有足够的证据表明此器械有偏差。”[①]

然而,具体的操作并不轻松。我们假设有一枚有问题的硬币,它的正面出现的概率仅47%,我们需要多少实验才足以察觉出问题呢?

抛100次很难发现问题,对一枚标准硬币而言,正面次数多于60或少于40的概率为5%,当问题硬币的实际数据在这5%的范围中,我们勉强可能开始怀疑这枚硬币出了问题。然而这枚47%正面的问题硬币出现在40~60之间的概率有93%,也就是说,我们几乎没有机会在100次检验中觉察出问题,更不用说去证明该硬币确有问题了。即便进行1000次试验,当正面次数超过532或不足468时我们开始怀疑这枚硬币,但这种情况出现的概率仍只有50%。要较可靠地判断出这枚硬币有问题,大概至少需要试验上万次!

彩票摇奖机在出厂时会进行这种“拟合良度检验”,然而如果人们不信任那些暗中进行的检查,单从几百次实际的开奖情况来看,远不足以论证开奖的随机性。

何况,即便通过了“拟合良度检验”,仍不代表数据背后不可能隐含着某种规律。例如1、4、1、5、9、2、6、5、3、5、8、9、7、……这一串数字似乎是随机分布的,但这不就是π的小数部分吗?如果我们对π的小数部分进行“拟合良度检验”,它将完美地符合随机性要求,然而,它的每一个位置上的数却都是确定的!那么,当我们面对一串貌似完全随机的数据时,怎能确信它不是某个诸如“3π2+5π的小数部分”之类的规律的产物?

或许整个宇宙的一切事情从一开始就是决定的,任何随机性都只是我们的错觉。然而,不管怎样,现在我们并没有发现其中的规律,我们没有办法预测硬币下一次将哪面朝上,因此,我们只好假定它确是随机的,这方便我们进一步讨论事情。但问题是,有一些彩票学家声称他们已经发现了某些规律!

看起来,彻底推翻“彩票学家”们的信念是很困难的,但是,我们之所以相信彩票是不能预测的,也有充分的理由。

关键在于,运用我们已知的科学理论,足以证明这一点:“彩票开奖的数据是合乎规律的,可理解的,并不需要额外的神秘解释”。而“彩票学家”提出的理论,却需要求助于没有任何科学提供支持、捉摸不定的、神秘的因素。

任何一个令人信服的科学说明(科学解释),总应该包含一个或多个“科学定律”,并且进行合理而有效的演绎。

在讨论科学说明为何可靠之前,我们先回过头去,讨论一下为何科学定律是可靠的?

产生科学定律需要归纳法,而且往往还是“不完全归纳法”,也就是小学生做“找规律填数”的方法,而不是中学生习题中那种从k推出k+1的方法!

当我们看到“2,4,6,8,___,……”,最迟钝的小学生也懂得怎样做这种找规律填数的题目,他们会毫不犹豫地在空格内填上“10”,稍微机灵一些的学生则会归纳出一条普适的“规律”来——“第n个数是2n”。这道题虽然过于简单,但其中的基本原理与科学家归纳出“自然规律”的方式是一样的!也就是在一系列有限的经验事实或实验数据中“找规律”、总结规律、提出预言。

然而,中学生不再做“找规律填数”的试题了,因为其中一些聪明的学生已经知道:找规律填数是没有确定答案的,它有无穷多的答案,而且任意数都可以是答案!

从2、4、6、8中我们可以总结出规律为“第n个数为2n”,但为什么不是2.2 n的整数部分?或者是“3n4-40n3+180n2-303n+162”?认定第n个数为2n不过是出于“习惯”罢了,我们习惯性地偏爱一个最简单的、最容易想到的答案,但这不一定是真实的答案,牛顿定律被相对论超越证实了这一点。

尽管如此,科学找出的“规律”看起来仍然是非常可靠的,至少,给人们的感觉是如此。令科学定律显得如此可靠的因素有:

一、简洁性:当An =2n与An =3n4-40n3+180n2-303n+162这两种假说同时与经验相符时,人们显然更倾向于采纳前者。当然,这或许只是一种信念,人们并不总是偏好简洁性,例如从古希腊到哥白尼一贯以来的对“圆”的偏爱,似乎宁愿让“轮子”无止境地增加也不愿意考虑其它的思路……

二、普适性:其实,普适性也是简洁性的一部分,例如相对论的公式虽然看起来比牛顿力学“复杂”,然而相对论的适用范围更宽,适用于一条定律的现象更为普遍,用最少的东西解释最广泛的现象——这就是普适性。

三、可检验性(可证伪性):例如我们为2、4、6、8……“设计”了一条规律“An=2n”,我们即可以期待第5项的出现,如果确实是“10”,那么“An=2n”的规律便得到了支持,我们对于第6项将出现“12”的信心也会增强一些。

这些都是科学理论的重要特征——虽然可能既不充分也不必要。

更重要的是,在现代,各种科学定律、各种科学理论相互支持地组织在一起,形成了“科学”这一门可视作一个整体的活动。虽然各科学的各个学科之间的理论并没有完全统一起来(这应该是做不到的),但作为整体,“科学”是相对和睦的,每一套科学理论都有一系列相关的理论与之互相支持,也极少与其它现有理论激烈冲突。在这种情况下,要随意删改或添加一条科学定律绝不是一件轻松的事。

当某一“学说”要求必须对现有的科学理论进行大规模的改造时,人们很自然地倾向于认为它是假的。比如“耳朵识字”这样的特异功能如果被承认,科学中的极多现有理论都将被迫作出修改,作为一个思路正常的科学家,对那种说法持强烈的质疑态度是理所当然的。并不是说现有的科学理论拒绝修正,事实上,不断地自我修正也是科学理论之所以显得可靠的重要因素之一。然而,当有人提出要颠覆现有的科学系统时,必须清醒:举证的责任在他,而不在主流的科学界。也就是说,主流科学并没有义务论证“为什么耳朵必然不能识字”,而是需要另类研究者拿出确凿的证据去论证“耳朵确实能识字”。

同样地,对于彩票,概率论已给出了科学的解释——“彩票号码随机产生,与之前的结果无关而且不可能预测。”而现实情况确实符合科学的解说。至于是不是有另一套隐藏的规律?为什么彩票的号码与星辰的位置没有关系?这些并不需要主流科学去论证,如果某人坚持认为彩票的号码与星辰的位置有联系,那这套学说中必然包含对现有科学体系而言是颠覆性的新假说,于是举证的责任在假说的提出者。既然没有哪个“彩票学家”能给出一整套令人信服的新理论,那我们完全有理由相信科学的解释是唯一可靠的。

顺便提一句:“为什么彩票预测经常看起来确实很灵?”——这个问题也可以用概率论解释。

未完待续
2006年3月21日


[①]参考 [英]约翰·黑格:《机会的数学原理》,李大强译,吉林人民出版社2001年,第397页

关于 古雴

胡翌霖,清华大学科学史系助理教授。本站文章在未注明转载的情况下均为我的原创文章。原则上允许任何媒体引用和转载,但必须注明作者并标注出处(原文链接),详情参考版权说明。本站为非营利性个人网站,欢迎比特币打赏:1YiLinDDwvBLT19CTUsNHdiQhXBENwURb

发表评论

电子邮件地址不会被公开。 必填项已用*标注