反歧视必须讲科学吗?——关于《谷歌的意识形态回音室》事件

最近,一份在谷歌内部流传的备忘录被曝光出来,作者认为,谷歌公司存在的性别比例失衡问题压根不是问题,因为女性天生就不适合当程序员,如果真要促进多样性的话,应该促进“意识形态多样性”而不是性别或族群多样性,因为偏向保守的意识形态目前备受歧视。

备忘录曝光之后舆论哗然,对该员工群起讨伐,谷歌也果断将之开除。

我本来倒没觉得什么,我当然不赞同这位男员工的言论,谷歌开除他也无话可说,但我随后看了一些网站转载的反驳文章,看到那些用“科学”、“事实”、“真相”、“数据”来反驳性别歧视的论证之后,就很想吐槽了。为了反驳性别歧视,许多貌似铁板钉钉的论证,仔细琢磨起来倒有些气急败坏的感觉。

搞科学哲学的,最警惕的就是那些以科学名义说出来的东西。诚然,有大量研究可以被用来支持在包括编程在内的各种能力方面,性别之间没有多大差异。但问题是,这些研究本身以及对他们的解读,也未必是完全中立的。

更可怕的是,如果说为了支持女性的平等地位,我们必须援引科学来证明女性天生和男性差不多,那么如果真的有一项科学研究证实了在某个方面女性确实不如男性,那么关于男女平等的一切支撑是否就要崩塌了呢?

在这次事件中,“歧视女性”的“备忘录”煞有介事地引经据典谈科学,而反歧视的各路舆论,也同样一板一眼地谈科学。“科学”扮演着裁决者的角色,但这真的没问题吗?

学过科学哲学就会知道,科学本身能够得到的结论,往往是非常谨慎的,是在一系列条件限制之下的有限结论,无论是男女平等还是男女不平等,这样的大而笼统的问题,本身就不是现代科学可能给出的结论,而都是通过各种意识形态的个人,对极其有限的科学结论进行了许多包装和解释,才可能达到的。

我们先抛开男女平等问题,以平常心来读一读所谓的“科学证据”。

比如这篇文章“男女生理差异决定了女性做不了编程?是时候用数据反驳了”,这是一篇译文,我稍微对了一下原文,大概偏差不大,我就按中译本来谈了,毕竟我也不是要评论那篇文章本身,而是评论一类典型的辩护方式。

这篇文章的中心思想是“所谓的男女差异被极大地夸张了,即使存在,也是社会文化传统规训的结果。”——这句话我原则上是同意的,但事实上,往往由于论者过于急迫地试图论证男女平等,会让这句话中蕴含的矛盾暴露出来。

这句话包含两层意思:打个不太恰当的比方说,好比是这样的辩护:“第一,张三没杀人。”,“第二,即便张三杀了人,那也是被李四胁迫的。”这前后两层辩护是矛盾的,因为既然张三没杀人,就根本没有被谁胁迫的问题了。但事实上,这样的自相矛盾的辩护倒是经常会在法庭中出现,辩护律师往往会有一个最强的辩护,但如果不成功,就可能退让为较弱的辩护。

在反歧视的问题上,也存在这两个层面的问题:问题首先是,正在工作的那些男员工与女员工之间,工作能力究竟有没有差别?

强辩护的回答当然是:几乎没有差别,女员工的工作能力丝毫不比男员工差。鉴于能力相近,但待遇有差别,那么待遇之差别就源自歧视了。

如果强辩护成立,那么破解歧视问题其实不难,那就是依赖自由市场的竞争法则就好了。如果确实男女员工的工作能力是100:100,或98:100之类,但同时薪酬比是100:80,那么,假如歧视女性的公司倾向于多招男员工,而不歧视女性的公司更多地招女员工,结果不歧视的公司必定能够以更低的成本获取更高的工作效率,那么在市场竞争中一定会取得优势。在残酷的市场竞争中,企业家往往不讲道德只看利润,那么哪怕是歧视女性的企业家,为了追求利润,也会更多地招收女员工。最终依靠市场的调节,至少在薪酬待遇方面,男性与女性应当会趋于平衡才对。

但问题是,强辩护不总是成立的,事实上,许多女权的辩护者也充分认识到,现今女员工在许多岗位上的工作能力并不完全与男性等同,因为许多领域上,存在所谓“社会文化传统规训”的问题,因为规训导致女性处于弱势,因而难以正面与强势性别平等竞争,为了保护弱势群体,必须依靠有识之士身先士卒,引领风向。

这便是弱辩护的立场:尽管目前在相应领域中女性的表现确实不如男性,但这是后天规训而非先天决定的,于是为了改变文化环境,必须保护作为弱势群体的女性,在尚不能“同工”的情况下就“同酬”,在市场规律之上额外提高女性的待遇。

谷歌等公司所做的,事实上是这一层面的事情,就是在市场之上,额外提高女性(和其它弱势群体)的比例和待遇。

那么在这一层面上,又可以讨论接下来的一系列问题,比如说,如果女性的弱势处境是文化规训的后果,那么究竟是否必须商业公司也都要来为此买单?促进平等,减轻偏见,当然应该是教育者的分内事,在中小学和大学中,教育者应该自觉营造平等氛围,消除歧视,这没问题。但在自由竞争的市场中,企业家是否也必须牺牲利润和效率,为教育的后果买单?这种对企业家的要求,是否是一种“道德绑架”?

当然,我们可以主张企业也必须为错误的规训买单,因为市场经济其实也是文化环境的一部分,也参与着规训。特别是谷歌这样的龙头企业,更是在赚钱之外必须承担一定的社会责任,所以牺牲效率而提高女性待遇也是应有之义。

但糟糕的是,许多反歧视的辩论者,都回避或不承认“促进多样化”是对效率的牺牲,相反,他们始终咬定“强辩护”,认定现实中女性的工作能力已然与男性比肩,但时不时有意无意地还会滑向弱辩护,这就出现矛盾了。

当然, 事实上大部分的讨论的都是“程度”问题而非是非问题,所以这种“矛盾”也算不上逻辑背反,即便如此,在许多论证环节中,还是会显得牵强。

 

结论先行之后,各种论据都可以被拿来支持自己,但是换一种“成见”的话,同样的“数据”也有可能用来支持截然相反的结论。

比如说,那篇文章随后引述:“一项2005年的研究发现,在人类心理和行为的128个领域内,78%的性别差异不是很小就是接近为零”。

这句话反过来说,就是在128个领域内,22%的性别差异不是略大就是很大。

“78%的性别差异很小”与“22%的性别差异较大”这两句话在逻辑上是等价的,但在感官上就大有不同。另外,22%算是多还是少呢?换句话说,男女之间每五个领域就有一个领域差异较大,这难道不是佐证了男女差异很大这件事情吗?

当然,也许支持者马上会补充解释,这些性别差异较大的部分,大部分都是一些“无关”的领域,比如那篇文章后面提到的“男性体力更强、更有攻击性、手淫的次数更多且容易发生草率性行为”,但是这里只列了4个,须知那22%应该有28项之多,那么剩下至少24项都是些什么呢?很难不让人怀疑,论者故意选取了几条显得最“糟糕”的方面来列举,以突出这22%的无关紧要。

但即便如此,这精挑细选出来的这四条差异,恐怕也未必都“和职场没什么关系”。比如“体力更强”真的和职场没关系吗?须知程序员可是一个强体力劳动的职业,加班是IT公司的日常,过劳猝死在程序员行业中屡见不鲜,别的行当且不论,至少IT巨头恐怕是没有脸面说程序员这个职业和体力无关的吧。

文章接下来一段话也是颠三倒四,让人迷惑:“一项2014年的领导力研究更是指出,男女在领导能力方面也不存在差异,不过有趣的是,在只用他人评价来评估领导力的情况下,女性的领导力更好;在只用自我评价来评估领导力的情况下,男性通常比女性展现出更自信的态度。”——那么我就纳闷了,只用他人评价的时候女性更好,只用自己评价是男性更好,那么怎么就得出了“不存在差异”的结论呢?他人评分和自我评分加起来平均一下正好相等?还是说研究员还有另一套评价?

“领导力”是一个很难量化的概念,它本身就是多元化的,比如张三领导的团队产量更高,李四领导的团队质量更精,那么谁领导得好呢?王五领导的团队整齐划一,马六领导的团队其乐融融,那么谁领导得好呢?“领导力”不是不可以被评估,而是可以由许多维度去评估。

把各种不同的维度糅合在一起,只按照线性的单维度给一个总评分,然后只关心最后这个总评分是否男女相等,这是非常滑稽的一件事情。事实上我们可以调节不同维度所占的比重,以至于无论实际有哪些差异,最后保证男女在总评分上相等,但这么做有意思吗?

事实上文中那一句话已然透露出男性领导和女性领导在质的方面有所差异,适应于截然不同的评价向度,但论者硬生生无视了质的差异而强调量的等同,这是有多盲目呢?

 

接下来关于数学能力,一下子轰出了4000篇论文,炸的我一愣一愣的:“约4000项研究得出的一致结果是,数学成绩的性别差异接近为零。两个性别中的差异趋势非常相似,其中男性中的差异略多一些。

但事实上,这个结果也符合大多数“偏见”者的预期:数学最好的和最差的都是男生。那么好了,已经有4000项研究都同意:数学方面男性的差异更大,而女性相对更集中于中部。但那位作者的结论是,简单平均一下,“差异为零”。但问题是,如果我们考虑的是诸如高端工程师、技术专家、大公司的程序员等等这样一类职业的时候,我们应当注意到,这些职业的潜在入职者并不恰好等同于所有人,而是教育水平较高、能力较突出的那一拨人。也就是说,能够到谷歌之类大公司当程序员的人,很少有可能是一所普通中小学中的中等或偏下的那部分学生,而往往是尖子中的尖子。而成绩较差的那一部分学生呢?他们压根就不太可能成为大IT公司的潜在雇员。

那么问题来了,在尖子生中间,再来考虑男女比例问题呢?前面说了,男女生平均分相等,但男生方差大,那么结论就是在数学尖子生中,男性比女性多。只要男生的方差比女生大那么一点点,在只考虑越是顶尖的人才的时候差异就越会被放大。

当然,文章马上就又摆出弱辩护了:“即使男性的数学能力占优势,那也大多是文化偏见的结果。”这句话本身我当然双手赞同,“大多”一词也很严谨。但问题是他上下文的论证又让人困惑了。

在小学阶段女生数学成绩更好,而高中阶段男生反超,越是观念传统的国家越是明显。这的确能够佐证后天规训对数学成绩的影响,但另一方面也应当注意到,小学低年级的数学和高中数学完全不是同一种学问,小学数学最初学习的是计数、计算之类,而中等数学主要包括证明和代数运算。而复杂的几何证明和代数运算,才要求高度的抽象思维能力,实质上非常依赖于空间想象能力(代数运算事实上也需要空间能力,至少对我来说,演算复杂的方程就是对一个个符号的辗转腾挪过程)。而据较老的研究说“空间能力”“是已知最大的认知性别差异。”我不知道那个研究是否已经被学界反驳,但至少我们应当注意到,小学数学和高中数学并非难度线性递增,而是存在不同的维度。

接下来的一段话最为匪夷所思,我一度以为是翻译严重偏差,查了英文版之后发现确实差不多是这个意思:“事实上,如果老师阅卷时知道学生的名字,男孩会在数学考试中表现更出色。而如果阅卷是在匿名的情况下进行的话,女孩就会表现更出色。如果在数学考试前提醒大学生他们的性别,女生的成绩就会比男生差43%,但如果告诉学生数学考试只是一场问题解答测验,性别差距就消失了。

被试者的偏见当然可能极大地左右实验结果,因此现代实验方法特别强调“双盲法”。但问题是,什么样的数学考试会有如此显著的差异啊?这可是针对大学生的测试啊,只是提醒一下性别就会造成43%的波动吗?

我不清楚这43%是类似男生降低21%然后女生提高21%的结果,还是女生特别受影响。如果是女生受影响更大,那么这就证明了一种显著的性别差异:女生的数学成绩竟然如此易受临场情绪的影响(这也是传统的对女性的偏见之一)。当然事实上我不相信这一回事。正常的数学考核不可能有那么大不确定性,数值计算的题目做对了就是做对了,错了就是错了,证明题证得出就是证得出,没证出就是没证出,没有那么大暧昧空间。真要达到那么明显的效果,只能说明这个实验中的所谓数学考试或数学老师有毛病。

最后呈现了一张图表,显示“从1980年代开始,女性在医学、法学和自然科学领域的入学率在上升,但在计算机科学领域的入学率在持续下降。”论者试图用这张图表来佐证“女性工程师人数少不是生理结果,而是社会规训的结果。一直以来,女性就不被鼓励投身计算机科学领域。”但我又纳闷了,难道说一直以来,女性就被鼓励投身自然科学领域了吗?关于女性不适合研究自然科学的偏见更为悠久,更为根深蒂固吧?而计算机科学本质上是新事物,特别是上世纪末随着个人电脑和互联网出现而崛起的整个IT行业,可以说对一般人而言几乎是全新的东西,大多数人听都没听过,怎么就能迅速建立起社会文化传统的偏见呢?这新建立出来的偏见,怎么就那么厉害,在其它传统偏见日益弱化的同时逆势而行呢?和其它学科相比,这新偏见如此迅速地建立,如此迅速地起效,是否说明计算机这个行当与女性的关系尤为特别呢?我不想对这张图表做过多解读,但如果非要解读,恐怕是未必能解读出论者想要的结论吧。

 

需要再三强调的是,我丝毫无意站在“备忘录”的一边,事实上类似的问题,在“保守派”那边或许更加严重——肆无忌惮地、迫不及待地引用大量所谓“科学”、“证据”、“事实”。

我认为,男女平等首先是一种品位问题,是审美问题;其次是伦理问题,是政治问题;再次是经济问题、社会问题;最后的最后才有一点点科学的问题。男女天生在生理上平等还是不平等,真的那么重要吗?先天与后天的界限如此截然吗?

假设女性确实在生理上不擅长数学,那又怎么样呢?难道男女平权的思想就要打折扣了吗?假设女性确实在生理上与男性一样擅长数学,那又怎么样呢?由社会环境或技术环境造就的多元的文化和亚文化就不值得尊重了吗?

现在许多人依赖科学来证明平等思想的合理性,就好比当年许多“自然神学家”依赖科学来证明信仰的合理性那样。当时貌似很强悍,很令人信服,但却交出了主动权,等科学一发展,理论一变化,宗教一下没跟上,还挂靠在过时科学结论上面,整个信仰就雪崩了。

现在关于性别平等、种族平等之类的论文,过于强调先天与后天、生理与头脑、个体与环境、自然与文化等等二元范畴之间的截然差异,以为后天被塑造的都是文化的而不是自然的(本性的),这种思想在技术哲学角度看是可疑的。

我在“垃圾”论文的最后提到,现代人因为误把“大屠杀”的悲剧归因于“种族歧视”,从此对“歧视”极为敏感。但从一开始问题就不在“歧视”,而在于“无用——有用”的单向度思维。现代人用单线的、量化的标准来衡量事物,这种逻辑本身恰是大屠杀的核心,而我们现在仍然只会在单一维度上从是否相等来衡量性别差异——“有用”的能力必须相等,“无用”的能力(诸如体力)才可以不相等,这样男女就平等了!但这种逻辑本身也许比歧视更加危险。

关于 胡翌霖

胡翌霖,清华大学科学史系副教授。本站文章在未注明转载的情况下均为我的原创文章。原则上允许任何媒体引用和转载,但必须注明作者并标注出处(原文链接),详情参考版权说明。本站为非营利性个人网站。