大公网

大公资讯 > 大公言论 > 视角 > 正文

热闻

  • 图片

宋小庄:揭穿“钟氏民调”假学术面具

如果钟氏标榜学术,应将不同的计算方法得出的不同的结论提供给读者。如钟氏有孟子所说的人之四端,就应当自己检讨一下,有关原始数据的取得,有无失误,对相关数据的解读方法是否偏颇。

  如果钟氏标榜学术,应将不同的计算方法得出的不同的结论提供给读者。但钟氏并没有这样做,而是选择对梁振英不利的统计方法,不愿意採用对梁振英有利的方法,也不愿意并列不同的方法,并作出适宜和不适宜的说明。这是令人遗憾的偏见。

  不久前,在北京两会期间政协常委李家杰点名批评港大民意研究计划钟庭耀在关键时刻发表对中央及特区政府不利的民调,并呼吁商界自行组织民调,以了解香港的正式情况。香港商界会不会这样做,笔者不得而知。但中央政府和特区政府应当自行进行民调,这样就可以得到真实的原始数据,得到科学的解读,不必经过钟庭耀之流的魔术师操作,也就不必任由钟氏统计术的解读。有了真实的原始数据,有了科学的解释,就可以了解香港的真实情况,供决策和施政的参考,还可以拆穿钟氏的假学术的面具,港大这样的学术机构也许就会觉得让钟氏继续借用港大的招牌,是港大的耻辱,是学术的耻辱了。

  如钟氏有孟子所说的人之四端,就应当自己检讨一下,有关原始数据的取得,有无失误,对相关数据的解读方法是否偏颇。但钟氏似乎缺乏这种反省能力,他把别人对他的统计术的批评,理解为人家要他讨好政府,扭曲民调结果,把管治的问题说成是“国王的新衣”。为了证明自己是很坦白的小孩子,他最近又公布了3月3日至6日对梁振英的评分的调查。

  钟氏缺乏自我反省

  该调查以0分表示绝对不支持,以100分表示绝对支持,以50分表示一半半,50分为及格。成功问了998人,有61.8%打了50分或以上,有38.2%打了50分以下,其中有91人打了0分,有29人打了100分。按一般人理解,有六成以上的人给了50分以上,就及格了。但钟氏以平均分计算,是47.5分,不及格。

  这就是钟氏统计术之妙用。统计到底是一门学问,还是一种邪术,在乎一心。19世纪英国的政治家Benjamin Disreili曾经尖锐地讽刺了统计术,他说,世上有三种骗术:谎言,糟糕的谎言和统计。这位政治家担任过两任英国首相,竟然把骗子与利用统计数据误导别人的人,当作一丘之貉,可谓别开生面。对统计具有误导性的作用,有一位美国的知名记者Darrell Huff还在上世纪五十年代出了一本畅销书,书名是“How to lie with statistics”,直译是《统计如何骗人》或是《如何利用统计骗人》,也可以译成《统计与谎言》,就举了大量利用统计方法本身的缺陷误导大众的事例。

  统计方法具误导性

  钟氏为什么会把香港市民对梁振英的评分算成不及格呢?钟氏没有提供计算方法,但从港大民意研究计划披露的数据推测,钟氏採用的是算术平均法。

  算术平均法的缺陷是在有极端数据存在的情况下,不能用,或要慎用,否则就会产生误导。例如有一个十人科研小组,在评分的时候有一人得90分,一人得80分,一人得70分,一人得60分,一人得50分,一人得40分,一人得30分,一人得20分,但有两人得0分,总平均只有44分,不及格,这是因为有0分拉底了平均分。按照钟氏的统计术的结论,这个科研小组完全不合格,要淘汰。但实际上,在该小组中,有半数都是科研人才,其中两位还比较突出。这是示意性例子,但有关的道理还是容易理解的。在钟氏的数据中,有91人打了0分,有29人打了100分,如果不加以排除,得出了的平均数就具有误导性。

  然而,为求真实,不能排除任何数据。在这种情况下,只能从方法入手,算术平均法就不宜适用,而应当採用中位数法。如採用中位数法,梁振英的评分就必然会远高于及格。由于没有具体的数据,笔者无法推算。如果钟氏标榜学术,应将不同的计算方法得出的不同的结论提供给读者。但钟氏并没有这样做,而是选择对梁振英不利的统计方法,不愿意採用对梁振英有利的方法,也不愿意并列不同的方法,并作出适宜和不适宜的说明。这是令人遗憾的偏见。

  问题设计不科学

  在钟氏主导下,港大民意研究计划的错误还不仅仅是统计方法的偏颇,而且包括问题的设计。例如对港人认同感、归属感的问卷,钟氏把问题分为四类,一类是香港人,一类是中国人,一类是中国的香港人,一类是香港的中国人。由于这四类人都可能有重叠、部分或全部包含等不同的情况,就不应当分列为统计事项,否则得出来的数据,不是偏高,就是偏低。如果要问,还须预设一个前提,就是要先问被访问者是否具有中国国籍,如果确定了具有中国国籍,才可以再问是否认为自己是中国人,不是中国人或不知道这三个问题,才能做出科学的统计。如果确定了具有外国国籍,就可以再问是否认为自己是香港人,不是香港人,不知道这三个问题。这样得出来的原始数据,才有进一步分析的价值。否则问题本身不科学,得出来的数据就没有研究的价值,也就没有统计数据的方法可言了。

  作者为香港资深评论员,深圳大学教授

  • 责任编辑:单纬

人参与 条评论

微博关注:

大公网

  • 打印