FWD: 常聽到「相關不代表因果」,但科學家如何找出因果關係?
Published by Frank C.S. Liu,
常聽到「相關不代表因果」,但科學家如何找出因果關係?
作者:史丹福, thenewslens.com2017/07/10 04:21
這是一個荒謬的年代,這是一個不重視科學的年代。這個年代,人人都可以是專家,隨意地亂說一些理論,然後又竟然有人會相信。當專家出來改正他們的錯,他們又覺得專家「收了錢」、「幫政府說話」,或是「只重視數據,不著重人性」。
我對這個現象深感厭惡,所以此次決定寫篇文章談談科學。其實科學不是知識,而是一個方法,是一種精神。科學的方法其實遠比知識本身重要,科學知識會錯,但科學方法不會。我們之所以覺得科學知識是真理,不是因為它來自權威人士,而是因為它來自科學的方法。
在我們談科學方法之前,先說一個小故事。有一位癌症病人,他在使用化療後發燒,而抗生素對他也沒有效,於是我為他處方了抗真菌藥micafungin。第二天,我再去看病人時,他跟我說︰「醫生,我覺得這種藥很好!可不可以繼續讓我使用?我用了這種藥後就再沒有去夜尿了!」小弟一臉無奈,憑我藥理學及生理學的知識,我知道micafungin不會令人夜尿減少,但這其實也不是一個符合科學方法的推斷。我們要如何才能夠很科學地推斷出micafungin不會令人夜尿減少呢?
為何難以確定因果關係?
先聲明,下面所提及的方法主要都是用在生物學及醫學中,對物理學或化學等的科學則未必一定有用。因為涉及生物的科學是很複雜的,比物理學或化學複雜。物理學家容易找到兩粒相同的電子、兩個相同的磁場、兩個相同的無線電波;化學家容易找到兩種相同的金屬、氣體、溶劑,但生物學家不會找到兩種相同的生物,生物有不同的基因,不同的營養狀態,不同的器官功能,所以涉及生物的科學現象很難如物理化學的精準,它很多時候都只是可以提供到一個大約的因果關係。
要確立一個因果關係,其實也是很困難的,因為生物學及醫學的世界太複雜,往往都會有些干擾因子(Confounding factors)去影響你。舉個例子,雪糕的銷售量越高,於海灘溺水的人數也越多。那我們可以說雪糕令人溺水嗎?當然不是,它們表面上看似有關係,其實只不過是因為氣溫越高,越多人買雪糕,同時也越多人游泳,所以溺水的人也越多。但其實這個偽關係是由氣溫高這個「干擾因子」引起的。
例如反疫苗人士其中一個最愛的論點是,「自從美國開始引進MMR三合一疫苗後,自閉症的人數也大幅度上升,所以MMR三合一疫苗會引起自閉症」。這個推論其實與「雪糕令人溺水」一樣,初看好像很合理,但當中可以干擾我們分析的干擾因子太多了。美國引進MMR三合一疫苗後,除了自閉症的人數上升,也發生了很多其他事,香港的人口增多、樓價上升、美國政府投放在科研的經費上升、毛澤東過世,鄧小平第三次復出……根據相同的邏輯,難道我們可以得出鄧小平第三次復出令自閉症人數上升嗎?
Figure adapted from Wakefield (1999)依照相同的邏輯,在泳池中溺水的人數與美國核電廠發電量也是高度相關的,那又是否代表核電廠發電會「導致」人在泳池中溺水呢?
Figure adapted from http://tylervigen.com甚至美國小姐的年齡與被蒸氣或熱的物件所謀殺的數量也是相關的,難到年紀大的美國小姐會「導致」人被蒸氣或熱的物件所謀殺?
Figure adapted from http://tylervigen.com我想帶出的是,Correlation doesn’t imply causation,相關不代表因果!
其實理論上,如果要得出X導致Y的結論(確定性因果關係,deterministic causality),應該要下列三個條件都要成立︰
- X發生在Y之前
- 若X不發生則Y也不發生
- 若X發生則Y一定發生
但生物學及醫學中很多的因果關係其實並不是確定性因果關係,X可能只會增加Y的機會,而不一定會引起Y,這被稱為機率性因果關係(probabilistic causality)。
分析因果關係的希爾準則
機率性因果關係是很難處理的,特別是因為有很多干擾因子可以介入。英國的一位流行病學學者希爾(Bradford Hill)就曾經提出過9項的準則,幫助我們分析出兩件事件間有沒有因果關係,這幾個準則被稱為希爾準則(Bradford Hill's criteria)。
這些準則其實也有不足的,但可以作為入門,讓大家初步地了解一下科學家是如何思考的。我們就以micafungin令夜尿減少為例子,看看希爾準則如何分析這個問題。
第一,時序性(Temporality),即如果X導致Y,那X一定發生在Y之前。這應該是9個準則中最重要的,如果不符合時序性,因果關係可以立即被否定。如果因果成立,病人一定是先用了micafungin,夜尿才開始減少。如果病人在用micafungin之前夜尿已經開始減少,那夜尿減少的原因當然不是micafungin。
第二,強度(Strength),即觀察一個事件對另一個事件的影響有多強。例如,如果病人用micafungin後,夜晚排尿由1升減至990毫升,這個影響似乎是微不足道,我們覺得它們兩者有因果關係的機會不高。但如果病人用micafungin後,夜晚排尿由1升減至100毫升,這個影響可大了!我們對它們兩者有因果關係的信心自然大得多。
第三,一致性(Consistency),即兩件事件的相關性在不同情況之下都會出現。例如,如果病人在內科病房時用micafungin會夜尿減少,但在外科病房中使用則不會,這又會令我們覺得它們兩者有因果關係的機會不高。所以一般在學術界中,如果越多不同的團隊做研究都得多相同的結果,我們覺得這些研究證明的因果關係的可信度是越高的。
第四,劑量反應關係(Dose-response relation),即接受的劑量越高,反應也應該越大。如果病人在接受較高劑量的micafungin時,夜尿會減少得更多,我們就比較有信心它們之間有因果關係。
第五,可逆性(Reversibility),就是將因子移除會令另一因子發生的程度減低。如果病人在停用micafungin之後,夜尿又再度增加,那我們就比較有信心它們兩者是相關的。反疫苗人士另一個大論點是疫苗中合有硫柳汞(Thimerosal),一種含有水銀的防腐劑,所以會導致自閉。其實在瑞典及丹麥,研究人員發現當1980至1990年,含有硫柳汞的疫苗被使用的時候,自閉症的人數的確持續上升。但在1992年後,疫苗已經不再使用硫柳汞,而自閉症的人數卻依然持續上升,這似乎是不符合希爾準則中可逆性的準則。
第六,生物合理性(Biological plausibility),即相關是否有一個合理的解釋。如吸煙引起肺癌,我們有一個很合理的解釋,就是煙草中的致癌物質會破壞細胞的DNA,增加基因變異的機會,所以可以引起肺癌。至於,micafungin這種抗真菌藥物使夜尿減少,似乎沒有甚麼合理的解釋。當然,這不是一個十分強的準則,因為也許有一些可以幫助解釋現象的知識是我們暫時所缺乏的。
之後的三個準則是比較弱的,所以小弟只是約略提一下︰
第七,同調性(Coherence),即沒有與現有的其他理論衝突。
第八,類比性(Analogy),將某個已知的因果關係,類比至其他相似的關係上,並依此推論其因果關係存在與否。
第九,特異性(Specificity),即一個果只有一個因。但這個準則也許是9個準則中最弱的,因為生物學及醫學上的複雜性,一個果往往都可以又不同的原因促成,例如肝癌可以是由B型肝炎病毒、C型肝炎病毒、喝酒,甚至是發霉的花生所引起的。
至少記住「相關不代表因果」
在明白了希爾準則的9個準則之後,大家以後聽到「MMR疫苗會引起自閉」、「CIK療法可以補身」、「睡在天壇公園的大理石橋面上可以治病痛」、「反國民教育會令青少年殺父母」、「TSA可以提升學生成績」、「醫生,我每次吃個蘋果,第二日就退燒啦,蘋果可以幫我退燒」、「醫生,我每次做完運動就會發燒,做運動會令我發燒」等訊息時,可以用希爾準則去思考一下當中的因果關係是否合乎科學,合乎邏輯。
希爾準則其實只是一個入門,小弟想介紹它,好讓大家明白一個因果關係不是容易建立的,科學家在確定一個因果關係之前,其實已經考慮了很多的因素。如果大家實在無法明白或記得希爾準則,也不要緊,小弟希望大家至少可以記得一個重點訊息──「Correlation doesn’t imply causation,相關不代表因果」!
當然,要證明因果關係,先要有數據。而怎樣去獲得數據,又是一門大學問。我們下次再談談如何可以合乎科學方法地獲得數據,可以合乎科學方法地分析數據。
資料來源︰
- Mrozek-Budzyn, D., Kieltyka, A., Majewska, R., & Augustyniak, M. (2011). Lack of Association between Thimerosal-Containing Vaccines and Autism: A Case-Control Study in Poland. Pediatric Research, 70, 339-339.
本文獲授權轉載,原文見史丹福狂想曲。
相關文章︰
責任編輯︰鄭家榆
核稿編輯︰王陽翎
Original Page: https://www.thenewslens.com/article/73090