生物研究的困惑 part 1
生物醫學統的統計難題(給有統計背景的人)
我是物理系畢業的,後來卻轉到生物醫學,成為生物資訊研究人員。一開始,我水土不服,因為我不懂大家在做什麼。生物醫學研究(排除流行病學)通常提出一個問題,例如某藥是否對某病有效。他們會假設藥物有用,然後收集樣本,隨機分成兩組,進行實驗,用統計計算 p-value,判斷結果是否顯著。
看似合理,但我卻感到困惑。首先,他們常將樣本結果推論到所有個體,忽略統計學的核心: 樣本須隨機抽自明確定義的母體,才能代表母體並進行推論 。可是生物醫學論文很少定義母體,也沒有評估抽樣誤差,他們常常直接把內在效度當外在效度,而以再把這個結果推論到每個個體。這違背了我對統計的認知, 這些研究假設個體間具同質性 ,但若真如此,研究單一個體就夠,何需統計?
接著,若 p-value 不如預期,他們會更換統計方法,甚至忽略方法假設。 母體未定義,誰知哪種方法正確? 若仍失敗,他們用 PCA 等數學工具排除異常值,這叫「p-value hacking」。我難以接受這種「統計萬能論」。
最後,若全失敗,他們可能 改假設、加樣本、變流程,甚至直接棄實驗不發表 。生物醫學研究科學嗎?我不確定。但從一開始忽略母體,錯誤就已埋下。 再現性低不是危機,有再現性才有問題 。
從物理到生物:研究的怪事紀錄(給沒有統計背景的人)
從物理到生物醫學:我為什麼覺得研究怪怪的?
我本來學物理,後來跳到生物醫學,研究生物資訊。一開始,我像掉進外星世界,完全搞不懂大家在幹嘛。生物醫學研究(不包括研究傳染病的流行病學)通常是這樣:他們想知道某個藥能不能治某種病,假設藥有用,然後找一堆人,分成兩組做實驗,一組吃藥,一組不吃。最後用統計算出一個數字(叫 p-value),看結果是不是「顯著」,也就是說藥是不是真的有用。
這聽起來很科學,對吧?但我越看越困惑。
問題一:研究的「人」是誰?
做實驗時,研究者會找一些人來試藥,比如100個病人,然後說:「這藥對這病有效!」但他們很少說清楚,這些病人代表哪些人。是全世界的病人?某個城市的?某個年齡的?統計學告訴我們,只有隨機選出的樣本,才能代表某個明確的群體。可很多研究沒說清楚這群體是誰,就把實驗結果推到所有人身上。這就像你問10個朋友喜歡什麼飲料,然後說全台灣人都愛珍奶一樣,靠譜嗎?
問題二:數據被「修」到好看
如果實驗結果不如預期,研究者有時會換個統計方法,換到結果「好看」為止。就像玩遊戲輸了就改規則。這還不算,有些人會用數學工具把「怪怪的數據」丟掉,直到結果符合期待。這叫「操弄數據」,讓我覺得不太對勁。如果方法隨便換,怎麼知道結果可信?
問題三:失敗就不說話
如果實驗完全失敗,研究者可能改問題、加人、換方法,甚至直接把實驗丟進垃圾桶,不告訴別人。這樣我們只看到「成功」的論文,失敗的呢?不公開,別人怎麼知道真相?
這真的是科學嗎?
我開始懷疑,生物醫學研究到底科不科學?從一開始沒說清楚研究的「人」是誰,問題就已經埋下了。這樣子想想,研究結果無法重複就顯的非常合理了。