無用之用:論療效無益的臨床試驗 Futility in Clinical Trials

Gem Wu
·
·
IPFS
·
安寧病房都要求我們每週讀一篇文章,本篇文章為今天於病房會議時的報告內容。

臨床試驗的目的

我要怎麼知道醫師給的藥、廣告裡的營養品,與路邊看到的療法有沒有效?以當代科學的觀點來看,鄰居說有用不算,樣本太少且沒有對照組,我們必須要靠臨床試驗(Clinical Trials)才知道療效。

針炙、西藥、O雞精有效嗎?實驗後才知道。

臨床試驗的目的,除了再於優化診療模式外,在實務層面,可以取得如食藥署等監管機構的核可,並量化對病人的幫助。

然而,不是所有的臨床試驗都能從一而終,有些試驗被提早中止,而中止的原因,我們可以從明O花露水的情境題來理解:

當我們看到「明O花露水之回春效果試驗提早結束。」請問哪些選項為可能原因?

A. 效果太好,每一個聞到的阿嬤都變回十八歲。
B. 效果普通,有聞和沒聞一樣,阿嬤還是阿嬤。
C. 效果負面,許多阿嬤聞完立刻暈倒。
D. 以上皆有可能。

以「試驗提早結束」的原因來看,只有三種:

(A) 有效 (benefit)

(B) 療效無益 (futility)

(C) 病人無法承受 (tolerability concerns)

明O花露水並沒有接受嚴格的臨床試驗考驗,療效無從證實,我們只能回答「以上皆有可能」。

療效無益的概念

在這篇文章中的「療效無益」便是選項 B 的狀況:「效果普通,有聞和沒聞一樣,阿嬤還是阿嬤。」

而療效無益會有三種可能的原因:「證據顯示沒有療效」、「大量資料不全以致難以分析結果」,以及「事件發生率過低,無法有比較的意義」。

以「證據顯示沒有療效」這個原因為例,早期阿茲海默症試驗1638 (EMERGE) 與 1647 (ENGAGE) 位病人因針對類澱料標靶藥Aducanumab無效而中止。而「大量資料不全」通常是執行層面與單位的問題,較少有被宣告中止的試驗明確被指出此因(講出來想必也會十分尷尬)。至於「事件發生率過低」,則可以從ACTIV-4b 試驗的案例來理解。在ACTIV-4b 試驗中,因 COVID-19 疫苗可能產生血栓,實驗人員在打疫苗前先給予病人抗血栓藥物。但血栓機率發生太低 (3/558),無法產生有意義統計結果,因此先行中止。以上原因由數據與安全監測委員會 (Data and Safety Monitoring Boards; DSMB) 。

文章中以西班牙大型臨床試驗,共1401位大血管中風病人參加的 RACECAT 為例。只要一中風,病人有兩條路:

  • A路線(對照組):小醫院藥物溶栓後,轉至大醫院手術取栓。

  • B路線(實驗組):直接送至大醫院藥物溶栓、手術取栓。

其後以中風後九十天的中風整體狀態分級(modified Rankin Scale, mRS)為療效評估標準。很不幸地,試驗在第二個期中分析時被中止,原因是「特地送病人到取栓單位」這件事本身也缺乏效力。

我們可以觀察到,RACECAT 在「療效無益」的裁定中,主要以「統計上療效無益」為由。剛剛提到的療效無益有三個原因,而這邊為兩種型態,這兩種型態分別為:

  • 統計上療效無益 Statistical Futility

  • 實務上窒礙難行 Infeasibility

統計上療效無益 (Statistical Futility),除了用 p 值是否達顯著來看,還有條件檢定力 (conditional power, CP)、預測概率 (predictive probabilities),以及貝氏事後概率分佈 (Bayesian posterior probabilities)。如果是統計上的療效無益,我們就能說實驗項目與對照項目在設定的結果上沒有差異

實務上窒礙難行 (Infeasibility),則包括各種不可抗力之外因、經費不足、試驗者不夠等,像 COVID-19 來襲以致試驗中斷,也是實務上窒礙難行。我們無法說實驗組與對照組沒差,只能說證據不足、結論未明

當 DSMB 委員會宣告療效無益時,還有分具強制力 (binding,又譯綁定) 與不具強制力的 (non-binding,又譯非綁定) 宣告。

解讀療效無益試驗結果的好處與限制

莊子所言「無用之用」,很能詮釋「療效無益」宣告的作用。它的好處在於:節省成本、減少不必要的傷害,以及讓病人有更多機會參加到實際有幫助的試驗。

臨床試驗的「療效無益」對試驗結果的影響則是:型一偏誤(偽陽性)的減少,以及型二偏誤(偽陰性)增加。

如果因療效無益宣告而中止試驗,則會出現樣本數少、無法進行更小族群的分析,因此相對粗略的解讀限制。

回到 RACECAT 試驗,共1401位大血管中風病人參加,當分析1225位病人(70%)時,發現結果差不多,試驗便在第二期期中中止。結論是就近找醫院打藥溶栓比較方便,和飛遠遠去去栓的地方效果差不多。即使這個試驗會被解讀為「沒有差異」,它還是面臨了醫療地理學研究的解讀限制。

最後,我們除了放眼國際,還是要紮根台灣,我們將這個研究結果帶回本島。

當家住安坑而家人不幸大血管中風時,應該要送至哪個醫院。如果單就 RACECAT 結果而言的話,會回答 A,而考量到「療效無益」以及不同國家醫療地理條件的限制的話會選 C,然而,實際情況則是 D —決定擇不在我們手上。評讀固然重要,能夠回到應用層面更重要。

以上是我今天簡短的分享,謝謝大家。

後記:團隊會議座中有位宗教師師父。在聽完報告後的評語是「有個古老的靈魂」,我在想是不是和大量援用鄉土劇為例有關,至今仍困惑當中。

CC BY-NC-ND 4.0 授权

喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!