頭腦風(fēng)暴 —— 創(chuàng)新藥投資及研發(fā)成功率的思考

1546486814(1).jpg

本文引用了大量以往的文獻和數(shù)據(jù),也包含了部分我們的觀點與分析。在此我們不保證觀點與分析的正確性,完整性與時效性,歡迎大家指出我們的錯誤。

 

創(chuàng)新藥投資與其他任何行業(yè)投資最顯著的差別就是項目在臨床試驗階段面臨極低的成功率。對于Biotech企業(yè)一旦其首要管線的臨床實驗失敗,這種輕資產(chǎn)公司的價值將巨幅降低。其最終的結(jié)果無非是兩種,公司破產(chǎn)或者原股東面臨巨額的低價稀釋退出遙遙無期。對于VC來說這兩種結(jié)果并無任何差別,可以說判斷管線臨床試驗風(fēng)險的高低是biotech VC最核心的工作之一。


然而十分幸運的是新藥臨床試驗數(shù)據(jù)的積累讓Biotech行業(yè)的最主要風(fēng)險,臨床失敗風(fēng)險比任何其他行業(yè)的主要風(fēng)險都更容易的進行半定量分析。下面我們將對臨床成功率和臨床失敗的原因及對策做一個簡易性的概要。

 

“10年,10億美金,10%成功上市”是每一個對于Biotech行業(yè)稍有了解的人知道的話。這句話雖然不能說是一個錯誤的描述,但其實離正確也相去甚遠。


在VC行業(yè)目前使用最廣泛的衡量管線成功率工具是BIO于2016年發(fā)布的報告《Clinical Development Success Rates 2006-2015》,這份報告包含了來自1103家公司的7455個進入臨床階段的新藥項目,總計9985個注冊性臨床試驗的統(tǒng)計結(jié)果。


這份報告有幾個十分明顯的優(yōu)勢:

(1)數(shù)據(jù)量相當(dāng)大,而且來源豐富,比同類的報告更具全面性;

(2)各種統(tǒng)計口徑比較齊全;

(3)行業(yè)報告對比專業(yè)期刊的文章更簡單易用。

 

這份報告的概要如下:

(1)全口徑統(tǒng)計下進入臨床試驗階段的藥品獲批上市(LOA)的成功率為9.6%,其中臨床試驗階段的非腫瘤藥品獲批上市的機率為11.9%。(LOA,likely of approval,以下用LOA代替藥物獲批成功率)

(2)罕見病藥品和使用生物標(biāo)記物進行篩選臨床試驗入組病人的藥品在各期臨床成功率對比總體均值都有優(yōu)勢。

(3)慢性高發(fā)疾病藥品的LOA幾率低于總體均值。

(4)14個主要疾病領(lǐng)域內(nèi),血液疾病擁有最高的LOA 26.1%,而腫瘤擁有最低的LOA 5.1%。

(5)在子類中血液瘤的臨床成功率是實體腫瘤的2倍。

(6)2期臨床成功率是各階段臨床中最低的,只有30.1%的藥品可以成功通過2期進入3期臨床。

 

下面僅對報告的內(nèi)容截取一些結(jié)果摘要,如果大家需要了解更多請自行下載報告原文。


1546486865(1).jpg


1546486890(1).jpg


1546486917(1).jpg


好了,以下是我們的分析和觀點:


當(dāng)我們的談?wù)擁椖康某晒β实臅r候我們應(yīng)當(dāng)意識到,成功率本身是一個簡單的統(tǒng)計學(xué)得到的結(jié)果。那么我們在把這些結(jié)果應(yīng)用到各種情況下的時候就不得不對其各個指標(biāo)的定義,統(tǒng)計的方法學(xué)甚至數(shù)字背后的含義做到相應(yīng)的了解,以免出現(xiàn)拿著蘋果和樹葉比質(zhì)量的事情。比如在這份報告中:


(1)BIO比較了NME和Biologics的臨床成功率區(qū)別,但是我們應(yīng)當(dāng)意識到一般意義上的NME和Biologics是來自于FDA對于藥品的標(biāo)識,并非我們傳統(tǒng)語境意義下的小分子與大分子。在FDA的定義中NME包括了小分子藥品,多肽和融合蛋白,而Biologic則包括了單抗,多肽,融合蛋白,酶,細胞因子,生長因子,疫苗,基因療法和組織/細胞等。


這份報告最特殊的則是它的NME和Biologics的分類來自于Biomedtracker數(shù)據(jù)庫的標(biāo)識,這個數(shù)據(jù)庫與FDA分類最大的區(qū)別則在于對疫苗產(chǎn)品的統(tǒng)計,在FDA規(guī)則下疫苗歸屬于Biologics,而在這份報告中疫苗臨床進行單獨測算,不計入Biologics。


(2)BIO報告的統(tǒng)計方法學(xué)也是值得深究的地方。這份報告中的計算方法是(進入X+1期臨床的管線)/(進入X+1期臨床的管線+ 在X期中止的管線)。


當(dāng)我們把各期成功率相乘后得到的LOA實際上是一個產(chǎn)品成功通過1個一期,1個二期,一個三期最后成功上市的幾率,換句話說這個成功率回答了一個問題“新藥在某一適應(yīng)癥中的平均成功幾率是多少?”。


而一般在衡量項目是我們更需要回答的問題則是“新藥在任意一個適應(yīng)癥中的平均成功幾率是多少?”,畢竟一個新藥有幾個適應(yīng)癥是相當(dāng)普遍的。


(3)在各期成功率中我們可以明顯地看到癌癥,心血管和精神疾病的2期臨床成功率不足25%,顯著低于均值。而血液疾病,代謝類疾病,眼科疾病和感染類疾病的2期臨床成功率則超過40%,顯著高于平均值。


考慮到2期臨床的失敗中療效是主要問題,我們可以推斷癌癥,心血管和精神疾病臨床前動物模型的預(yù)示效率很低。在這些領(lǐng)域我們更需要相對高質(zhì)量的藥效學(xué)模型的數(shù)據(jù)。


(4)癌癥在3期臨床中的通過率顯著低于其他任何疾病領(lǐng)域,這代表腫瘤藥品的2期臨床假陽性率更高。我們對于2期臨床結(jié)果是陽性,但沒有較大優(yōu)勢的管線的估值需要額外注意。

 

 

除了BIO 2016年的報告外還有幾篇文章也可以用于風(fēng)險的測算。


-------Paper 1------

 

第一篇文章是Kola于2004年發(fā)表的《Can the pharmaceutical industry reduce attrition rates?》。這篇文章統(tǒng)計了阿斯利康,BMS,諾華,輝瑞等歐美前10大的藥企在1991年到2000間進入臨床階段的管線的開發(fā)情況。這篇文章的問題在于他的數(shù)據(jù)及結(jié)果基本是引用自其他文章,統(tǒng)計的口徑與方法并不明確。

 

《Can the pharmaceutical industry reduce attrition rates?》的概要大致如下:

(1)在1991年到2000間進入臨床階段的管線約有11%進入臨床的藥品成功上市。(按照文章原文,最有可能的統(tǒng)計口徑是按照lead indication計算了,計算方式本文下面有解釋。)


(2)在2000年初時約有30%的失敗是由藥效引起的,另外還有約20%是因為毒性。


(3)90年代初與2000年初對比藥品臨床失敗的原因變化明顯,PK問題從失敗的主要因素變成了小問題。


(4)1991到2000年間CNS和腫瘤領(lǐng)域NDA/BLA的成功率不足70%。我們的注解:那個年代11%的上市成功率不能與現(xiàn)在的成功率相提并論。過去10年來NDA/BLA的成功率基本保持在85%左右,而90年代不足70%的NDA/BLA成功率相當(dāng)于把注冊風(fēng)險提高到了3期臨床的水平。


(5)缺乏療效的失敗案例在腫瘤和CNS領(lǐng)域顯著高于其他疾病領(lǐng)域。我們的注解:這些說明90年代使用的CNS和腫瘤模型缺乏預(yù)示能力,這個特點與現(xiàn)在的情形基本相同。


(6)腫瘤3期臨床成功率遠遠低于其他疾病領(lǐng)域,這說明在入組人數(shù)小的集合中出現(xiàn)病人出現(xiàn)腫瘤縮小并不意味著可以在大型三期臨床中達到OS或PFS收益。這個特點與現(xiàn)在的情形也是相同的。


1546486948(1).jpg


1546486972(1).jpg


文章還總結(jié)了可以顯著提升臨床成功率的因素:


(1)疾病領(lǐng)域是決定臨床成功率的最重要因素。


(2)Biologics的LOA大約在24%,對比總體11%的LOA有明顯優(yōu)勢。換句話說大分子藥物從90年代初開始就一直享有高臨床成功率的優(yōu)勢,從未改變。


(3)巨頭licensing-in的管線成功率顯著高于自研管線,licensing-in管線的LOA高達24%(包括大分子與小分子)。同時文章指出年度R&D預(yù)算小于4億美元的企業(yè),其LOA約為18%,約是世界前十巨頭的163%。文章還援引了輝瑞CEO的話“每15個進入臨床階段的候選藥才能帶來一個獲批藥品”。

 

-------Paper 2------

 

第二篇文章是DiMasi于2010年發(fā)表的文章《Trends in Risks associated With New Drug Development: Success Rates for Investigational Drugs 》。


這篇文章選取了按照2006年銷售額排名前50的藥企于1993年到2004年間進入臨床開發(fā)的1738個管線,這些管線不包含檢測,疫苗,新配方和新適應(yīng)癥。文章中的統(tǒng)計口徑是基于大分子和小分子的分類,小分子包括傳統(tǒng)小分子化合物,肽和寡核苷酸藥品。大分子包括單抗,重組蛋白和其他生物制品。統(tǒng)計方法是進入X+1期臨床的管線/X期臨床的管線,與BIO 2016年報告的方法大致相同。1738個新藥中大分子約占15%,其他是小分子藥物。


1546486997(1).jpg


1546487021(1).jpg


1546487049(1).jpg

 

《Trends in Risks associated With New Drug Development: Success Rates for Investigational Drugs 》的主要概要如下:


1、1738個項目中約有70%來自于前50的藥企的自研項目(self-originated),有30%的項目來自于License-in。這篇文章中將License-in定義為排名50以外的公司向排名前50的公司轉(zhuǎn)讓權(quán)益,前50名以內(nèi)的公司相互轉(zhuǎn)讓,或向50名以外的公司轉(zhuǎn)讓權(quán)益不視作License-in。根據(jù)統(tǒng)計結(jié)果License-in項目在各個階段的臨床通過率均明顯高于或者等于前50公司自研項目,從總統(tǒng)成功率來看License-in項目是自研項目的1.68倍。


文章中從包括靶點新穎性在內(nèi)的各項指標(biāo)分析后,對著這種結(jié)果給出了兩個解釋:

(1)License-in項目在交易時經(jīng)過了嚴(yán)格的篩選;

(2)License-in項目引進后期的多,所以成功率高。


我們認為這兩種解釋均無法自證其說:首先大公司內(nèi)部項目在進入臨床前也需要經(jīng)過篩選,我們沒有理由認為前50公司會出現(xiàn)對內(nèi)和對外篩選標(biāo)準(zhǔn)不一致的情況;其次從各期臨床通過率來看License-in項目恰恰是在1期和2期臨床中有顯著優(yōu)勢。


不管怎樣,我們可以確認一點: 經(jīng)過大樣本統(tǒng)計行業(yè)排名前50的公司的臨床化合物質(zhì)量總體來說顯著低于小型Biotech公司。


2、文章對于大分子藥品作了進一步的細節(jié)分析。首先大分子的總體臨床成功率約是小分子的2.5倍;其次在單抗項目中,人源化越高的項目臨床成功率越高;最后單抗的LOA (36%)和重組蛋白的LOA(34%)大致相當(dāng)。

 

-------Paper 3------ 


第三篇文章是Hay于2014年發(fā)表的《Clinical development success rates for investigational drugs》。這篇文章包含了從2003年到2011年之間進入臨床的4451個化合物,7372個臨床試驗,這些藥品由835家公司開發(fā)。這篇文章也是首次將小型上市公司和未上市的Biotech計入統(tǒng)計。這篇文章最大的特點在于使用Lead indication的概念,并且大量應(yīng)用于不同的統(tǒng)計口徑。(BIO 2016年的報告盡在最后附錄里面披露了一個Lead indication的平均成功率,實用性遠低于《Clinical development success rates for investigational drugs》。)


Lead indication是BioMedTracker數(shù)據(jù)庫給與臨床路徑的一個標(biāo)識。BioMedTracker的做法是首先將每個藥品的不同適應(yīng)癥臨床路徑完全孤立起來,之后單獨測算各個臨床路徑的各期臨床成功率。比如甲項目擁有A,B,C三個適應(yīng)癥,BioMedTracker將與A,B,C相關(guān)的臨床試驗分成三個組分別進行統(tǒng)計,其中進展最快的適應(yīng)癥A作為Lead indication。一般來說每個項目只有一個Lead indication,在少數(shù)情況中若有進度完全相同的兩個適應(yīng)癥那么兩個適應(yīng)癥同時給予Lead indication的標(biāo)識。如果Lead indication的臨床實驗失敗,那么進展第二快的適應(yīng)癥被給予Lead indication標(biāo)識。


在這種統(tǒng)計方法下Lead indication的臨床成功率并不能衡量進展最快的適應(yīng)癥的成功率,但是Lead indication下1期臨床上市獲批可能性,則很好的回答了另外一個問題“X項目獲批任意一個適應(yīng)癥的成功率是多少”。

 

除了Lead indication,文章還提供了FDA定義下的NME和Biologics的LOA以及傳統(tǒng)語境下的小分子,大分子,單抗,重組蛋白等子集的LOA。

 

1546487080(1).jpg


1546487104(1).jpg


1546487129(1).jpg

 

《Clinical development success rates for investigational drugs》的主要發(fā)現(xiàn)概要如下:

(1)All indication 1期臨床LOA的幾率為10.4%


(2)Lead indication的1期臨床LOA的幾率為15.3%


(3)通過對比發(fā)現(xiàn)Lead indication vs Non-lead indication,臨床試驗的規(guī)模更小,入組病人定義更明確。這說明Lead indication擁有更堅實的生物學(xué)基礎(chǔ)以及更好的潛在藥效。


(4)56%的腫瘤藥品擁有Non-lead indication,作為對比28%的非腫瘤藥品擁有Non-lead indication。


在這里,我們認為:隨著腫瘤管線在臨床中占比越來越高,我們可以預(yù)計All indication 1期臨床LOA和Lead indication的1期臨床LOA的差距會進一步拉大。


(5)心血管疾病擁有最低的Lead indication 1期臨床LOA,8.7%。


(6)Lead indication 1期臨床LOA與All indication 1期臨床LOA的最大差距出現(xiàn)在腫瘤,Lead indication 1期臨床LOA 13.2%對比總體1期臨床LOA 6.7%。


(7)NME 1期臨床LOA 7.5%對比Biologics 1 期臨床LOA 14.6%。


(8)腫瘤NME 1期臨床LOA 6.6%,腫瘤Biologics 1期臨床LOA 7.3%,差距極小。


(9)自身免疫系統(tǒng)疾病NME 1期臨床LOA 5.2%,自身免疫系統(tǒng)疾病Biologics 1期臨床LOA 22.5%,差距在各個疾病領(lǐng)域中最大。


(10)拿到SPA(special protocol assessment)的適應(yīng)癥1期臨床LOA高達45.4%。孤兒藥適應(yīng)癥1期臨床LOA32.9%,其中腫瘤孤兒藥1期臨床LOA 23.0%,非腫瘤孤兒藥1期臨床LOA 44.5%

 

-------Paper 4------

 

第四篇文章是CHI HEEM WONG于2018年發(fā)表的《Estimation of clinical trial success rates and related parameters》。這篇文章有史以來最大的統(tǒng)計,數(shù)據(jù)包含了2000年1月1日到2015年12月31日間進入臨床的406038個臨床試驗,21143個管線。


這篇文章的統(tǒng)計口徑與以往差距較大,比如疫苗產(chǎn)品臨床加入統(tǒng)計數(shù)據(jù)。Biomarker的定義與其他的統(tǒng)計不同。此外自身數(shù)據(jù)結(jié)果有不一致的地方,例如文中統(tǒng)計的全疾病臨床成功率是13.8%,而在衡量Biomarker對于臨床成功率的影響的時候,全疾病領(lǐng)域有Biomarker和無Biomarker的臨床試驗綜合成功率僅為5.7%。當(dāng)然這兩個統(tǒng)計數(shù)據(jù)的口徑在臨床試驗的時間截點上有差別,但無論如何無法說明如此大的成功率的原因。總體來說個人認為這篇文章質(zhì)量不高,不宜采信。

 

-------Paper 5------


上面的幾篇文章分析了藥品的臨床成功幾率,如果我們對于臨床升功率背后的原因做進一步的分析,能總結(jié)出一些十分有趣的事實。下面的圖片援引Cook在2014年發(fā)表的關(guān)于阿斯利康小分子管線的文章。


1546487160(1).jpg



數(shù)據(jù)顯示阿斯利康2期臨床通過率顯著低于行業(yè)平均水準(zhǔn)。以往的各個統(tǒng)計中2期通過率大致是在30%左右,通過率最低的疾病種類心血管疾病的2期臨床成功率也有25%左右。這個結(jié)果說明即便最極端的情況考慮疾病分布,行業(yè)巨頭的臨床前工作質(zhì)量也遠低于行業(yè)平均水平。


 

1546487185.jpg


在巨頭與行業(yè)平均值差距最大的2期臨床中,大致有65%的項目是因為藥效失敗的,30%的失敗原因歸于毒性。

解決藥效的問題大致可以從三個方面入手:

(1)使用高質(zhì)量的動物模型;


(2)在基因?qū)用娲_認靶點與疾病發(fā)病機制的關(guān)系,例如通過確認攜帶X基因的人群與流行病學(xué)的關(guān)系。這方面最成功的例子就是PCSK9,最丑名昭著的例子莫過于前一陣CRR5基因編輯嬰兒;


(3)確認化合物與靶點之間的聯(lián)系,這方面最能說明問題的是PD Biomarker。


1546487212.jpg


但如果我們進一步將藥效失敗的原因做進一步解讀,我們會發(fā)現(xiàn)40%的藥效問題來自于不能確認靶點與疾病的關(guān)系,29%來源于計量限制性毒性,20%來源于選錯適應(yīng)癥,11%來自于藥效不夠強勁。我們可以說30%到40%的療效問題是因為毒性限制用藥計量引起的,換句話說若我們想高幾率的安全通過死亡峽谷,綜合來看毒理依然是最重要的考量點。

 

1546487244(1).jpg


在臨床階段因為安全性失敗的藥品中化合物相關(guān)毒性約占50%,靶點自身毒性約占50%。故考察項目時對于靶點自身特點的考察應(yīng)當(dāng)列為重點中的重點。最好(1)盡量避免處于細胞通路核心位置的靶點,例如mTOR,PI3K等。(2)多種細胞表達的靶點,這類藥品的安全窗要著重考察。例如Bcl-2或者現(xiàn)在正處于臨床研究階段的CD-47。


1546487276(1).jpg

 


回到毒性本身,臨床方面毒性最主要的來源分布是CNS,心血管,肝毒,腎毒,胃腸道。CNS毒性因為動物模型的問題沒有有效降低風(fēng)險的手段。心血管毒性因為hERG的存在讓其相對好判斷,根據(jù)我們以往的經(jīng)驗hERG也是最常見的計量限制性毒性的來源,所以hERG IC50的把關(guān)一定要從嚴(yán)。

  

綜合以上文章的信息在評估項目風(fēng)險時最好注意如下原則(以下是作者耗費了大量腦細胞后得出的精華結(jié)晶,請珍惜):


(1)我們關(guān)注的更多是X藥品成功上市的幾率而非X藥品Y適應(yīng)癥成功上市的幾率。所以Hay教授2014年的文章的統(tǒng)計口徑更貼合我們的實際需要。


(2)大分子方面整體來說享有更高的臨床成功率,而且無法跨膜和FcRn的存在讓其在毒性和PK方面具有天然優(yōu)勢。值得注意的是大分子藥品的主要類別重組蛋白和單抗在臨床成功率方面無差別,單抗中人源成分越高臨床通過率越高。大分子的高臨床成功率唯一的例外是腫瘤方面,其成功率與小分子相差無幾。


(3)臨床成功率還有幾個值得注意的方面:a、腫瘤領(lǐng)域3期臨床失敗率顯著高于其他領(lǐng)域,換句話說腫瘤2期臨床中包含了更多的假陽性結(jié)果。在測算2期臨床陽性的腫瘤藥品的風(fēng)險時需要區(qū)別對待。b、CNS,腫瘤和心血管是2期成功率最低的領(lǐng)域,這個數(shù)據(jù)某種意義上說明上面三個領(lǐng)域的臨床前動物模型可靠程度低。心血管已上市藥品的表現(xiàn)在上述三個領(lǐng)域中是最出色的,所以監(jiān)管機構(gòu)對于心血管藥品的新藥有著最高的要求,綜合研發(fā)難度和監(jiān)管要求我們或許應(yīng)該整體放棄心血管領(lǐng)域。


(4)靶點選擇時盡量避開會影響多條通路的靶點,這類靶點藥品很容易出現(xiàn)安全窗過小的問題,即便上市也可能因為病人耐受問題無法大規(guī)模使用。


(5)小分子藥品中的激酶抑制劑自從格列衛(wèi)上市20年來已經(jīng)貢獻了大量的新藥。這一類別的靶點相對于其他小分子靶點成藥性更好,而且歷史短暫,挖掘潛力更大。對于激酶來說選擇性對于其成藥性至關(guān)重要,預(yù)計隨著蛋白晶體結(jié)構(gòu)的不斷確定,帶來的高選擇性化合物將不斷出現(xiàn)。另外,除了激酶之外,與其功能相反的磷酸酶也值得我們特別關(guān)注,尤其是變構(gòu)抑制劑天然的高選擇性可能帶來更好的成藥性。


(6)同一靶點但結(jié)合位點不同的藥品值得加分,最著名的例子是Roche的曲妥珠單抗和帕托珠單抗。小分子方面克服老靶點的突變耐藥也是成功率相對較高的選擇,但可能需要重新篩選母核或者改造化合物基本骨架,而非簡單的me-too。


(7)Biomarker可以分為兩類(1)selection biomarker:這類biomarker不僅僅是幫助建立病人入組標(biāo)準(zhǔn),它也代表著靶點與疾病在分子層面的聯(lián)系。(2)PD biomarker:確認化合物對于靶點的作用。在臨床前階段成熟的selection biomarker和PD biomarker能幫我們極大的提高臨床成功率。


(8)過去30年來小分子化合物失敗率持續(xù)升高的原因原因可能如下:小分子藥物發(fā)現(xiàn)phenotypic drug discovery(你可以理解為表型篩選)轉(zhuǎn)向biology-driven drug development(你可以理解為靶點篩選),動物模型表現(xiàn)差的CNS和腫瘤領(lǐng)域藥品研發(fā)數(shù)量持續(xù)增加,監(jiān)管機構(gòu)對于藥品的要求越來越高。所以經(jīng)典的phenotypic drug discovery設(shè)計出來的化合物可能會有更高的臨床成功率,尤其是在多機制的復(fù)雜疾病適應(yīng)癥上,例如NASH。NASH方面,在調(diào)節(jié)代謝、抗炎癥、抗細胞凋亡、抗纖維化四大類功能機制中,如果一個candidate在三方面體現(xiàn)出較好的療效,在今天的這個時點看是一個比較perfect的項目。


(9)罕見病領(lǐng)域的高臨床通過率得益于相對清晰的基因/生物學(xué)基礎(chǔ),單基因致病的罕見病是值得優(yōu)先考慮的目標(biāo)。


(10)在CNS,腫瘤和心血管領(lǐng)域的動物模型總體來說的預(yù)示性相當(dāng)?shù)?。這些領(lǐng)域的動物模型也因為不同的構(gòu)建方法造成預(yù)示能力的差別。目前國內(nèi)仍有大量公司使用效力較差的動物模型用于藥效學(xué)實驗,這類項目或許直接放棄才是更有效率的選擇。

 

以上的評估原則是基于我們的底層投資邏輯而提出的,應(yīng)用場景并不具備有普適性,請大家結(jié)合自身需求謹慎使用。