新藥研發(fā),九死一生
新藥研發(fā)速度慢,失敗率高一直都是全世界的藥物研發(fā)企業(yè)所面臨的問題,俗話說:“新藥研發(fā),九死一生”,研究十個(gè)能成一個(gè)就不錯(cuò)了,還得靠運(yùn)氣。新藥研發(fā)時(shí)間長(zhǎng),成功率低已變成醫(yī)藥研發(fā)界的代名詞。藥物從無到有,要經(jīng)歷一個(gè)漫長(zhǎng)的時(shí)間過程,我們誰也不知道在這條曲折的路上還有多少坑要邁過去,因?yàn)樾滤幯邪l(fā)的不確定性太多了,從實(shí)驗(yàn)室研究到新藥上市要經(jīng)過合成提取、生物篩選、藥理、毒理等臨床前試驗(yàn)等一系列過程,每一步驟都可能需要若干次的失敗來總結(jié)經(jīng)驗(yàn)。
如此復(fù)雜的研發(fā)過程再加上過程中無法預(yù)料的情況,使得在研發(fā)的每一個(gè)階段都有可能失敗,一旦研發(fā)失敗,巨額投入血本無歸也非罕見。藥物從研發(fā)到注冊(cè),研發(fā)時(shí)間周期長(zhǎng)平均要經(jīng)歷10年,體系復(fù)雜,總的資金投入至少要10億美元。并且不是說投入了就能夠做出來,因?yàn)橐粋€(gè)藥物研發(fā)的成功率也只有10%,所以說新藥研發(fā)是一個(gè)高風(fēng)險(xiǎn)的行動(dòng)。
PART
人工智能加入醫(yī)藥研發(fā)領(lǐng)域,頭部藥企入局
近年來,人工智能(英語:Artificial Intelligence,縮寫為AI)參與藥物的研發(fā)過程,被提及的越來越多,網(wǎng)上不時(shí)曝出某某制藥巨頭與某互聯(lián)網(wǎng)公司達(dá)成強(qiáng)強(qiáng)合作。醫(yī)藥研發(fā)或告別“十年磨一劍”的舊時(shí)代,去年下半年以來,AI藥物研發(fā)迎來投資密集期。
醫(yī)藥界大佬輝瑞(Pfizer )更是于2016年就與IBM Watson合作,以加速免疫腫瘤學(xué)領(lǐng)域的藥物發(fā)現(xiàn)。葛蘭素史克一直是利用人工智能的主要制藥公司之一——葛蘭素史克(GlaxoSmithKline)是“加速醫(yī)療機(jī)會(huì)療法”聯(lián)盟(ATOM)的創(chuàng)始成員之一。其它入局的還有強(qiáng)生與Benevolent AI、默沙東與Atomwise、武田制藥與Numerate、賽諾菲與Exscientia。
與此同時(shí),非醫(yī)藥出身領(lǐng)域的百度、騰訊、華為、字節(jié)跳動(dòng)等科技巨頭也紛紛布局AI醫(yī)藥領(lǐng)域。今年年初,百度創(chuàng)始人李彥宏?duì)款^發(fā)起的百圖生科發(fā)起“百萬領(lǐng)軍計(jì)劃”及“百萬青年領(lǐng)軍”計(jì)劃,將分別用100萬美元年薪、100萬元人民幣年薪以及其他技術(shù)平臺(tái)支持,吸引生物技術(shù)+AI技術(shù)跨界融合人才。
李彥宏預(yù)測(cè),未來人工智能在公共衛(wèi)生監(jiān)測(cè)、新藥研發(fā)和疾病診斷等方面大有可為。此前,字節(jié)跳動(dòng)、華為均開始招聘生物醫(yī)藥相關(guān)崗位,騰訊則發(fā)布了由其自主研發(fā)的首個(gè)AI驅(qū)動(dòng)的藥物發(fā)現(xiàn)平臺(tái)云深智藥。在今年人工智能藥物研發(fā)公司英矽智能宣布,以人工智能貫穿藥物發(fā)現(xiàn)環(huán)節(jié)(包括機(jī)制發(fā)現(xiàn)、靶點(diǎn)發(fā)現(xiàn)及找到新化合物),成功發(fā)現(xiàn)了全新機(jī)制藥物,這在全球尚屬首例。
“研發(fā)中僅用時(shí)18個(gè)月、研發(fā)經(jīng)費(fèi)約合200萬美元。相較于傳統(tǒng)藥物研發(fā)10年耗資幾十億美元,AI賦能藥物研發(fā)極大縮短了藥物研發(fā)時(shí)間,又大大降低了成本。”無疑讓新藥研發(fā)看到了希望。
PART
AI介入醫(yī)藥研發(fā),有望改變未來研發(fā)格局
藥這種東西有一個(gè)非常明顯的個(gè)體屬性。目前已知的化合物結(jié)構(gòu)空間,數(shù)量相當(dāng)龐大,我們能找到的藥物的分子數(shù)或達(dá)到1060,AI就是幫我們?cè)谒芯康幕瘜W(xué)空間中找出有用的分子,這也是我們?cè)谘芯恐幸恢标P(guān)注的問題,面對(duì)1060的空間,我們?cè)鯓佑靡粋€(gè)更好的數(shù)學(xué)方法把它們表示出來。
一個(gè)分子能夠成為藥,它在多方面是優(yōu)秀的——它既要有很好的藥效,同時(shí)也可以被很好的吸收,同時(shí)不應(yīng)該有毒性等等,我們的研發(fā)過程中就是要找到這些孤立的小島。通過計(jì)算機(jī),我們可以輕易的從化學(xué)結(jié)構(gòu)庫中找到幾十萬個(gè)或者幾百萬個(gè)相似的分子,讓它具有相似的成藥的可能性,相對(duì)于讓人去在紙上去畫出結(jié)構(gòu)再去對(duì)比研究(可能你畫一萬個(gè)分子就已經(jīng)累夠嗆了),AI可以代替我們?nèi)ニ阉鞲蟮幕衔锟臻g,從而為發(fā)現(xiàn)新藥提供更多的可能性。
新藥研發(fā)面臨的第二個(gè)難題就是:通常很微觀的東西我們就很難去判斷它。對(duì)于化合物本身,它有自己的語言,AI可以學(xué)習(xí)到這種化學(xué)結(jié)構(gòu)的語言。AI可以作曲,可以畫畫,因此AI也可以畫化學(xué)分子,通過去學(xué)習(xí)了大量的分子結(jié)構(gòu)數(shù)據(jù)以后,它學(xué)到了一些化學(xué)知識(shí),然后它開始去產(chǎn)生這些分子結(jié)構(gòu),它可能會(huì)畫出化學(xué)家所想象不到的化合物結(jié)構(gòu),這些結(jié)構(gòu)也可能是非常不合理的,這種AI在學(xué)習(xí)了化學(xué)知識(shí)以后隨機(jī)的產(chǎn)生分布,其中有許多并不是我們想要的。
我們想找到的是那些真正高質(zhì)量的結(jié)構(gòu),就需要通過一定的規(guī)則去告訴它,我們到底需要什么樣的分子結(jié)構(gòu),AI通過實(shí)踐學(xué)習(xí),能夠真正的去找到那些可以成藥的結(jié)構(gòu),在虛擬的空間中去發(fā)現(xiàn)一個(gè)真正的藥物,從這個(gè)角度來看我們其實(shí)是利用了化學(xué)知識(shí)來嘗試和人自身進(jìn)行一場(chǎng)對(duì)話,嘗試讓AI在分子層面上去理解。
我們知道通過堿基可以形成DNA序列,然后DNA通過生物學(xué)的過程可以去指導(dǎo)蛋白質(zhì)的合成,我們告訴AI蛋白質(zhì)是由20種氨基酸按照一定的規(guī)律排列起來的,不同的排列會(huì)有不同的功能,當(dāng)AI知道可以用計(jì)算的方法去計(jì)算蛋白質(zhì)的序列,通過學(xué)習(xí)這些知識(shí)讓AI可以知道這些結(jié)構(gòu)是怎么影響生物的功能的,不同的蛋白質(zhì)之間,通過三維結(jié)構(gòu)如何產(chǎn)生對(duì)話,從而影響到彼此,我們需要AI做的事情就是把我們對(duì)生物學(xué)語言的理解,對(duì)化學(xué)語言的理解,讓它把這些語言組合到一起,從而能夠找到與疾病相關(guān)的蛋白質(zhì)最匹配的化學(xué)分子,最后發(fā)展成治愈我們疾病藥物。
PART
AI研發(fā)還有不確定性,未來還需更深入探索
當(dāng)然AI制藥目前也有一定的局限性,在人工智能參與新藥研發(fā)的路上還是會(huì)面臨很多的挑戰(zhàn),比如說如何把各個(gè)藥企的數(shù)據(jù)結(jié)合到一起,利用更多高質(zhì)量的數(shù)據(jù)去做好的分子模型。當(dāng)然還有跨學(xué)科合作的問題,我們要匯聚化學(xué)、生物學(xué)、計(jì)算機(jī)、數(shù)學(xué)、統(tǒng)計(jì)等等多學(xué)科的人才,這些不同的技術(shù)人員之間怎樣有效的溝通理解,也是一個(gè)需要解決的困難。
目前AI制藥研發(fā)中的現(xiàn)狀是,靶點(diǎn)發(fā)現(xiàn)和藥物設(shè)計(jì)最熱,AI賦能的靶點(diǎn)發(fā)現(xiàn)和藥物設(shè)計(jì)是極具價(jià)值的應(yīng)用方向,也是藥物研發(fā)最大的痛點(diǎn)之一,同樣也是最多公司目前開始布局的環(huán)節(jié)。
AI介入后,更大化學(xué)空間探索的實(shí)現(xiàn)和更多分子生成方式的產(chǎn)生,使更新穎分子的獲取成為可能,能快速識(shí)別處理繁多的數(shù)據(jù),并找出邏輯關(guān)系從而實(shí)現(xiàn)智能推薦更少更優(yōu)的分子,縮減任務(wù)量,使研發(fā)更高效。所以說在任何一個(gè)新興科技領(lǐng)域,挑戰(zhàn)和阻礙都將是持續(xù)存在的。
從技術(shù)的視角看,目前在AI醫(yī)藥研發(fā)方向上比較明確的挑戰(zhàn)和阻礙有兩方面:一是認(rèn)知層面,AI+醫(yī)藥橫跨了多個(gè)學(xué)科,如何提出具有正確的目標(biāo)導(dǎo)向的問題、用多學(xué)科融合的視角思考解決問題的路徑本身就是最大的挑戰(zhàn)。
另外,數(shù)據(jù)也是當(dāng)下該領(lǐng)域面臨的一大挑戰(zhàn),比如數(shù)據(jù)的量、質(zhì)、標(biāo)準(zhǔn)以及孤島效應(yīng)等。但AI制藥的前景必然是光明的,AI制藥技術(shù)的進(jìn)一步突破和創(chuàng)新定會(huì)對(duì)整個(gè)醫(yī)藥研發(fā)產(chǎn)生重大意義。