3 月 15 日,OpenAI 發(fā)布 GPT-4,成為公司在ChatGPT之后最先進的人工智能系統(tǒng)。
ChatGPT的出現(xiàn),再次讓和AI相關的一切領域站上風口。“2021年那一波AI制藥的投資人又開始活躍起來了,見面就聊ChatGPT能不能帶來什么新的機會,這也是最近醫(yī)藥寒冬里為數(shù)不多的積極話題了?!币幻顿Y機構人員說到。
而看到這條消息,國內最早從事AI行業(yè)的曹翎(化名)在朋友圈留下了一句很“不應景”的話:“真正的失落都是無聲的?!?/span>
十幾年來,曹翎一直在AI行業(yè)穿行不歇。他的最后一份工作,是在國內某知名大廠背景的AI制藥公司從事AIDD(AI藥物發(fā)現(xiàn)和設計)。如今退圈的他有一些寫書的計劃,只想“為這個行業(yè)做一些基礎建設工作”。
對于像曹翎一樣的AI從業(yè)者而言,這個行業(yè)就像是幸運大轉盤上的指針,曾經定格在電商、游戲、直播等行業(yè)。2021年,這枚指針落到了生物醫(yī)藥領域。一眾國內AI制藥初創(chuàng)便像雨后春筍一般崛起。但隨之而來的,還有意料之中的內卷、路演,和資本的游戲。
一邊,AI制藥已經成為了一個大型投注箱,其中回蕩著金錢的碰撞聲:如果人類生命科技的未來注定屬于多特異性藥物,那善于分析復雜分子的AI必定大有可為;另一邊,則是AI制藥的算力、數(shù)據(jù)庫、準確性問題一直沒有得到突破性解決,現(xiàn)階段AI只能把藥物研發(fā)效率從11%提高到14%。
“制藥行業(yè)其實根本不在乎AI。”曹翎有點苦澀地說?!澳鉇I做成的數(shù)據(jù)再漂亮,藥企可能只會花研發(fā)中的5%的權重去買它。現(xiàn)在大藥企就是看這些AI制藥企業(yè)表演著,等表演得差不多了,再大家一起把這一塊兒買走?!?/span>
而在大藥企作壁上觀的另一邊,是這些AI初創(chuàng)人員為了數(shù)據(jù)準確性能再提升零點幾加班加點、苦不堪談?!癆I制藥是一個數(shù)據(jù)驅動的活兒,產品迭代特別快,但其實背后的規(guī)律性沒有搞透,真正的生物科學家又看不上?!薄诓荇峥磥恚缃竦腁I制藥從所謂的前沿科技漸漸滑落為一種四不像的尷尬產品,這是行業(yè)真正的失落所在。
相比于過去的AI投資人再次燃起的熱情,在二級市場重新吃香的相關企業(yè),諸如復星醫(yī)藥、成都先導、藥石科技等,卻在業(yè)內人士看來并不是純粹的AI制藥企業(yè):要么是AI技術只占公司業(yè)務很小一部分,要么底子上是制造業(yè)化工的邏輯。而二級市場的重新繁榮,并沒有帶動起整個投融圈的熱情。業(yè)內人士透露,對于大部分真正只做AI制藥的初創(chuàng)而言,現(xiàn)金流即將在半年之內出現(xiàn)巨大黑洞。
如今,大部分的人已經認清AI制藥的工具屬性,應服從制藥業(yè)本身的邏輯。而只要它在行業(yè)中的應用程度和作用強度不發(fā)生改變,那么不管是股市的喧囂一片、還是AI技術的飛馳而過,對于AI制藥行業(yè)都只是一些遙遠的消息而已。
-01-2021-2023,AI制藥資本的冷與熱
去年12月,晶泰科技回應了港股 18C咨詢文件,這距離它最后一次融資已經過去了一年半的時間。
作為國內AI制藥的頭部,晶泰科技在2021年時也經歷過50家國際機構融資競標、額度達到8億美元、投后估值達到19.68億美元的盛況。然而,隨著2022年生物醫(yī)藥市場環(huán)境的失速,公司不得不擱淺了美股IPO的計劃。
2021年是AI制藥最好的年頭。DeepMind的深度學習算法Alphafold剛剛被驗證能夠準確預測蛋白質的三維結構,就遇到了那一年的biotech上升期。AI制藥公司的數(shù)億融資俯拾皆是,與藥企合作捷報頻傳。“當時我們公司為了挖人,曾經開出過100萬美元的天價高薪?!币幻鸄I制藥企業(yè)員工回憶。
然而,僅僅一年時間,AI制藥卷起的泡沫就被打得粉碎。醫(yī)藥寒冬一來,錢去人空不可避免。去年一整年,部分美國上市的AI制藥市值已經低于1億美元,跌幅超過90%,其中不乏Absci、Schrdinger這樣的獨角獸。在國內,風口也巔峰不再,去年上半年融資總額同比縮水2/3。
除了突如其來的資本風暴以外,AI制藥式微的主要原因還在于:它并沒有像原先人們所料想的那樣,幫藥企解決卡點問題。本質上,它只是把藥企目前面臨的問題,用不同的語言再重新書寫一遍。
一名AI制藥領域的專家介紹到,這個行業(yè)最早是賣軟件的,但是只收服務費,上限比較低;如今是在做CRO還是做藥之間產生分歧:晶泰偏CRO,英矽偏biotech——但不管是哪種路線,它都沒有在根本上解決藥物研發(fā)的失敗率和成本問題。
資本市場曾經流行著一個誘人的故事:AI可以將公司的藥物發(fā)現(xiàn)成本降低高達70%。但事實上,這只是理想數(shù)據(jù),因為目前市場還沒有見證到AI制藥的最終產品——2022年,第一款由AI設計、號稱只用了12個月便進入臨床的分子DSP-1181因I期未達標而折戟。
公司需要在前期打通數(shù)據(jù)、算力、算法,這絕非小數(shù)目;交叉學科中人才的稀缺問題,造成昂貴的人才成本;生物驗證過程中的各種不確定性,造成來來回回的退回和返工——而這一切都讓AI制藥,絕不像它聽上去那么省錢。
最重要的是,大部分AI制藥公司目前并沒有清晰的發(fā)展主線,商業(yè)化通路處于觀望狀態(tài),往往會在“既要又要”的“嘗試”中損耗精力。曹翎提到,自己的老東家,就因為一些預算以外的投入,導致產出的虎頭蛇尾?!霸谧鏊幹埃颈仨毎阎苓叺臇|西搞齊或摸排清楚,其中包括不同的生物技術路線,包括產業(yè)鏈上下游的東西,要保證企業(yè)又能賣產品,又有自己做藥的能力。這部分成本是非常大的?!?/span>
AI制藥同樣面臨著生物醫(yī)藥領域同質化競爭的問題。簡單來說,AI的學習資料是人類已經創(chuàng)造的實驗數(shù)據(jù),對于那些冷門的靶點信息,AI無法無中生有。“AI制藥公司用的數(shù)據(jù)庫都差不多,算法技術也沒有太大的技術壁壘,無非是針對場景慢慢進行優(yōu)化。說到最后,還是拼靶點?!鄙鲜鯝I制藥企業(yè)員工說。
一切似乎都回到了AI制藥出現(xiàn)之前的原點,邏輯和難點都沒有改變。
2023年,隨著ChatGPT的大火,不少AI制藥企業(yè)就像殺入18C的晶泰科技一樣,意圖再度抬頭。成都先導,皓元醫(yī)藥、藥石科技、泓博醫(yī)藥等醫(yī)藥上市公司先后披露布局AI制藥賽道相關情況?!巴顿Y人們最關心的就是,ChatGPT這種生成式AI能不能給制藥行業(yè)帶來什么新的東西?!鄙鲜鐾顿Y機構人員說。
“AI制藥不能和ChatGPT比較,因為訓練后者的,是強大的互聯(lián)網工業(yè)和二十年左右的語言模型發(fā)展。相對而言,AI制藥實在是太年輕了?!?/span>這名投資機構人員繼續(xù)說道,“甚至可以說,對于AI制藥公司而言,最難的時刻還沒有到來。因為大批的產品還沒有進入到臨床階段,真正的大考還沒有到來?!?/span>
-02-ChatGPT給的機會在哪里
在這一輪熱度之前,AI制藥還只是生物醫(yī)藥行業(yè)的一個影子,無法擺脫跟隨式發(fā)展的限制。而ChatGPT這一劑強心針,不僅打在了二級市場的心坎上,還讓不少投資機構給出觀點:ChatGPT給了AI制藥一個從輔助性向創(chuàng)造性遷移的機會。
“ChatGPT是一個數(shù)據(jù)與經驗結合的大模型,而藥物研發(fā)比較重要的是靶點的發(fā)現(xiàn),本來也是對基因、蛋白組學的數(shù)據(jù)進行分析,建立關聯(lián),所以比較容易被大模型所替代。短期來看,GPT可以取代初級和中級的藥物專家。”上述AI制藥領域專家說。
一方面,GPT架構的排序訓練方式,在理論上可以融合所有藥物研發(fā)的模態(tài)數(shù)據(jù),支持通用的藥物研發(fā)模型;另一方面,它可以成為一個整合核心,通過API的方式調用各個子模塊,而子模塊返回的結果可以通過核心GPT進行整合報告,從而實現(xiàn)更加專業(yè)的預測。
簡單來說,GPT有一個大底座,可以承載更多的生物信息(小分子結構,蛋白質序列,化學反應,小分子與蛋白質對接,過濾規(guī)則等),也可以在不同步驟進行及時反饋,趨近準確。
這其實解決的是AI制藥曾經出現(xiàn)過的兩個問題:第一,是模態(tài)不全,不同維度的生物信息之間無法協(xié)同導出綜合判斷;第二,是運算壓力造成的算力問題,經常會導致預測結果不夠準確。
可以說,如果AI制藥是一把槍的話,那么ChatGPT的確讓它彈夾更大、彈道更直了;然而,如今AI制藥最頭疼的數(shù)據(jù)問題——即:子彈該如何被完美地上膛后射出,卻始終沒有得到清晰的答案。
水木未來CEO郭春龍曾表示過,給數(shù)據(jù)做標簽,這是 ChatGPT 能夠突飛猛進發(fā)展的一個前提條件,而AI制藥在這方面還沒有準備好。“你給一段話加上個標簽,成本最多1分鐘甚至幾秒鐘的事。但是你要希望給一個蛋白質的序列加上標簽,往往需要大量的實驗,包括電鏡的收數(shù)據(jù)、解數(shù)據(jù),它的成本要高很多。”
比起貼標簽的成本,更嚴峻的是數(shù)據(jù)來源問題。ChatGPT依托在互聯(lián)網這一共享平臺上,而在可見的未來,制藥行業(yè)的數(shù)據(jù)壁壘無法被打破。
除去有限的公共數(shù)據(jù)庫外,AI制藥公司只能通過與藥企合作、自有實驗平臺、委托CRO等形式獲取用以訓練系統(tǒng)的信息;同時,因為不同實驗室或公司數(shù)據(jù)標準化程度都不一樣,前期輸入的標準化轉譯也必須投入大量人力、財力。
“從數(shù)據(jù)來看,只有蛋白結構這個事情是可以解決的,其他環(huán)節(jié)的一些定量的、定性的實驗數(shù)據(jù)因為標準化問題,80%實際上都是不可靠的?!辈荇嵴f。
另一個GPT能做到、而目前AI制藥無法做到的事情同樣和數(shù)據(jù)相關。GPT的特點之一在于對信息的理解和篩選,其中涉及到強度和權重的賦值,可以理解為:人工智能可以決定在海量信息中重點看什么,不去看什么。而目前,生物類數(shù)據(jù)還沒有找到一種有效的方式,可以表現(xiàn)突出關系或信息的重要性層級。
“目前大家希望可以通過蛋白序列和基因序列的手段去解決這個問題。但這些序列在發(fā)生功能的時候,已經是一個結構化的東西了。相當于我們用一維的手段,去研究四維狀態(tài)的現(xiàn)象背后的規(guī)律,然后再去映射它的功能,說實話挺難的?!辈荇嵴f。
-03-對AI制藥有期待,錯了么?
不管是科學界還是產業(yè)界,如今越來越多的人正在認定:多特異性藥物,將引發(fā)現(xiàn)代制藥工業(yè)的第四次革命性浪潮;那么,似乎沒有什么理由可以指摘人們對AI制藥的高度期待了。
面向未來的藥物形態(tài),將擁有多重治療機制和豐富的合成結構,其核心就是“以復雜對抗復雜”,其中便給了AI分析和設計的廣闊空間。
但同時,“復雜”也給了AI制藥一種無的放矢、無處著力的困境。一名AI制藥企業(yè)管理人員總結道:“做藥是個非常復雜的系統(tǒng)工程,AI在其中一個環(huán)節(jié)的加速,可能會被另一個環(huán)節(jié)所稀釋。因此,AI制藥必須要找準最關鍵的杠桿點。如果在一個點上能有千倍以上的提升,就會有一個從量變到質變的過程?!?/span>
簡單點說,AI制藥企業(yè)未來的定位,應該是像狙擊槍一樣?!按笏幤缶拖袷泅睆棙?,打擊范圍大,總有那么一兩發(fā)是中的?!辈荇嵴f。不管是AI制藥初創(chuàng),還是傳統(tǒng)藥企,研發(fā)都是一個幾率問題。大藥企能承擔巨額的試錯成本;相對而言,AI制藥不能走量,只能在一些細分方向或步驟上做出四兩撥千斤的效果。
換句話說,如果我們所期待的,是AI在復雜問題中提供全面而完美的解決方案,那么失望是在所難免的;但如果AI可以在復雜環(huán)境中,做撬開問題的一個杠桿,那我們將很可能獲得一個全新的視角。
一名AI制藥初創(chuàng)的研發(fā)人員發(fā)現(xiàn),AI給人的感覺就像一個孩子一樣——經常出錯,但也能帶來驚喜。“最近我們跟一個臨床的合作方在做一個類似于自免罕見病的項目。對方問:如果給你患者的血液樣本,你能不能分析它特定負極的bcr組庫,然后去反向找自免抗原?理論上,因為人體內的蛋白是已知的,如果用高通量的結構和親和力模型去做的話,是有機會的。我們就用AI試了試,最后給他推薦了4個。結果昨天他告訴我,其中一個挺有希望的?!?/span>
長期和AI打交道的經驗告訴這名研發(fā)人員,任何時候都不能高興得太早。但只要有耐心,AI就能不斷在錯誤中爬起來、成長起來。
“之前我們用全人源的小鼠篩了一個相對復雜的靶點,是非特異性結合。我們就用AI去優(yōu)化了一下,明顯發(fā)現(xiàn)它在od450的層面的比值下降了很多,相當于我獲得了一個推薦結合的靶點。但后來測試的時候,才發(fā)現(xiàn)它沒有blocking function。”她回憶道,“后來我們大概又迭代了兩輪,這樣就把分子拿到了,就最終結果而言還是好的?!?/span>
在這名研發(fā)人員看來,目前AI制藥最受詬病的一點,就是沒法一步到位地實現(xiàn)目標,這背后涉及的是對其商業(yè)效率的焦慮。“在沒有找到正確路徑之前,一切都有可能發(fā)生,甚至有可能會出現(xiàn)迭代以后數(shù)據(jù)準確性下降的問題。而生物驗證那邊的反饋又很慢,效果好不好需要做上15天的實驗才能知道結果?!?/span>
在AI制藥方興未艾、勢單力薄的當下,大部分企業(yè)在面對藥企客戶時并不具有議價權。業(yè)內人士稱,和AI制藥初創(chuàng)合作的藥企,大部分也都是抱著“玩票”的心態(tài),“象征性地”給一些合作款項。
總體而言,AI制藥的服務報價低、周期長,作為一款提供靈感的玩具而言,它顯得實在太奢侈了;而它什么時候能升級為一款成熟的工具,還得依靠“玩”出來的思路和可能性——這也正是AI制藥行業(yè)目前感到矛盾的地方。
李昀丨撰文
王晨丨編輯
來源:深藍觀