對(duì)話硅谷投資人張璐:生成式模型走向技術(shù)應(yīng)用創(chuàng)新,醫(yī)療或?qū)⒊蔀槭讉€(gè)爆發(fā)性增長(zhǎng)領(lǐng)域
圖片來(lái)源@視覺(jué)中國(guó)
發(fā)布公測(cè)后的60天,ChatGPT吸引了10億用戶(hù)。
2022年,全球醫(yī)療行業(yè)市場(chǎng)達(dá)5000億美元。
(相關(guān)資料圖)
乍看之下,這兩個(gè)數(shù)字的關(guān)系有點(diǎn)遠(yuǎn)。然而正如最近A16Z發(fā)布的文章里指出的:醫(yī)療是目前僅存的,還未被技術(shù)大規(guī)模改變的重要領(lǐng)域。而更易落地、有著超過(guò)10倍效率提升的AI技術(shù),就是這個(gè)突破口。
可以說(shuō),對(duì)ChatGPT背后的生成式模型來(lái)說(shuō),積累了海量?jī)?yōu)質(zhì)數(shù)據(jù)、迫切需要降本增效的醫(yī)療行業(yè)很可能成為其最集中、來(lái)得也最快的爆發(fā)點(diǎn)。
硅星聞對(duì)話了硅谷投資人張璐,聊了聊生成式模型在醫(yī)療領(lǐng)域的巨大可能性及挑戰(zhàn)。
張璐是硅谷新一代領(lǐng)軍基金的代表人物,2022年被福布斯評(píng)選為全球華人精英Top 100 行業(yè)翹楚,2023年入選Business Insider美國(guó)最佳25名女性早期投資人及100 Women in Finance榜單,也是達(dá)沃斯世界經(jīng)濟(jì)論壇“全球青年領(lǐng)袖”。
2015年,張璐創(chuàng)立 Fusion Fund,現(xiàn)管理近4億美元資本,專(zhuān)注醫(yī)療和深科技領(lǐng)域投資。張璐帶領(lǐng)的投資團(tuán)隊(duì)以斯坦福背景為主,匯聚了硅谷杰出企業(yè)家、投資人以及美國(guó)工程院院士等,已投資公司有多家上市和收購(gòu)?fù)顺觥?/p>醫(yī)療也許是生成式AI最合適的應(yīng)用窗口
對(duì)于大模型來(lái)說(shuō),優(yōu)質(zhì)、龐大的數(shù)據(jù)量是它能夠得以存在、不斷進(jìn)化的最重要基礎(chǔ)之一。
而在這一點(diǎn)上,醫(yī)療領(lǐng)域一騎絕塵。
“在醫(yī)療行業(yè)中,數(shù)據(jù)基礎(chǔ)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)專(zhuān)業(yè)度都非常高。而生成式人工智能的出現(xiàn),也會(huì)幫助我們更快更好地將人工智能應(yīng)用在醫(yī)療領(lǐng)域推廣?!睆堣幢硎?。醫(yī)療領(lǐng)域是她創(chuàng)立的Fusion Fund的一個(gè)重要投資方向。
另一方面,醫(yī)療是關(guān)乎全人類(lèi)健康、生存的重要行業(yè),從其龐大的市場(chǎng)規(guī)模、以及全球?yàn)獒t(yī)療進(jìn)步投入的大量人力、物力,不難看出,未來(lái)這個(gè)行業(yè)也會(huì)不斷有著精進(jìn)技術(shù)、降本增效的需求。僅看美國(guó)市場(chǎng),醫(yī)療行業(yè)的規(guī)模就達(dá)到了4000億美元。
兩相結(jié)合,醫(yī)療行業(yè)很可能成為生成式模型最重要的落地窗口。
從去年底開(kāi)始吸引了全球關(guān)注的ChatGPT,將率先改變醫(yī)療領(lǐng)域中“非臨床”的部分:在《紐約時(shí)報(bào)》六月發(fā)布的報(bào)道中,詳細(xì)介紹了一位田納西的全科醫(yī)生如何在類(lèi)似ChatGPT的AI助手的幫助下,將每天兩小時(shí)以上的醫(yī)療資料整理工作,縮減到20分鐘。
在張璐看來(lái),目前生成式模型在醫(yī)療領(lǐng)域的各個(gè)垂直方向都有重大影響,包括數(shù)字化診斷、數(shù)字化治療、數(shù)字化生物學(xué),將帶來(lái)巨大產(chǎn)業(yè)創(chuàng)新及效能提升的機(jī)會(huì),最終幫助解決醫(yī)療領(lǐng)域的“三A問(wèn)題”,也就是accessibility(可得性)、affordable(低成本)、accuracy(高精度、個(gè)性化)。在此之外,值得關(guān)注的領(lǐng)域還包括藥物創(chuàng)新、臨床試驗(yàn)等。
硅谷投資人、Fusion Fund創(chuàng)始人張璐
對(duì)張璐而言,這些領(lǐng)域中最令她興奮的是生成式人工智能在數(shù)字生物學(xué)的應(yīng)用,尤其是它與AlphaFold結(jié)合后,未來(lái)對(duì)于數(shù)字生物學(xué)及它包含的合成生物學(xué)的推動(dòng)。合成生物學(xué)不僅在制藥領(lǐng)域有巨大的創(chuàng)新價(jià)值,同時(shí)在化工領(lǐng)域、食品領(lǐng)域也有非常廣泛的應(yīng)用?!巴ㄟ^(guò)生成人工智能和數(shù)字生物學(xué)的結(jié)合,可以幫助我們更快發(fā)掘定義新型蛋白質(zhì)的設(shè)計(jì),提高準(zhǔn)確率和效率,從而對(duì)于藥物創(chuàng)新研發(fā)產(chǎn)生巨大的貢獻(xiàn)?!睆堣幢硎?。
今年早些時(shí)候,生物技術(shù)公司Insilico Medicine(Insilico)宣布已完成INS018_055階段II臨床試驗(yàn)首次劑量投放,這是世界上首個(gè)使用生成式人工智能發(fā)現(xiàn)和設(shè)計(jì)的抗纖維化小分子抑制劑,現(xiàn)已開(kāi)始第二階段臨床試驗(yàn)。
其次,臨床實(shí)驗(yàn)(clinical trial design)也有機(jī)會(huì),包括如何設(shè)計(jì)不同的臨床實(shí)驗(yàn)——也就是通過(guò)生成合成的數(shù)據(jù),去幫助挑選最合適的、最低成本的臨床實(shí)驗(yàn)、挑選患者等;在這個(gè)過(guò)程中,生成式模型也可以用于進(jìn)行模型模擬、測(cè)試用戶(hù)數(shù)據(jù)、合成多樣化臨床數(shù)據(jù)等。
過(guò)去人工智能已經(jīng)開(kāi)始應(yīng)用于藥物發(fā)掘,然而一直沒(méi)有爆發(fā)。這是因?yàn)榘l(fā)掘?qū)用嫫鋵?shí)并非成本最高的地方,最高的地方是臨床。
“畢竟臨床需要大量樣本,價(jià)格又非常高昂,導(dǎo)致很多藥廠在研發(fā)藥物上受到限制——如果疾病的病人數(shù)量不夠,可能就很難覆蓋臨床成本,藥廠也沒(méi)有動(dòng)力進(jìn)行開(kāi)發(fā)。
“當(dāng)這兩個(gè)階段可以應(yīng)用生成式人工智能后,就會(huì)對(duì)藥物發(fā)掘帶來(lái)重要的改變:真正從根本上大規(guī)模降低藥物研發(fā)成本,推動(dòng)新藥研發(fā)。”
除了這些新型的方向,生成式人工智能在人工智能驅(qū)動(dòng)的個(gè)性化診斷、醫(yī)療影像層面等領(lǐng)域也有非常廣泛的應(yīng)用。比如張璐于數(shù)年前投資的Subtle Medical正是一個(gè)生成式AI應(yīng)用于醫(yī)療影像的典型范例,最近剛被CB Insights選入首個(gè)生成式AI全球50強(qiáng)榜單。通過(guò)深度學(xué)習(xí)技術(shù),深透醫(yī)療能夠完成包括MRI、PET等醫(yī)學(xué)圖像的增強(qiáng),是醫(yī)療影像領(lǐng)域的首家生成式人工智能平臺(tái),也開(kāi)發(fā)了最早獲FDA、CE、NMPA等同時(shí)批準(zhǔn)的AI醫(yī)學(xué)影像產(chǎn)品。
Subtle Medical入選CB Insights Gen AI全球50強(qiáng)
醫(yī)療垂直行業(yè)的數(shù)據(jù)壁壘保護(hù)創(chuàng)新不難看出,生成式人工智能正成為未來(lái)醫(yī)療領(lǐng)域的主要推動(dòng)技術(shù)之一。在這樣的背景下,什么樣的競(jìng)爭(zhēng)壁壘能夠讓企業(yè)高筑護(hù)城河?
“對(duì)大模型來(lái)說(shuō),數(shù)據(jù)是重中之重。而數(shù)據(jù)與數(shù)據(jù)之間,也有著不少差距,很可能對(duì)大模型的訓(xùn)練與應(yīng)用造成重大影響。” 張璐介紹道,“在目前階段,想要進(jìn)一步優(yōu)化模型,數(shù)據(jù)的質(zhì)量比數(shù)據(jù)量更重要?!?/p>
比如Chat GPT的飛速進(jìn)化,離不開(kāi)全球用戶(hù)的大量數(shù)據(jù)訓(xùn)練;而對(duì)于醫(yī)療等垂直領(lǐng)域來(lái)說(shuō)用專(zhuān)業(yè)的、行業(yè)專(zhuān)注的、特定的數(shù)據(jù)重新訓(xùn)練模型,才能讓模型更加準(zhǔn)確、高效、可靠。
正因此,對(duì)于在大模型領(lǐng)域的初創(chuàng)的公司或者說(shuō)所有參與者來(lái)說(shuō),數(shù)據(jù)的質(zhì)量很可能會(huì)成為一個(gè)重要壁壘。
“尤其是人工智能在醫(yī)療領(lǐng)域應(yīng)用的公司,有沒(méi)有能力接觸最高質(zhì)量的數(shù)據(jù)、高質(zhì)量的數(shù)據(jù)庫(kù),這非常關(guān)鍵?!?張璐表示。
“在醫(yī)療領(lǐng)域,創(chuàng)業(yè)團(tuán)隊(duì)有自己獨(dú)特的data library,也就是各大行業(yè)數(shù)據(jù)、獨(dú)特的行業(yè)知識(shí),才能修改和重新訓(xùn)練這個(gè)模型,進(jìn)行優(yōu)化和調(diào)整,同時(shí)通過(guò)這個(gè)行業(yè)的特定的專(zhuān)業(yè)數(shù)據(jù)去保證模型的精準(zhǔn)性。在這個(gè)基礎(chǔ)之上,也就形成了一個(gè)比較強(qiáng)的技術(shù)和數(shù)據(jù)的壁壘?!?/p>
不難看出,在Fusion Fund的投資策略中,垂直領(lǐng)域應(yīng)用及獨(dú)特的海量高質(zhì)量數(shù)據(jù)都是重要的標(biāo)準(zhǔn)。
以她投資的Subtle Medical為例,他們具有很強(qiáng)的技術(shù)領(lǐng)先性,將技術(shù)應(yīng)用到整個(gè)加州的醫(yī)療系統(tǒng)里面,最優(yōu)質(zhì)的數(shù)據(jù)進(jìn)行初始模型的訓(xùn)練。后續(xù)在大規(guī)模應(yīng)用過(guò)程中,找到了多個(gè)醫(yī)學(xué)影像模態(tài)的應(yīng)用場(chǎng)景、體現(xiàn)了AI技術(shù)的優(yōu)越性,并在美國(guó)、歐洲、亞洲大規(guī)模應(yīng)用,不斷提升模型質(zhì)量。
比如她早在五年前投資的Proscia, 這家公司專(zhuān)注于“AI讀片”,也就是通過(guò)AI來(lái)提升病理診斷的精確度,業(yè)務(wù)主要覆蓋腫瘤切片的影像學(xué)分析、數(shù)據(jù)整合和云共享。從2015年起, Proscia就創(chuàng)建了一個(gè)數(shù)字病理云平臺(tái),使用計(jì)算機(jī)視覺(jué)來(lái)分析腫瘤的活檢切片和醫(yī)學(xué)影像,并為醫(yī)學(xué)專(zhuān)家提供每張切片中的病理數(shù)據(jù)。并在2017年將這項(xiàng)云技術(shù)跨界應(yīng)用于腫瘤病理分析,建立了腫瘤病理切片云數(shù)據(jù)庫(kù)。
再比如她此前投資的Huma.ai,有著眾多藥廠合作,給藥廠數(shù)據(jù)化人工智能工具,所以擁有大量藥廠內(nèi)部數(shù)據(jù)。如今,它不僅是生命科學(xué)和制藥行業(yè)第一個(gè)生成式人工智能平臺(tái),兩年前就開(kāi)始和Open AI合作,還與行業(yè)最頂尖的數(shù)家藥廠建立合作關(guān)系,直接幫助藥廠挖掘內(nèi)部?jī)r(jià)值。通過(guò)Huma.ai的工具,藥廠的科學(xué)家可以直接通過(guò)人工智能設(shè)計(jì)臨床實(shí)驗(yàn)的方案去挖掘新藥特性。
近期,Huma.ai發(fā)布了生命科學(xué)及制藥行業(yè)的第一個(gè)生成式人工智能平臺(tái)。可以看到,這個(gè)生成式人工智能平臺(tái)已經(jīng)有著優(yōu)秀服務(wù)質(zhì)量:可以直接詢(xún)問(wèn)藥物臨床實(shí)驗(yàn)的設(shè)計(jì)方案,它有能力給出非常精準(zhǔn)的答案。
數(shù)據(jù)隱私成挑戰(zhàn),然而仍舊蘊(yùn)藏機(jī)遇在機(jī)遇、壁壘之外,生成式人工智能在醫(yī)療領(lǐng)域面臨著隱私挑戰(zhàn),或者說(shuō)所有的領(lǐng)域都是如此,只是醫(yī)療領(lǐng)域?qū)Υ烁用舾小?/p>
“很多醫(yī)療機(jī)構(gòu)非常擔(dān)心有l(wèi)iability(連帶責(zé)任),可能不太愿意分享數(shù)據(jù),這也會(huì)限制生成式人工智能在行業(yè)的應(yīng)用,這個(gè)時(shí)候就需要另外一個(gè)工具——Federated learning,聯(lián)邦學(xué)習(xí)?!睆堣唇忉尩?。
Federated learning(聯(lián)邦學(xué)習(xí))是一種算法,已經(jīng)開(kāi)發(fā)出來(lái)很多年,特點(diǎn)是無(wú)需移動(dòng)數(shù)據(jù),對(duì)方可以直接把模型放到這一數(shù)據(jù)上進(jìn)行訓(xùn)練。訓(xùn)練完畢后再拿走模型,所以不需要犧牲數(shù)據(jù)的私,又能獲取數(shù)據(jù)價(jià)值,進(jìn)行商業(yè)變現(xiàn)和數(shù)據(jù)分享。
“目前,聯(lián)邦學(xué)習(xí)正在快速應(yīng)用到醫(yī)療領(lǐng)域。比如醫(yī)院想把數(shù)據(jù)提供給第三方的公司,培訓(xùn)人工智能模型,但是傳輸數(shù)據(jù)可能會(huì)承擔(dān)風(fēng)險(xiǎn)或者是隱私泄露的責(zé)任,如果使用了聯(lián)邦學(xué)習(xí),就意味著并未分享數(shù)據(jù),但實(shí)際上這些模型可以使用這些數(shù)據(jù)?!?張璐說(shuō)道。
今年早些時(shí)候,NVIDIA發(fā)布了FLARE平臺(tái),為企業(yè)提供了聯(lián)邦學(xué)習(xí)解決方案:一個(gè)強(qiáng)大、可擴(kuò)展的聯(lián)邦學(xué)習(xí)基礎(chǔ)設(shè)施,使企業(yè)能夠更輕松地管理復(fù)雜的AI工作流程,往往包括大規(guī)模的機(jī)器學(xué)習(xí)(ML)模型的訓(xùn)練和部署。
“未來(lái)我們可以看到一個(gè)很好的前景,聯(lián)邦學(xué)習(xí)加生成式人工智能,幫助醫(yī)療領(lǐng)域的很多的大規(guī)模應(yīng)用快速推進(jìn)?!睆堣幢硎尽!捌渲兄攸c(diǎn)是解決醫(yī)療系統(tǒng)的數(shù)據(jù)孤島問(wèn)題——醫(yī)療系統(tǒng)有很多高質(zhì)量的數(shù)據(jù),但是卻都是相對(duì)孤立、獨(dú)立的。通過(guò)聯(lián)邦學(xué)習(xí),數(shù)據(jù)孤島問(wèn)題得以解決,也能讓這些數(shù)據(jù)可以更好的被人工智能以及大語(yǔ)言模型所應(yīng)用?!?/p>
除此之外,她還指出,生成式人工智能目前面臨著高昂的算力及數(shù)據(jù)成本,未來(lái)很可能會(huì)出現(xiàn)很多新的技術(shù)在infrastructure(基礎(chǔ)設(shè)施)層面上來(lái)降低算力成本、數(shù)據(jù)成本。
“包括各大研究機(jī)構(gòu)也出了一些新的模式,這些用海量數(shù)據(jù)算培訓(xùn)出來(lái)的模型,再用少量的核心數(shù)據(jù)去優(yōu)化它?!北热鏜eta-AI template,希望不能自己建立針對(duì)影像的大型語(yǔ)言模型的公司,用他們的技術(shù)直接去做應(yīng)用。
不難看出,生成式模型作為工作提升的效率工具,仍舊有巨大的潛力。
“目前的生成式模型帶來(lái)的是非常高效好用的工具,然而它也必須要被人去使用。未來(lái)醫(yī)療領(lǐng)域,醫(yī)生護(hù)士都應(yīng)該要使用這種新型的工具——因?yàn)檫@是人類(lèi)的本質(zhì),和其他生物比,人類(lèi)最大的優(yōu)勢(shì)就在于會(huì)使用工具,可以說(shuō)替代不是說(shuō)技術(shù)替代人,而是說(shuō)會(huì)使用新技術(shù)、會(huì)使用新工具的人,會(huì)替代那些不會(huì)使用人工智能工具的人?!睆堣慈绱嗽u(píng)論“AI代替人”的觀點(diǎn)。
她認(rèn)為,AI將不斷幫助整個(gè)醫(yī)療系統(tǒng)完成效能提升,這一點(diǎn)也在她所投資的該領(lǐng)域企業(yè)中得到驗(yàn)證。
比如說(shuō)Fusion Fund旗下被投公司Synaptec,通過(guò)人工智能進(jìn)行醫(yī)療代碼的自動(dòng)化,節(jié)約醫(yī)生大量時(shí)間。
再比如說(shuō)由成功連續(xù)創(chuàng)業(yè)者創(chuàng)立的Vectara,專(zhuān)注于通過(guò)大語(yǔ)言模型去做企業(yè)級(jí)的搜索,可以幫助大的公司直接在公司內(nèi)部的數(shù)據(jù)上運(yùn)行大語(yǔ)言模型進(jìn)行智能搜索。以及上文提到的Proscia,能通過(guò)AI讀片幫助醫(yī)生大大提升讀片分析效率,而非取代醫(yī)生。
“如今人工智能的發(fā)展真真正正驗(yàn)證了它作為一個(gè)非常強(qiáng)大的工具去幫助醫(yī)療工作者提升效率效能的能力,未來(lái)持續(xù)幫助他們把時(shí)間花在最關(guān)鍵的步驟上。”
而這影響力還將繼續(xù)擴(kuò)展,各個(gè)產(chǎn)業(yè)都可以通過(guò)它來(lái)進(jìn)行工作效能提升。
“未來(lái)生成式人工智能會(huì)是一個(gè)基礎(chǔ)設(shè)施一樣的技術(shù)、一個(gè)非常高效的工具,可以預(yù)測(cè)到在這個(gè)基礎(chǔ)上會(huì)出現(xiàn)各類(lèi)應(yīng)用,并探索各類(lèi)模型優(yōu)化。在這個(gè)過(guò)程中,它的準(zhǔn)確性、應(yīng)用的效率性、成本的降低,都是創(chuàng)新關(guān)注的方向。”
隨著生成式人工智能帶來(lái)的一個(gè)非常大的突破和飛躍,這類(lèi)“零代碼”的AI平臺(tái)會(huì)廣泛出現(xiàn)在人們的工作生活中。未來(lái),許多擁有優(yōu)秀數(shù)據(jù)基礎(chǔ)的行業(yè)可能都會(huì)面臨人工智能的全面轉(zhuǎn)型:包括保險(xiǎn)、物流、金融行業(yè)。
“生成式模型帶來(lái)了一個(gè)非常巨大的生態(tài),讓我們能夠看到全產(chǎn)業(yè)的人工智能的如何數(shù)字化轉(zhuǎn)型。而且我也相信,未來(lái)每個(gè)公司都多少要植入人工智能,它就像電力一樣,用電多與少取決于你需要多少,但是所有公司都會(huì)使用這樣的‘超級(jí)電力’,加速生產(chǎn)效率和生產(chǎn)力?!睆堣幢硎尽?/p>
相關(guān)閱讀
-
熱點(diǎn)