《理解未來》科學(xué)講座:如何搭建生命科學(xué)的ChatGPT?
2月10日,《理解未來》科學(xué)講座AI for Science 系列03期:“AI4Science 和 ChatGPT,生物醫(yī)藥的契機(jī)?”在全網(wǎng)線上開講。未來論壇理事、北京大學(xué)李兆基講席教授、北京大學(xué)理學(xué)部主任謝曉亮擔(dān)任主持,特別邀請(qǐng)中國科學(xué)院院士、北京大學(xué)教授、北京大數(shù)據(jù)研究院院長、北京科學(xué)智能研究院(AI for Science Institute, Beijing)院長鄂維南,加拿大魁北克省人工智能研究中心(Mila)副教授、加拿大高等研究院(CIFAR)人工智能講席教授唐建,分別圍繞“AI for Science科技革命”、“生命科學(xué)中的生成式人工智能”共同探索交流“AI+生命科學(xué)”,分享前沿學(xué)術(shù)成果,共話跨學(xué)科交叉領(lǐng)域的深度融合創(chuàng)新。
? ? ?
鄂維南:科學(xué)研究將從“作坊”模式轉(zhuǎn)變到“安卓”模式
本次活動(dòng)中,鄂維南教授以《AI for Science:一場(chǎng)正在發(fā)生的科技革命》為題闡述AI for Science帶來的科研范式的變革和新的產(chǎn)業(yè)業(yè)態(tài)。他指出,化學(xué)、材料、生物、工程等傳統(tǒng)領(lǐng)域都將成為AI的主戰(zhàn)場(chǎng),同時(shí)也將催生新一代的產(chǎn)業(yè)模式。另一方面,在AI+Science的驅(qū)動(dòng)下,科學(xué)研究將從“小農(nóng)作坊”模式轉(zhuǎn)變到“安卓”模式,“平臺(tái)科研”將成為全新的科研范式,“社區(qū)建設(shè)”將成為重要趨勢(shì)。
“希望我們有效地利用這一千載難逢的機(jī)會(huì),將AI+Science的“安卓”模式基礎(chǔ)設(shè)施建設(shè)起來,充分利用這一科學(xué)發(fā)展空間,讓中國走在全球科學(xué)領(lǐng)域的前沿?!?strong>鄂維南教授表示。
? ? ?
唐建:AI+生物技術(shù)處于黃金時(shí)期 以生成式AI模型賦能藥物研發(fā)
本次活動(dòng)中,唐建教授以《生命科學(xué)中的生成式人工智能:如何搭建生命科學(xué)的“ChatGPT”》為題,介紹了生成式人工智能在生命科學(xué)的應(yīng)用。
他指出,人工智能和生物技術(shù)的研究正處于黃金時(shí)期。語言生成模型如 ChatGPT 在對(duì)話系統(tǒng)領(lǐng)域取得了很大的突破,因此,研究者們正在探索是否能在生物制藥領(lǐng)域搭建類似的人工智能模型。
“在人工智能與生物醫(yī)藥的交叉領(lǐng)域已有了諸多探索,例如:GeoDiff 應(yīng)用在小分子的三維構(gòu)象預(yù)測(cè);E3Bind 應(yīng)用在蛋白質(zhì)-配體復(fù)合物結(jié)構(gòu)預(yù)測(cè);ProtSeed 同時(shí)生成新的蛋白質(zhì)結(jié)構(gòu)和序列等?!?strong>唐建教授表示。
? ? ?
前瞻對(duì)話:聚焦AI+生物醫(yī)藥前景,推動(dòng)AI+科學(xué)交叉融合
在前瞻對(duì)話環(huán)節(jié),嘉賓們圍繞“AI+生物醫(yī)藥前景”、“生成式AI對(duì)生命科學(xué)領(lǐng)域帶來的影響”、“如何促進(jìn)AI專家與科學(xué)家加強(qiáng)合作”等議題展開對(duì)話,分享深刻的洞察與思考。
關(guān)于組學(xué)與人工智能相結(jié)合,鄂維南教授指出,首先需要不同學(xué)科背景的專家一起來參與這類研究。其次,需要找到不同尺度、不同現(xiàn)象的新的guiding principle,來填補(bǔ)中間尺度的結(jié)構(gòu)。他表示,目前分子尺度比較清楚,大的尺度也有一定的概念,但是中間尺度,我們?nèi)狈σ粋€(gè)guiding principle,需要物理、數(shù)學(xué)領(lǐng)域的專家參與進(jìn)來才能有進(jìn)一步的發(fā)現(xiàn)?!白钪匾氖钦业竭@樣的人,將其有效地組織起來,為他們提供足夠的資源?!?strong>鄂維南教授談到。
唐建教授指出,AI分析數(shù)據(jù)以及機(jī)器學(xué)習(xí),為科學(xué)規(guī)律的表達(dá)提供了可能性。“AI將可能的文本、知識(shí)、代碼進(jìn)行訓(xùn)練,當(dāng)AI能力達(dá)到一定強(qiáng)度后,我們就通過模型的開發(fā),對(duì)大量數(shù)據(jù)進(jìn)行學(xué)習(xí)和訓(xùn)練。其中,ChatGPT可以產(chǎn)生全新的原創(chuàng)內(nèi)容,具有一定的創(chuàng)造力,像一本百科全書,用戶可以很快從百科全書中獲取需要的知識(shí)。在蛋白質(zhì)設(shè)計(jì)領(lǐng)域,不論是小分子還是蛋白質(zhì)分子,本質(zhì)而言都需要生成一些新的結(jié)構(gòu)。通過融入ChatGPT,可以提升蛋白質(zhì)設(shè)計(jì)的創(chuàng)新度和多樣性。”唐建教授表示。
謝曉亮教授也在前瞻對(duì)話環(huán)節(jié)分享了對(duì)于AI+生命科學(xué)領(lǐng)域應(yīng)用的思考。他指出,基于技術(shù)上的突破,生命科學(xué)基因組學(xué)、冷凍電鏡等生命科學(xué)領(lǐng)域,逐漸從“數(shù)據(jù)缺乏學(xué)科”轉(zhuǎn)變?yōu)椤按髷?shù)據(jù)科學(xué)”,從“定性學(xué)科”轉(zhuǎn)變?yōu)椤岸繉W(xué)科”?!按饲霸谖业腂iophysics教學(xué)過程中,十幾年都是從序列到結(jié)構(gòu),而基于當(dāng)時(shí)的算法水平,‘結(jié)構(gòu)’是沒辦法算出來的,直到2022年,結(jié)構(gòu)可以通過AI算法計(jì)算出來,這也是AI+生命科學(xué)的一項(xiàng)技術(shù)革命?!?/p>
另外,謝曉亮教授也提到,AI需要大數(shù)據(jù),因此數(shù)據(jù)質(zhì)量非常重要。最近,西湖大學(xué)的許田教授正在通過機(jī)器學(xué)習(xí)的方式尋找中藥的有效成分,運(yùn)用組學(xué)為不同的器官和細(xì)胞使用中藥,這也是中醫(yī)非常需要的科學(xué)方法。