圖片來源:外灘大會(huì)官方提供
時(shí)隔三年,2023Inclusion·外灘大會(huì)于9月7日在黃浦世博園召開,對(duì)AI的影響展開了探討。延續(xù)“金融+科技”的脈絡(luò)和國(guó)際化的特點(diǎn),圍繞“科技·創(chuàng)造可持續(xù)未來”這一主題,大會(huì)第一天的主論壇圍繞技術(shù)、產(chǎn)業(yè)與未來三個(gè)篇章進(jìn)行展開。其中,科技篇探討了科技是如何為全球經(jīng)濟(jì)與產(chǎn)業(yè)注入新動(dòng)能,同時(shí)令未來更加可持續(xù)。
(資料圖片)
去年底開始,硅谷創(chuàng)業(yè)公司OpenAI發(fā)布聊天機(jī)器人大模型ChatGPT,也直接開啟了從美國(guó)到全球的大模型熱潮。僅在中國(guó),以百度文心一言、阿里通義千問、騰訊混元和其它科技公司為代表的大模型競(jìng)賽,就正在如火如荼得進(jìn)行當(dāng)中。
在這個(gè)大模型涌現(xiàn)的時(shí)代,AI為技術(shù)和科研帶來了哪些改變和挑戰(zhàn)?我們又有哪些應(yīng)對(duì)的辦法?
中國(guó)科學(xué)院院士、復(fù)旦大學(xué)副校長(zhǎng)張人禾表示,科學(xué)智能已經(jīng)成為人工智能發(fā)展的重點(diǎn)方向。
如今,科學(xué)智能通過多模態(tài)、大模型等人工智能新技術(shù),實(shí)現(xiàn)了對(duì)多類別、高維度、跨尺度的海量數(shù)據(jù)進(jìn)行建模、推理和分析,為復(fù)雜場(chǎng)景提供了研究新線索和科學(xué)新假設(shè),從而發(fā)現(xiàn)了新物質(zhì)、合成新材料、構(gòu)建新機(jī)理。
具體來講,在基礎(chǔ)研究領(lǐng)域中,可以通過AI賦能規(guī)律的探析;在科學(xué)發(fā)展過程中,AI可以在從設(shè)計(jì)假設(shè)到實(shí)驗(yàn)設(shè)計(jì)、數(shù)據(jù)收集到數(shù)據(jù)分析的過程中,起到增速的作用,進(jìn)而重塑科學(xué)發(fā)現(xiàn)、推動(dòng)科研成果涌現(xiàn)。
此外,從范式角度出發(fā),Type1(數(shù)據(jù)驅(qū)動(dòng),強(qiáng)調(diào)科研中的直覺性思考)可以通過對(duì)實(shí)驗(yàn)數(shù)據(jù)的分析,從經(jīng)驗(yàn)出發(fā)尋找科學(xué)規(guī)律并解決實(shí)際問題;Type2(機(jī)理驅(qū)動(dòng),強(qiáng)調(diào)科研中的推理性思考)則是基于第一性原理的研究方式,通過構(gòu)建真實(shí)世界的數(shù)學(xué)模型試圖發(fā)現(xiàn)物理世界的基本規(guī)律。后者往往能夠很大程度上驅(qū)動(dòng)物理學(xué)的發(fā)展,但卻在求解真實(shí)場(chǎng)景的復(fù)雜物理系統(tǒng)的過程中存在著計(jì)算量過大的問題。
AI For Science則為上述兩種科研范式的融合提供了路徑。據(jù)張人禾介紹,谷歌旗下的AI公司DeepMind開發(fā)的AI蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)ALphaFold2,就是Type1和Type2融合的典型案例。AlphaFold2基于大規(guī)模蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫PDB訓(xùn)練,并將蛋白質(zhì)結(jié)構(gòu)的生物學(xué)知識(shí)和事實(shí)記憶通過多序列比對(duì)、三角形更新、IPA等技術(shù)嵌入深度學(xué)習(xí)算法模型中,能夠達(dá)到前所未有的預(yù)測(cè)準(zhǔn)確度。
機(jī)器學(xué)習(xí)泰斗,美國(guó)科學(xué)院、美國(guó)工程院院士邁克爾·喬丹(Michael I.Jordan),同樣講述了科學(xué)智能之于科研的重要作用。
在分子生物學(xué)領(lǐng)域,AI系統(tǒng)AlphaFold可以通過對(duì)大量蛋白質(zhì)結(jié)構(gòu)和氨基酸數(shù)據(jù)的學(xué)習(xí),預(yù)測(cè)最終的蛋白質(zhì)結(jié)構(gòu),其預(yù)測(cè)的結(jié)構(gòu)種類可以達(dá)到上億的數(shù)量級(jí),對(duì)分子生物學(xué)的研究工作產(chǎn)生了巨大的推動(dòng)作用。邁克爾·喬丹舉例,在2004年的一篇研究中,需要探究蛋白質(zhì)的固有無序性與生物學(xué)功能的磷酸化之間的關(guān)聯(lián),這就需要大量的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)作為支撐。然而人們通過X射線衍射的方式得到的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫只有一萬量級(jí),AlphaFold的預(yù)測(cè)則可以達(dá)到兩億量級(jí),盡管不是真實(shí)實(shí)驗(yàn)的數(shù)據(jù),但它的準(zhǔn)確度并不低,由此推動(dòng)了分子生物學(xué)、乃至更多領(lǐng)域的科研工作。
同時(shí),邁克爾·喬丹還指出了AI現(xiàn)階段所面臨的問題:“如果你問ChatGPT,你剛剛寫的內(nèi)容你確定嗎?你會(huì)發(fā)現(xiàn),它完全無法回答這個(gè)問題。”這是現(xiàn)階段的人工智能正在面臨的一個(gè)問題。邁克爾·喬丹還強(qiáng)調(diào),金融科技?xì)w根到底是不確定的技術(shù),那么對(duì)于正在金融科技領(lǐng)域發(fā)揮重要作用的人工智能,解決其不確定性以及對(duì)不確定性進(jìn)行量化的問題成為了十分關(guān)鍵的一點(diǎn)。
人是多種多樣的,相對(duì)應(yīng)的,AI的本質(zhì)應(yīng)該是集體,而不是個(gè)人。正是從這一觀點(diǎn)出發(fā),邁克爾·喬丹指出,我們可以通過設(shè)計(jì)一個(gè)協(xié)作式的、去中心化的系統(tǒng)來實(shí)現(xiàn)集體智能,并通過這樣一個(gè)集體智能體,去解決不確定性。
除了不確定的問題,大模型時(shí)代還存在著顯著的安全問題。
中國(guó)科學(xué)院院士何積豐認(rèn)為,大模型時(shí)代顯著的安全問題就在于隱私和“對(duì)齊(alignment)”。
對(duì)齊指的是AI系統(tǒng)的目標(biāo)或者說產(chǎn)出要與人類的價(jià)值觀和設(shè)計(jì)者的期望相符合?!叭绻讶斯ぶ悄芸醋魑饔斡浝锏膶O悟空,‘對(duì)齊’就是唐僧的緊箍咒。有了緊箍咒,就可以保證技術(shù)不會(huì)任意使用能力胡作非為?!?/p>
一方面,大模型能力的發(fā)展及其對(duì)于我們?nèi)粘I畹臐B透,對(duì)隱私保護(hù)提出了更高的要求。
另一方面,對(duì)齊技術(shù)在規(guī)范AI的同時(shí)也面臨著挑戰(zhàn),人類的價(jià)值觀是多元且動(dòng)態(tài)發(fā)展的;AI大模型的“有用性”與“無害性”之間的目標(biāo)也并不是完全一致的,這些都對(duì)“對(duì)齊”技術(shù)提出了挑戰(zhàn)。
面臨上述挑戰(zhàn),通過人工反饋保證輸出內(nèi)容的質(zhì)量,以及事先規(guī)定大模型應(yīng)當(dāng)遵循的原則,讓系統(tǒng)自動(dòng)訓(xùn)練模型對(duì)生成結(jié)果提供初始排序,或可成為一條解決問題的途徑,何積豐表示,“人類和機(jī)器將持續(xù)共同學(xué)習(xí)”。