具有科學(xué)頭腦的全能人工智能化學(xué)家簡介
瀏覽次數(shù):1412 發(fā)布日期:2024-2-2
來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)
引言
賦予具有科學(xué)頭腦的機(jī)器人以幫助人類破譯復(fù)雜世界的高維相關(guān)性,降低新材料的試錯(cuò)開發(fā)成本,甚至實(shí)現(xiàn)星際探索和殖民化,在許多科幻故事中都是一種幻想。機(jī)器人自動(dòng)化化學(xué)實(shí)驗(yàn)的最新進(jìn)展為作者帶來了希望。已經(jīng)開發(fā)了一種自動(dòng)化化學(xué)機(jī)器系統(tǒng)(稱為 Chemputer),以集成文獻(xiàn)閱讀、方案定制、有機(jī)合成和表征,而另一個(gè)更通用的系統(tǒng)可以進(jìn)行類似樂高的自動(dòng)化有機(jī)合成。2020 年,據(jù)報(bào)道,一個(gè)以人工智能(AI)為控制器的云原生化學(xué)平臺(tái)基于先前可用的數(shù)據(jù)進(jìn)行了有機(jī)逆合成。與此同時(shí),庫珀領(lǐng)導(dǎo)的研究小組進(jìn)一步開發(fā)了一種移動(dòng)機(jī)器人化學(xué)家,該化學(xué)家能夠比人類更快地進(jìn)行實(shí)驗(yàn),并能夠通過貝葉斯優(yōu)化選擇光催化劑。
在此基礎(chǔ)上,建立了一個(gè)全方位的人工智能化學(xué)實(shí)驗(yàn)室,該實(shí)驗(yàn)室可以 (i)利用現(xiàn)有知識(shí)提出科學(xué)假設(shè)并生成實(shí)驗(yàn)計(jì)劃,(ii)執(zhí)行多個(gè)化學(xué)任務(wù)的完整實(shí)驗(yàn)程序(合成、表征和性能測(cè)試),以及(iii)利用理論計(jì)算和實(shí)驗(yàn)數(shù)據(jù)反饋建立預(yù)測(cè)模型,以智能化的方式進(jìn)行全方位的化學(xué)研究。圖 1A1A 概述了全能 AI 化學(xué)家的總體架構(gòu)。
圖 1 以科學(xué)的思維設(shè)計(jì)全方位的人工智能化學(xué)家。(A)人工智能化學(xué)家的三個(gè)模塊:機(jī)器閱讀模塊、移動(dòng)機(jī)器人模塊和計(jì)算大腦模塊。(B)人工智能化學(xué)家的工作流程和每 個(gè)模塊的功能。
結(jié)論與討論
這位全能的人工智能化學(xué)家的工作流程形成了一個(gè)完整的閉環(huán)(圖 1B),并由自制的系統(tǒng)軟件控制。當(dāng)人工智能化學(xué)家收到人類研究人員提出的科學(xué)問題時(shí),其具有用戶友好圖形用戶界面(GUI)的服務(wù)平臺(tái)會(huì)在通過機(jī)器閱讀大量文獻(xiàn)獲取現(xiàn)有知識(shí)后提出科學(xué)假設(shè)。該服務(wù)平臺(tái)具有訪問云數(shù)據(jù)庫和設(shè)計(jì)實(shí)驗(yàn)計(jì)劃的能力,并具有基于 web 的功能,使其能夠輕松管理任務(wù)和遠(yuǎn)程監(jiān)控移動(dòng)機(jī)器人。該服務(wù)平臺(tái)生成的實(shí)驗(yàn)計(jì)劃提供給移動(dòng)機(jī)器人和各種智能化工工作站。開發(fā)了基于機(jī)器人操作系統(tǒng)(ROS)的控制系統(tǒng)軟件,以控制具有六自由度機(jī)械臂的移動(dòng)機(jī)器人四處移動(dòng)并操作所有設(shè)備。
人工智能化學(xué)家的首要任務(wù)是閱讀大量的文獻(xiàn),以獲得人類化學(xué)家的智慧。通過數(shù)字化和標(biāo)準(zhǔn)化文獻(xiàn)中用自然語言編寫的實(shí)驗(yàn)協(xié)議,可以將現(xiàn)有的知識(shí)轉(zhuǎn)移到機(jī)器人身上,豐富其大腦。如圖 2A 所示,基于語法規(guī)則、領(lǐng)域詞典和機(jī)器學(xué)習(xí),作者構(gòu)建了一個(gè)科學(xué)的文本數(shù)據(jù)挖掘系統(tǒng),包括八個(gè)自然語言處理步驟。該系統(tǒng)可以通過文本分類分解標(biāo)題、段落和句子,通過單詞標(biāo)記和詞性標(biāo)注定位重要區(qū)域,進(jìn)行名稱實(shí)體識(shí)別,進(jìn)行語法分析,提取實(shí)體關(guān)系,實(shí)現(xiàn)共指解析和糾錯(cuò)。NLP 步驟將科學(xué)文本轉(zhuǎn)換為人工智能可以理解的結(jié)構(gòu)化數(shù)據(jù)。該數(shù)據(jù)挖掘系統(tǒng)屬于一個(gè)具有基于 web 瀏覽器的人機(jī)界面(HMI)的服務(wù)平臺(tái),可以根據(jù)上述結(jié)構(gòu)化數(shù)據(jù)進(jìn)一步提出假設(shè)并提供實(shí)驗(yàn)計(jì)劃的智能推薦。
用戶友好的 GUI 幫助研究人員遠(yuǎn)程監(jiān)控機(jī)器人和工作站的狀態(tài)(圖 2B ),并通過點(diǎn)擊和拖動(dòng) GUI 來定制實(shí)驗(yàn)程序。如圖 2C 所示,根據(jù)科學(xué)假設(shè),服務(wù)平臺(tái)與所有工作站進(jìn)行通信,檢查其狀態(tài),并定制實(shí)驗(yàn)工作流程。作者還生成了一個(gè)基于云的化學(xué)數(shù)據(jù)庫,以便于從帶有下拉列表的固體或液體分配菜單中選擇化學(xué)樣品。當(dāng)搜索任何化合物時(shí),也可以通過網(wǎng)絡(luò)界面訪問數(shù)據(jù)庫,一旦實(shí)驗(yàn)工作流程得到驗(yàn)證,它們就會(huì)作為實(shí)驗(yàn)?zāi)0宕鎯?chǔ)到云數(shù)據(jù)庫中,用于后續(xù)的實(shí)驗(yàn)調(diào)用。服務(wù)平臺(tái)還可以對(duì)收集到的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行初步分析,并盡可能在基于瀏覽器的界面上將表征和性能測(cè)試的結(jié)果顯示和可視化為圖形(圖 2D )。這些實(shí)驗(yàn)數(shù)據(jù)還用于建立和更新數(shù)據(jù)庫,用于后續(xù)預(yù)測(cè)模型和貝葉斯優(yōu)化(圖 2E)。AI 化學(xué)家能夠自動(dòng)迭代實(shí)驗(yàn)條件,直到實(shí)驗(yàn)結(jié)果達(dá)到之前設(shè)置的閾值參數(shù)。
圖 2 具有基于 web 瀏覽器的 HMI 的服務(wù)平臺(tái)。(A)機(jī)器閱讀模塊,用于捕獲現(xiàn)有 知識(shí),并通過 NLP 將其轉(zhuǎn)換為機(jī)器可理解的結(jié)構(gòu)化數(shù)據(jù)。(B)用戶友好的 GUI 實(shí)時(shí)監(jiān) 控化工工作站和機(jī)器人的狀態(tài)。(C)實(shí)驗(yàn)工作流程圖:從科學(xué)假設(shè)到工作站狀態(tài),再到 實(shí)驗(yàn)設(shè)計(jì)和模板。(D)電化學(xué)活性表面積、電流-電壓曲線等實(shí)驗(yàn)數(shù)據(jù)采集并顯示在服 務(wù)平臺(tái)上。(E)實(shí)驗(yàn)檔案用于建立實(shí)驗(yàn)數(shù)據(jù)庫和訓(xùn)練預(yù)測(cè)模型
為了執(zhí)行合成、表征和測(cè)試的整個(gè)過程,作者在實(shí)驗(yàn)室中設(shè)置了一個(gè)移動(dòng)機(jī)器人和 14 個(gè)工作站,分別包括自動(dòng)合成區(qū)、自動(dòng)表征區(qū)和自動(dòng)性能測(cè)試區(qū)。當(dāng) AI Chemist 執(zhí)行合成任務(wù)時(shí),它使用精度為 3μL 的液體分配工作站和精度為 0.1 mg 的固體分配工作站來制備試劑。然后,它使用時(shí)間控制精度為毫秒的磁力攪拌工作站和超聲混合工作站來進(jìn)行所需的反應(yīng)。最后,在干燥器工作站、離心工作站和液體提取工作站對(duì)產(chǎn)品進(jìn)行純化。在完成合成過程后,將裝有產(chǎn)品的樣品容器轉(zhuǎn)移到自動(dòng)表征區(qū)域和自動(dòng)性能測(cè)試區(qū)域。目前,該實(shí)驗(yàn)室配備了自動(dòng)控制的紫外-可見光譜、熒光和拉曼光譜工作站,以表征產(chǎn)品的成分和結(jié)構(gòu),以及自動(dòng)控制的電化學(xué)工作站、封蓋工作站,光催化工作站和 HS 氣相色譜(GC)來測(cè)試產(chǎn)品的催化性能。自主開發(fā)的系統(tǒng)軟件能夠進(jìn)行機(jī)器人路徑規(guī)劃、機(jī)器人控制和連接以及智能化學(xué)操作,負(fù)責(zé)協(xié)調(diào)機(jī)器人和工作站之間的實(shí)時(shí)交互。移動(dòng)機(jī)器人只需按順序執(zhí)行所有命令,每個(gè)工作站只需確保使用準(zhǔn)確的參數(shù)執(zhí)行實(shí)驗(yàn)操作,并將實(shí)驗(yàn)數(shù)據(jù)正確反饋給系統(tǒng)。機(jī)器人和工作站共同構(gòu)成了人工智能化學(xué)家的整體智能實(shí)驗(yàn)室(圖 3)
圖 3 智能化工實(shí)驗(yàn)室和移動(dòng)機(jī)器人。具有機(jī)器人路徑規(guī)劃、機(jī)器人控制與連接、智能化工操作能力的智能化工實(shí)驗(yàn)室,以及配備控制系統(tǒng)、雙激光雷達(dá)定位系統(tǒng)、六自由度機(jī)械臂和大型可擴(kuò)展裝載平臺(tái)的移動(dòng)機(jī)器人。
曼森合成生物學(xué)自動(dòng)化智能實(shí)驗(yàn)室
作者進(jìn)行了兩個(gè)實(shí)驗(yàn)來檢查機(jī)器人和工作站的硬件和軟件。在第一個(gè)實(shí)驗(yàn)中, AI 化學(xué)家被指示尋找一種具有聚集誘導(dǎo)發(fā)射(AIE)特性的生物相容性發(fā)光體。機(jī)器讀取模塊激活:從 15 979 篇論文,4865 個(gè)分子被發(fā)現(xiàn)與“AIE”、“聚集誘導(dǎo) 發(fā)射”和“聚集誘導(dǎo)輻射”有關(guān)。在基于專業(yè)知識(shí)規(guī)則的數(shù)據(jù)清理后,306 個(gè)分子被鑒定為市售 AIE 發(fā)光體的候選分子。其中,氯化黃連素(BBR) 是唯一一種發(fā)射波長位于可見光區(qū)域的化合物,因此被選擇進(jìn)行進(jìn)一步研究。AI Chemist 進(jìn)行了一系列自動(dòng)化實(shí)驗(yàn),以合成不同的鹽酸黃連素溶液并測(cè)量其熒光。機(jī)器人使用固體分配工作站稱量適量的固體鹽酸黃連素樣品,然后將其轉(zhuǎn)移到液體分配工作站,將其溶解為溶液。使用光致發(fā)光(PL)光譜和紫外光譜測(cè)量溶液的光學(xué)性質(zhì)。如圖 4A–C 所示,比較了不同濃度和溶劑的 BBR 溶液,從而確定 BBR 的最佳濃度為 20mM。
圖 4 通過移動(dòng)機(jī)器人和工作站進(jìn)行的化學(xué)實(shí)驗(yàn)
第二個(gè)實(shí)驗(yàn)是優(yōu)化金屬氧化物光催化劑的氫摻雜策略。合成工作站生產(chǎn)了一組通過 Cu–酸處理進(jìn)行不同加氫量的 HxMoO3樣品(圖 4D),然后在光催化工作站用于 rhodamine B(RhB)的光催化降解。光催化反應(yīng)由 UV–Vis 光譜工作站監(jiān)測(cè)(圖 4E):RhB 的光催化降解效率在樣品 HMO-5 上達(dá)到最大水平。為了在反應(yīng)過程中獲得染料敏化光催化 H2 生產(chǎn)的產(chǎn)率,將小瓶在加蓋工作站處真空密封, 并轉(zhuǎn)移到 HS GC 工作站用于測(cè)量所生產(chǎn)的 H2。樣品 HMO-6 顯示出最高的 H2 生 產(chǎn)速率,如圖 4F 所示。這里,所有實(shí)驗(yàn)測(cè)量點(diǎn)的偏差條的平均值對(duì)于 H2 生產(chǎn)速率為 5.5%,對(duì)于 RhB 降解效率為 8.3%,這表明 AI Chemist 具有高精度和可重復(fù)性。基于任務(wù)管理模塊,開發(fā)了一個(gè)能夠?qū)崿F(xiàn)多任務(wù)動(dòng)態(tài)優(yōu)化的智能化工系統(tǒng)。在它的幫助下,機(jī)器人的總實(shí)驗(yàn)時(shí)間和等待時(shí)間可以顯著縮短:未經(jīng)優(yōu)化的染料敏化光催化水分解實(shí)驗(yàn)的四個(gè)樣品架的總耗時(shí)為 1810 分鐘,而多任務(wù)動(dòng)態(tài)優(yōu)化后的四個(gè)實(shí)驗(yàn)樣品架的總時(shí)間消耗為 980 分鐘(圖 4G )。
上述兩項(xiàng)任務(wù)已經(jīng)證明,移動(dòng)機(jī)器人和智能工作站可以成功執(zhí)行各種實(shí)驗(yàn)操作。接下來,作者將它們與服務(wù)平臺(tái)和計(jì)算大腦相結(jié)合,充當(dāng)人工智能化學(xué)家, 進(jìn)行全方位的化學(xué)研究。作者以非貴金屬析氧反應(yīng)(OER)電催化劑為例。研究表明,含有四種以上不同元素的高熵合金納米顆粒由于其結(jié)構(gòu)穩(wěn)定性、吸附位點(diǎn)的多樣性和顯著的催化活性,很有可能成為未來電催化劑的選擇。其中,MIL-101 MOF 是不同金屬元素合成高熵電催化劑的理想平臺(tái)。然而,元素組合的廣泛選擇對(duì)開發(fā)高熵電催化劑提出了巨大挑戰(zhàn)。即使作者只想確定一種理想的金屬組合, 也可能需要數(shù)十萬年才能達(dá)到最佳組成比。這個(gè)簡單的事實(shí)使高熵合金納米顆粒成為作者具有科學(xué)頭腦的全能人工智能化學(xué)家的合適任務(wù)。同樣,服務(wù)平臺(tái)通過智能機(jī)器讀取大約 16000 篇云數(shù)據(jù)庫的論文來整理金屬建議(圖 5A )。選擇五種非貴金屬元素構(gòu)建 207 個(gè)由移動(dòng)機(jī)器人在智能化工工作站上完全執(zhí)行的嘗試-錯(cuò)誤實(shí)驗(yàn)。實(shí)驗(yàn)室開發(fā)的智能化工系統(tǒng)通過多任務(wù)動(dòng)態(tài)優(yōu)化,成功地將四組實(shí)驗(yàn)的總耗時(shí)從 630 分鐘縮短到 365 分鐘(圖 4H )。
圖 5 AI 化學(xué)家進(jìn)行的全方位化學(xué)研究。
結(jié)論
這里報(bào)道的這位具有科學(xué)頭腦的全能人工智能化學(xué)家由服務(wù)平臺(tái)、移動(dòng)機(jī)器人、工作站和計(jì)算大腦組成。它能夠閱讀文獻(xiàn),提出假設(shè),設(shè)計(jì)實(shí)驗(yàn)計(jì)劃,執(zhí)行自動(dòng)化操作,分析實(shí)驗(yàn)數(shù)據(jù),訓(xùn)練機(jī)器學(xué)習(xí)模型,并反饋新的假設(shè)。換言之,它擁有進(jìn)行高水平化學(xué)研究的所有能力,這只有一群組織良好的人類化學(xué)家才能實(shí)現(xiàn)。AI Chemist 的閉環(huán)迭代設(shè)計(jì)顯示了其在電催化劑、光催化劑和發(fā)光材料領(lǐng)域的多功能性。AI Chemist 擁有通用軟件協(xié)議和標(biāo)準(zhǔn)化硬件接口。這種模塊化設(shè)計(jì)使其可擴(kuò)展,以滿足未來通過增加更多的實(shí)驗(yàn)工作站或計(jì)算機(jī)制進(jìn)行各種實(shí)驗(yàn)任務(wù)的要求。人工智能化學(xué)家可以智能地篩選或設(shè)計(jì)出最佳材料,這一事實(shí)無疑可以大大縮短人類化學(xué)家進(jìn)行實(shí)驗(yàn)的時(shí)間。還應(yīng)該提到的是,人工智能化學(xué)家只能從現(xiàn)有知識(shí)中獲取信息,并在已知技術(shù)范圍內(nèi)進(jìn)行實(shí)驗(yàn)。未來的發(fā)現(xiàn)在很大程度上仍然取決于人類科學(xué)家開發(fā)新理論和發(fā)明新技術(shù)。盡管如此,可以肯定地說,人工智能化學(xué)家已經(jīng)開始改變我們尋找和制造新材料的方式。具有科學(xué)頭腦的全方位人工智能化學(xué)家可能在未來幾年徹底改變傳統(tǒng)的化學(xué)實(shí)驗(yàn)室。
文章來源:Zhu Q, Zhang F, Huang Y, Xiao H, Zhao L, Zhang X, Song T, Tang X, Li X, Guo H, Chong B, Zhou J, Zhang Y, Zhang B, Cao J, Luo M, Wang S, Ye G, Zhang W, Chen X, Cong S, Zhou D, Li H, Li J, Zou G, Shang W, Jiang J, Luo Y. An all-round AI-Chemist with scientific mind. Natl Sci Rev, 2022, 9(10): nwac190.