首頁 > 行業(yè) > 正文

讓“機器化學家”更好賦能化學研究

2025-02-17 18:13:03來源:科技日報  

來源標題:讓“機器化學家”更好賦能化學研究

當前,人工智能已經(jīng)全面滲透到科學研究的各個領(lǐng)域。以化學學科為例,得益于AI的應(yīng)用,化學反應(yīng)預測與新化學物質(zhì)的發(fā)現(xiàn)、化學試驗的自動化與智能化等均取得了顯著突破。特別是人工智能驅(qū)動的機器人,即“機器化學家”,可以自動閱讀文獻、遠程執(zhí)行實驗方案、借助計算機即時優(yōu)化實驗條件,將科研人員從重復繁雜的勞動中解放出來,大大提升了科研活動效率。然而,筆者在調(diào)研中發(fā)現(xiàn),機器化學家仍然面臨諸多問題與挑戰(zhàn),需要加強統(tǒng)籌部署。

機器化學家未來發(fā)展面臨諸多問題

機器化學家是能夠自主執(zhí)行化學研究的人工智能機器人。與其他復雜的實驗室系統(tǒng)相比,機器化學家具有完整的人工智能軟件、復雜的內(nèi)部循環(huán)(如假設(shè)生成、選擇、評估和完善)以及以高通量執(zhí)行單獨規(guī)劃的循環(huán)實驗?zāi)芰Α?/p>

目前,機器化學家廣泛應(yīng)用于新型分子合成和功能材料創(chuàng)制等方面,幫助科研人員解決了大量科學難題。

但筆者調(diào)研發(fā)現(xiàn),雖然我國機器化學家在智能化學創(chuàng)新領(lǐng)域已經(jīng)居于全球領(lǐng)跑地位,但其在核心算法和算力、高質(zhì)量化學數(shù)據(jù)集方面仍存在不足,未來發(fā)展面臨相關(guān)研究人才缺乏、資源平臺分散等問題。

第一,原創(chuàng)核心算法和算力不足。一是我國在算法領(lǐng)域缺乏以數(shù)學為基礎(chǔ)的原始核心模型、代碼和框架創(chuàng)新,機器化學家與國外同類平臺相比仍有差距。例如,當前英國利物浦大學的研究團隊研發(fā)的機器化學家采用了啟發(fā)式算法,將化學家長期積累的專業(yè)知識巧妙融入到機器化學家的決策流程中,在處理化學實驗問題時具有獨特優(yōu)勢。二是我國在算力領(lǐng)域仍面臨一些“卡脖子”問題。中國科技大學等單位自主研發(fā)的ChemGPT是一種化學領(lǐng)域的聊天機器人程序,可以基于論文知識來建議實驗方案等,但因為GPU算力不足,ChemGPT“跑不快”,訓練迭代很慢。

第二,缺乏高質(zhì)量的化學數(shù)據(jù)集。雖然機器化學家已經(jīng)建立了包含8000萬化合物、1000萬化學反應(yīng)等資源的數(shù)據(jù)庫和檢索引擎,但目前依然面臨實驗數(shù)據(jù)缺乏和實驗數(shù)據(jù)標準化不夠等問題。一是目前數(shù)據(jù)大多來源于國外數(shù)據(jù)庫,獲取成本很高。二是數(shù)據(jù)采集過程不統(tǒng)一,不同設(shè)備、環(huán)境、操作人員得到的數(shù)據(jù)有很大差異。實驗生成的不同類型的數(shù)據(jù)包括圖像、結(jié)構(gòu)數(shù)據(jù)等格式不同。三是數(shù)據(jù)質(zhì)量有待提高?;瘜W研究的精準化和智能化依賴實驗數(shù)據(jù)的準確性,但現(xiàn)階段我國高質(zhì)量的科研數(shù)據(jù)較為匱乏,很多科研數(shù)據(jù)都從文獻中收集,而文獻中的數(shù)據(jù)常常是被“美化”過的理想數(shù)據(jù)。

第三,缺乏“人工智能+化學”的復合型人才。機器化學家的發(fā)展需要化學、物理、數(shù)學、計算機、自動化等多學科專業(yè)人才的跨學科合作,但目前大多數(shù)人才都是單學科人才。雖然有些高校和科研機構(gòu)已經(jīng)開始積極探索跨學科的課程設(shè)計和項目合作,但仍處于起步階段。同時,行業(yè)內(nèi)部缺乏有效的內(nèi)部培養(yǎng)和培訓機制。此外,相關(guān)領(lǐng)域的技術(shù)工程師同樣缺乏。

第四,缺乏高度整合且開放的人工智能資源平臺。目前,中國科學技術(shù)大學、北京大學、清華大學、浙江大學、華東師范大學、中國科學院寧波材料技術(shù)與工程研究所等單位多個化學研究團隊都在進行機器化學家的相關(guān)研究與部署,其中不免出現(xiàn)“百模大戰(zhàn)”,數(shù)據(jù)庫、算力平臺等資源分散、重復建設(shè)等情況,缺乏一個共建的開放式人工智能資源平臺,使各團隊實驗數(shù)據(jù)可以交匯、共享,自動提煉出數(shù)字化知識圖譜和人工智能模型,進而指導機器化學家自動優(yōu)化,研制出更好、更高效的化學品。

加強部署搶占未來化學研究制高點

當前,人工智能已經(jīng)成為各國爭奪未來化學研究制高點的抓手。針對目前機器化學家面臨的問題與挑戰(zhàn),建議從數(shù)據(jù)、人才、技術(shù)攻關(guān)等方面加強部署。

第一,加快建設(shè)高質(zhì)量的化學數(shù)據(jù)庫或知識庫。破除數(shù)據(jù)壁壘,整合國內(nèi)目前已有的相關(guān)數(shù)據(jù)庫和分散存在的小型數(shù)據(jù)庫,對數(shù)據(jù)格式、標準、工具及代碼等進行統(tǒng)一規(guī)劃設(shè)計,進一步提升相關(guān)數(shù)據(jù)庫的數(shù)據(jù)質(zhì)量。加強人工智能模型訓練的化學數(shù)據(jù)庫建設(shè),使用新的人工智能模型生成高質(zhì)量數(shù)據(jù)。發(fā)展具有可遷移性的機器學習算法,實現(xiàn)數(shù)據(jù)的高效、高精度提取,為數(shù)據(jù)驅(qū)動的智能化學提供基礎(chǔ)。將化學數(shù)據(jù)庫和知識庫作為重要研究成果,納入科研人員考評、項目驗收機制。

第二,盡快重構(gòu)化學研究人才體系。人工智能驅(qū)動的化學研究既需要科研人員具備扎實的基礎(chǔ)和開放的心態(tài),還需要多領(lǐng)域人才協(xié)作。應(yīng)在高校本科化學系設(shè)置編程、人工智能和自動化課程,鼓勵學生進行STEM與社會科學課程的交叉學習,為研究生與博士后提供項目實踐機會。同時,企業(yè)也要承擔培訓責任,通過定制化培訓計劃,為有潛質(zhì)的人才搭建跨領(lǐng)域成長橋梁。加快建立跨學科跨領(lǐng)域合作機制,鼓勵人工智能研究人員與基礎(chǔ)科學領(lǐng)域研究人員、工程師通力合作。

第三,形成多地聯(lián)動、多機構(gòu)聯(lián)合的工作機制,推動國內(nèi)機器化學家研究團隊進行深度合作和共同推廣。加強技術(shù)、工程與科學的有機結(jié)合,以機器為載體、以數(shù)據(jù)為要素,加速擴大機器化學家智能平臺的規(guī)模,發(fā)展可自主解決科學難題的強化學智能,形成針對化學智能的符號語言與數(shù)據(jù)智能驅(qū)動的科學方法論。

總之,政府部門應(yīng)針對國際競爭重點領(lǐng)域,加強頂層設(shè)計,集中產(chǎn)學研多方資源,發(fā)揮機器化學家的賦能作用。由產(chǎn)業(yè)部門提供化學應(yīng)用領(lǐng)域的大量數(shù)據(jù)和應(yīng)用場景,高校和科研機構(gòu)提出相應(yīng)科學問題,并提供智力資源,產(chǎn)學研各方共同助力化學重點領(lǐng)域的技術(shù)研發(fā)與應(yīng)用。

標簽:

相關(guān)閱讀

精彩推薦

相關(guān)詞

推薦閱讀