本文亮點:針對文獻調(diào)研、實驗設計、合成制備、表征測試、分析優(yōu)化這五個電池研發(fā)的關鍵環(huán)節(jié),論證當下各研發(fā)環(huán)節(jié)的挑戰(zhàn)以及AI for Science帶來的全新機會。通過AI for Science 形成電池平臺化智能研發(fā),實現(xiàn)“軟硬一體、干濕閉環(huán)”新的研發(fā)范式,打造電池全生命周期的智慧大裝置和超級實驗室,全面賦能電池工業(yè)產(chǎn)業(yè)升級。
摘 要 在AI for Science時代,電池設計自動化智能研發(fā)(battery design automation,BDA)平臺通過整合先進的人工智能技術,為電池研發(fā)領域帶來了革命性進展。BDA平臺覆蓋了文獻調(diào)研、實驗設計、合成制備、表征測試和分析優(yōu)化這五個電池研發(fā)的關鍵環(huán)節(jié),利用機器學習、多尺度建模、預訓練模型等先進算法,結(jié)合軟件工程開發(fā)用戶交互友好的工具,加速從理論設計到實驗驗證的整個電池研發(fā)周期。通過自動化的實驗設計、合成制備、表征測試和性能優(yōu)化,BDA平臺不僅提升了研發(fā)效率,還提高了電池設計的精確度和可靠性,推動了電池技術向更高能量密度、更長循環(huán)壽命和更低成本的方向發(fā)展。
關鍵詞 AI for Science;電池;智能研發(fā);機器學習;BDA;多尺度
過去十年中,新能源行業(yè)實現(xiàn)了顯著發(fā)展,尤其是以鋰離子電池為代表的電化學儲能技術,在消費電子、儲能以及電車等領域得到廣泛應用。中國也憑借著市場需求、原料成本控制等方面的優(yōu)勢,迅速崛起成為全球最大、最先進的電池生產(chǎn)制造基地。
然而,近兩年來,電池行業(yè)經(jīng)歷了一些變化:一方面,競爭加劇和低端產(chǎn)能過剩導致了原材料、工藝和品質(zhì)的同質(zhì)化;另一方面,行業(yè)終端場景的多元化帶來了新的挑戰(zhàn),如動力電池領域?qū)斐浜透呃m(xù)航里程的需求,儲能領域?qū)ΩL循環(huán)壽命的要求等。
產(chǎn)品競爭和場景多元化推動了電池材料、化學體系、結(jié)構(gòu)設計、合成制備工藝的創(chuàng)新。然而,當前電池研發(fā)仍主要依賴于傳統(tǒng)實驗設計方法,即通過大量實驗優(yōu)化配方和工藝參數(shù),這導致了研發(fā)周期的延長和成本的增加。計算模擬方法盡管已被應用于電池研發(fā),但在處理大規(guī)模體系和精確預測電池性能方面仍存在“算不大,算不準”的局限性。
傳統(tǒng)研究方法的局限性已成為電池研發(fā)創(chuàng)新的主要障礙。然而,AI for Science(AI4S)范式的發(fā)展為克服這些挑戰(zhàn)提供了新的途徑。AI4S利用前沿的人工智能技術,深入進行數(shù)據(jù)挖掘、模式識別和預測建模,從而實現(xiàn)電池設計的理性化。基于AI4S范式的平臺化研發(fā),不僅加速了新材料的發(fā)現(xiàn)和電池設計迭代,還提高了計算模擬的準確性和效率,逐漸成為推動電池研發(fā)創(chuàng)新的重要趨勢。
AI4S范式的平臺化智能研發(fā)遵循“四梁N柱”的設計理念?!八牧骸贝順?gòu)成AI4S科研基礎設施的核心要素,包括基于基本原理與數(shù)據(jù)驅(qū)動的算法模型和軟件系統(tǒng),高效率且高精度的實驗表征系統(tǒng),作為文獻替代的數(shù)據(jù)庫與知識庫,以及高度整合的計算平臺,這些要素構(gòu)成了科研活動的基礎架構(gòu)。在此基礎上,針對不同領域的需求構(gòu)建工業(yè)應用軟件,即“N柱”,支撐平臺的多樣化應用。如圖1所示。
“四梁N柱”設計理念最早應用于半導體領域,摩爾定律推動了該領域算法模型、實驗測試手段和計算算力的快速發(fā)展,最終形成了面向行業(yè)的電子設計自動化(electronic design automation,EDA)工業(yè)軟件。類似地,在電池研發(fā)領域,隨著精細化分工、AI多尺度物理建模和預訓練模型等新方法的引入,行業(yè)的生產(chǎn)方式和工具逐步向智能化演進。電池設計自動化智能研發(fā)(BDA)平臺通過結(jié)合數(shù)據(jù)驅(qū)動和原理驅(qū)動兩大算法體系,并依托多尺度模擬、預訓練模型算法的突破以及軟件工程化的實踐,顯著加速并精確化了電池設計和研發(fā)過程,從而持續(xù)提升電池研發(fā)的創(chuàng)新效能。
本文將介紹BDA電池平臺化智能研發(fā)涵蓋電池研發(fā)階段從文獻調(diào)研到實驗設計、合成制備、表征測試,再到分析優(yōu)化的全流程。從當前各個研發(fā)階段的瓶頸出發(fā),舉例說明AI技術方法以及當下發(fā)展的平臺化產(chǎn)品工具如何突破瓶頸并提高研發(fā)效率,加速從實驗室研發(fā)到實際生產(chǎn)的落地。
1 AI4S時代下的BDA平臺加速各環(huán)節(jié)電池研發(fā)
1.1 電池研發(fā)的五個關鍵階段
電池研發(fā)是一項復雜且系統(tǒng)化的工程,通常劃分為五個關鍵階段:文獻調(diào)研(read)、實驗設計(design)、合成制備(make)、表征測試(test)、分析優(yōu)化(analysis),這些階段共同構(gòu)成了電池研發(fā)的完整流程(圖2)。
(1)文獻調(diào)研是研發(fā)工作的基礎,涵蓋廣泛的學術論文、專利、技術和行業(yè)分析報告的閱讀,旨在掌握電池研發(fā)技術的最新進展和創(chuàng)新趨勢。通過這一過程,研發(fā)人員能夠確定研究課題的切入點,為后續(xù)的實驗設計、合成制備、表征測試和分析優(yōu)化環(huán)節(jié)奠定理論基礎。
(2)實驗設計階段,研發(fā)人員基于文獻調(diào)研結(jié)果,結(jié)合研究目標及實驗可行性、成本效益和安全性,規(guī)劃實驗方案,包括電極材料、電解液配方和電池結(jié)構(gòu)設計參數(shù)的選擇,確定實驗的技術路線。
(3)合成制備階段將設計轉(zhuǎn)化為實際的電池材料和電池組裝,包括批量合成制備的操作和控制。在此階段,精確控制反應條件(如溫度、壓力、時間等)對于確保材料性能和電池質(zhì)量至關重要,保障了材料的一致性和可重復性。
(4)表征測試階段對制備的電池進行詳細的結(jié)構(gòu)表征和性能測試,以了解材料在微尺度下的形態(tài)、結(jié)構(gòu)以及電池的電化學性能和熱穩(wěn)定。這些測試結(jié)果為電池性能的進一步優(yōu)化提供了重要指導。
(5)分析優(yōu)化是電池研發(fā)的最后階段。研發(fā)人員通過深入分析測試數(shù)據(jù),識別電池性能瓶頸,并探索優(yōu)化方向,以提高電池的能量密度、循環(huán)穩(wěn)定性、安全性和成本效益,滿足研發(fā)目標和終端場景的應用需求。
1.2 BDA平臺助力電池研發(fā)“設計理性化”“開發(fā)平臺化”“制造智能化”
在AI4S新興科研范式的驅(qū)動下,電池研發(fā)領域?qū)崿F(xiàn)了顯著的能力提升。這包括深入探究基本物理原理,高效生成和處理實驗儀器中的復雜數(shù)據(jù),深入理解并有效利用文獻和專利等知識型文本,以及快速發(fā)展新型計算軟硬件設施。BDA平臺作為AI4S范式指導下電池領域的平臺化智能研發(fā)實例,利用人工智能等前沿技術,致力于解決電池研發(fā)過程中的關鍵問題。平臺集成了領域內(nèi)先進的算法模型,從微觀層面的材料性質(zhì)出發(fā),預測介觀層面材料顆粒的物理化學性質(zhì),并模擬宏觀層面的電極與電芯性能。通過對加工工藝進行建模,模擬工藝對電池性能的影響,顯著縮短了從創(chuàng)新到量產(chǎn)的時間[14]。通過將行業(yè)知識、先進算法和軟件工程等多方面能力充分結(jié)合,平臺化研發(fā)不僅推動了電池領域“設計理性化”“開發(fā)平臺化”和“制造智能化”,而且有效支持電池技術的快速發(fā)展和產(chǎn)業(yè)升級。
下面將具體介紹AI4S時代下BDA平臺如何在算法以及產(chǎn)品工具等方面,為電池研發(fā)的五個關鍵階段提供支持。
2 AI4S時代下的電池知識“大腦”構(gòu)建
2.1 電池文獻信息量巨大,高效收集和獲取信息是瓶頸
在電池研發(fā)中,科學文獻的閱讀和分析是一個重要卻又非常耗時的環(huán)節(jié)。研發(fā)人員需要投入大量時間來梳理和分析文獻資料,獲取研究所需的數(shù)據(jù)和信息。例如,在電解液配方研究中,需要搜集并分析文獻中提及的有效配方和添加劑的物理化學性質(zhì)。文獻調(diào)研環(huán)節(jié)至關重要,然而在實際研發(fā)中卻占用了研究者相當一部分的工作時間。據(jù)估計,電池研發(fā)人員大約會將23%的工作時間和精力投入到文獻調(diào)研中。
電池領域已發(fā)表的文獻和專利數(shù)量龐大。根據(jù)谷歌學術、Web of Science以及其他主流公開文獻專利數(shù)據(jù)庫的統(tǒng)計,全球范圍內(nèi)已發(fā)表的與電池相關的科學文獻已經(jīng)超過400萬篇,專利數(shù)量也已突破30萬件。從日發(fā)表量來看,全球每日新增的電池領域科學文獻和專利成果超過100篇。面對如此龐大的信息量,研發(fā)人員在篩選出高質(zhì)量且具有研究價值的資料時,不可避免地需要投入大量的時間和精力。可見,實現(xiàn)高效的文獻追蹤和調(diào)研,是當下電池研發(fā)領域面臨的一項重要挑戰(zhàn)。
傳統(tǒng)的科學文獻數(shù)據(jù)庫,如SciFinder 和Reaxys ,雖然提供了信息檢索的入口,但它們主要限于基礎的檢索功能,缺乏深入的信息提取和知識理解能力。研發(fā)人員使用這些數(shù)據(jù)庫進行檢索后,仍需進一步分析以獲得實質(zhì)性的信息和數(shù)據(jù)。近年來,大語言模型如ChatGPT的出現(xiàn),開始改變傳統(tǒng)的文本信息提取方式,能夠直接從文本中提取內(nèi)容獲得答案。然而,科學文獻中的多模態(tài)內(nèi)容,如表格、圖表、分子結(jié)構(gòu)、化學反應等,即便是這些先進的大語言模型,也面臨著理解上的挑戰(zhàn)。
2.2 多模態(tài)模型發(fā)展助力科學文獻解析
多模態(tài)模型的發(fā)展為科學文獻解析帶來了革命性的突破。AI技術的應用不僅提高了處理分析海量數(shù)據(jù)的效率,還實現(xiàn)了對科學文獻中關鍵信息的自動化識別和提取,顯著加快了科學調(diào)研的進程。在這一領域中,國內(nèi)深勢科技自主研發(fā)的多模態(tài)科學文獻模型——Universal Science Multimodal Analysis and Research Transformer(簡稱Uni-SMART)給出了可行性思路和示范。
Uni-SMART模型在信息提取、復雜元素識別、科學文獻理解和分析以及多模態(tài)元素的理解和推理這些任務上展示出有效的表現(xiàn),這是因為模型使用了廣泛的科學文獻數(shù)據(jù)源,包括專利、科學出版物、新聞文章、市場報告等,并采用了主動學習的方法來不斷增強模型的能力。模型主動學習過程可以分為五個階段:多模態(tài)學習、大模型有監(jiān)督微調(diào)、用戶反饋、專家標注、數(shù)據(jù)增強。在多模態(tài)學習階段,Uni-SMART模型通過少量科學文獻數(shù)據(jù)訓練以識別信息,并進行序列化輸出。隨后,大模型有監(jiān)督微調(diào)利用序列化輸出增強理解多模態(tài)信息的能力。在用戶反饋階段,正反饋樣本直接用于數(shù)據(jù)增強,而負反饋樣本經(jīng)專家細致標注后,分析錯誤類型并優(yōu)化模型。最后,數(shù)據(jù)增強環(huán)節(jié)將專家標注和正反饋樣本納入訓練集,不斷迭代優(yōu)化Uni-SMART模型性能(圖3)。
模型開發(fā)者借助SciAssess科學文獻理解評估方法對Uni-SMART和其他主流的通用大語言模型進行橫向?qū)Ρ?表1),可以發(fā)現(xiàn)Uni-SMART在電池研發(fā)人員關注的表格、圖表、分子結(jié)構(gòu)、反應式等任務中,都表現(xiàn)出了優(yōu)于其他模型的效果。
表1 Uni-SMART模型在電池場景中不同任務下的預測效果
Uni-SMART模型的相關研究論文目前已被Hugging Face官方的Daily Papers收錄,并獲得機器學習領域?qū)<褹hsen Khaliq的推薦。業(yè)界的認可證明了Uni-SMART這一類多模態(tài)模型在科學文獻解析領域的創(chuàng)新性和實用性,也證實了結(jié)合科學文獻多模態(tài)元素和大語言模型的能力,在處理如涉及性質(zhì)、分子結(jié)構(gòu)和反應信息等復雜科學問題上有顯著的突破和效果。
在實際研發(fā)中,除了注重文獻信息解析和提取的準確性之外,同時處理多篇文獻的能力也同樣重要。多模態(tài)模型的開發(fā)者們在評估模型預測準確性的同時,也對其批量處理文獻的能力進行了測試。例如,Dagdelen等在研究中利用自主研發(fā)的多模態(tài)模型對30篇固態(tài)摻雜相關文獻中宿主材料和摻雜劑關系進行識別,結(jié)果準確度達到80%以上,對65篇材料文獻進行公式、應用、結(jié)構(gòu)等信息的提取,準確度同樣也達到了80%。批量的文獻處理能力和高精度預測能力結(jié)合,讓多模態(tài)科學文獻模型的適用性和效率向著實際研發(fā)應用更進一步。
2.3 電池研發(fā)文獻解析工具,助力快速洞察行業(yè)動態(tài),提升研發(fā)效率
算法快速突破的同時,基于文獻解析算法的文獻分析工具也在不斷發(fā)展,如ChatPDF、Claude、GPT-4、Uni-Finder等。這些工具不僅具備傳統(tǒng)專業(yè)文獻數(shù)據(jù)庫的多模態(tài)檢索功能,還能通過自然語言交互實現(xiàn)信息提取的自動化。例如,構(gòu)建電池文獻知識庫,實時獲取最新文獻進展,從知識庫中匯總并提取電極材料、電解液配方、電芯的性質(zhì)以及制備工藝參數(shù)數(shù)據(jù),輸出文獻調(diào)研報告,從而實現(xiàn)電池研發(fā)效率的提升。
Uni-Finder是國內(nèi)開發(fā)的一款文獻解析工具,它以科學多模態(tài)大模型Uni-SMART為算法底座,旨在對科學文獻進行全面和精確的分析。該工具針對電池科學文獻調(diào)研場景提供解決方案,包括但不限于分子/材料結(jié)構(gòu)圖識別、多模態(tài)信息的綜合理解、反應式提取、電池配方或設計參數(shù)的識別、性質(zhì)數(shù)據(jù)和統(tǒng)計分析圖識別等。
AI4S文獻解析工具依托多模態(tài)模型卓越的解析能力和平臺用戶友好的交互設計,創(chuàng)新性突破傳統(tǒng)文獻調(diào)研方式,讓文獻調(diào)研變得更加高效,從而釋放了電池研發(fā)人員在文獻調(diào)研階段的生產(chǎn)力,快速構(gòu)建起電池知識的綜合體系,有效促進了電池科學的深入研究與發(fā)展。
3 AI4S時代下的電池設計
電池設計需求跟市場需求目標緊密相連,不同應用場景對電池性能的要求存在差異。例如,在電動汽車領域,車企和消費者希望電池具有高能量密度和快速充電能力;而在移動設備領域,則更傾向于采用小型化、輕薄化且具有長壽命的電池。這種多樣化的需求則要求每種電池在材料選擇、設計優(yōu)化和制造工藝上都具有特定性,這增加了電池研發(fā)的復雜性,并延長了產(chǎn)品從實驗室到市場的轉(zhuǎn)化周期。
當前電池設計研發(fā)面臨諸多挑戰(zhàn),包括研發(fā)周期延長、成本增加以及創(chuàng)新難度加大。傳統(tǒng)電池研發(fā)方法依賴于實驗試錯,從新材料開發(fā)、化學體系整合、電芯樣品設計制造測試到大規(guī)模量產(chǎn)整個過程,傳統(tǒng)方法不僅需要數(shù)十年的研發(fā)耗時,還需要巨額的資金投入。盡管“傳統(tǒng)計算模擬”方法在電池研發(fā)中起到了輔助作用,但其在計算效率和精度之間的平衡仍是技術瓶頸,限制了模擬電池工作真實場景和反映電池工作真實問題的能力。因此,電池設計研發(fā)需要新的技術方法,以解決研發(fā)周期長、成本高和創(chuàng)新難度大等問題,同時提高計算模擬的效率和精度,促進電池技術的發(fā)展和應用。
3.1 AI4S驅(qū)動的多尺度算法和預訓練模型為電池設計研發(fā)帶來新的突破
AI4S的快速發(fā)展為解決電池設計研發(fā)中的關鍵問題提供了新的機遇和解決方案。AI技術在電池設計研發(fā)中的創(chuàng)新主要體現(xiàn)在兩個方面:多尺度模擬算法及預訓練模型。多尺度模擬算法能夠模擬電池材料的微觀結(jié)構(gòu)和宏觀性能,而預訓練大模型通過學習大量的電池材料數(shù)據(jù)來預測新材料的性能。
目前領域內(nèi)已經(jīng)發(fā)展出多種開源的多尺度模擬算法,其中Deep Potential系列方法因其廣泛應用和快速發(fā)展而備受關注。這一系列方法包括原子尺度的DeePKS方法、分子動力學尺度的DeePMD方法,以及粗?;肿觿恿W尺度的DeePCG方法[圖4(a)]。這些多尺度模擬算法在保持較高計算精度的同時,減少了計算資源的限制,更高效地模擬電池的實際表現(xiàn)。
DeePKS方法利用第一性原理獲得量子力學精度的電池材料晶格參數(shù)、結(jié)構(gòu)、電子性質(zhì)等信息;DeePMD方法在保持量子力學精度的同時,通過模擬數(shù)億原子級別的分子動力學,理解電池充放電過程中的離子遷移、電子輸運以及材料相變等現(xiàn)象;DeePCG方法在粗粒化分子動力學尺度上也發(fā)揮著類似的作用,為電池材料的設計提供更精確的理論指導。
Deep Potential系列方法在電池領域已經(jīng)積累了非常多的應用案例[圖4(b)~(d)],如通過構(gòu)建經(jīng)典LiCoO2正極材料的DP勢函數(shù),結(jié)合DeePMD模擬和增強采樣技術,研究了高度去鋰的LixCoO2正極材料中過渡金屬遷移和氧二聚體形成的動力學關聯(lián),從而揭示摻雜離子對上述過程的影響;利用DeePMD探索鋰離子在無定形的固態(tài)電解質(zhì)膜(SEI)各組分(LiF、Li2CO3以及二者1∶1混合)中的擴散機理,解決了傳統(tǒng)第一性分子動力學模擬受限于空間與時間尺度的限制而無法精確捕捉室溫下鋰離子的局域環(huán)境及擴散機理的難題,對實驗上SEI膜的設計提出理性指導;通過訓練覆蓋整個成分空間的高精度Li-Si勢函數(shù)模型,利用勢函數(shù)模型進行DeePMD和GCMC模擬,復現(xiàn)了Si基負極的鋰化/脫鋰過程諸多實驗現(xiàn)象,如晶體與非晶體之間的電壓平臺差、c-Li15-δSi4到a-Li15-δSi4的相變引起的電壓滯后等,揭示了鋰化和脫鋰反應路徑的差異及原子尺度機理,為硅負極的電化學性能和相變反應提供了重要的見解;利用DeePMD模擬鋰金屬與β-Li3PS4之間SEI的形成和生長過程,并對SEI的結(jié)構(gòu)、組分和形貌進行了詳細分析,為全固態(tài)電池中SEI復雜的生長過程提供了新的視角;加州大學伯克利分校的Gupta等使用DeePMD方法為Ga-F-Li-Cl體系訓練了基于深度學習的原子間勢模型,基于該模型揭示了離子固體混合物形成軟黏土的微觀特征,突破性發(fā)現(xiàn)能夠在陰離子交換上形成分子固體單元的鹽混合物以及此類反應的緩慢動力學是軟黏土形成的關鍵,為制作軟黏土固態(tài)電解質(zhì)提供指導;采用深度勢能分子動力學和基于第一性原理分子動力學的自由能計算方法研究SEI形成的熱力學,系統(tǒng)研究了濃度對電解液電化學性質(zhì)的影響。這些公開發(fā)表的應用案例充分驗證了DeePMD這類多尺度模擬方法在理解電池的微觀結(jié)構(gòu)特征和作用機理上的巨大效果和潛力。
在AI4S時代,電池研發(fā)依賴于原理驅(qū)動和數(shù)據(jù)驅(qū)動兩大引擎。多尺度模擬算法主要在原理驅(qū)動上發(fā)揮作用,而數(shù)據(jù)驅(qū)動則體現(xiàn)在預訓練模型的應用上。預訓練模型基于先進的機器學習技術,通過學習大量的數(shù)據(jù)掌握電池材料以及電芯的屬性加速電池研發(fā)和性能優(yōu)化。目前已經(jīng)發(fā)表的電池預訓練模型中,DPA深度勢能分子模擬原子間勢函數(shù)預訓練模型、Uni-Mol三維分子預訓練模型、Uni-ELF電解液配方預訓練模型和數(shù)據(jù)驅(qū)動的電芯健康狀態(tài)預測預訓練模型較受關注。
(1)DPA深度勢能原子間勢函數(shù)預訓練模型
DPA模型旨在通過少量的數(shù)據(jù)訓練出能夠精確模擬材料行為的機器學習模型。模型利用深度學習技術,從原子尺度預測材料的力學、熱力學和動力學性質(zhì)。其關鍵在于捕捉材料的復雜勢能面,為分子動力學模擬中提供準確的預測。這使得研發(fā)人員能夠基于DPA模型廣泛探索材料性能,快速識別出具有潛在應用價值的新材料。Deep Modeling開源社區(qū)的開發(fā)者們在DPA模型的基礎上進一步開發(fā)了固態(tài)電解質(zhì)預訓練模型,覆蓋了共41種材料體系,包括1種Li單質(zhì)、14種基礎二元化合物和26種硫族化合物。該模型在固態(tài)電池的電導率和遷移能壘的預測中展現(xiàn)出比M3GNET、CHGNET通用力場模型更接近實驗的結(jié)果[圖5(d)、(e)],體現(xiàn)了更高的精度優(yōu)勢。
(2)Uni-Mol三維分子預訓練模型
Uni-Mol是通用的三維分子表示學習框架,基于分子構(gòu)象信息,實現(xiàn)模型下游任務中電解液有機分子的性質(zhì)預測。模型使用了2.09億個分子三維構(gòu)象進行預訓練。利用電解液分子數(shù)據(jù)對預訓練模型進行微調(diào),實現(xiàn)熔點、沸點、介電常數(shù)、密度、折射率等更多物理化學性質(zhì)的預測。模型能夠在數(shù)分鐘內(nèi)完成數(shù)百個分子的預測,預測的沸點和介電常數(shù)結(jié)果和驗證集數(shù)據(jù)相比,R2超過94%[圖5(f)~(h)]。
(3)Uni-ELF電解液配方預訓練模型
Uni-ELF是通用電解質(zhì)配方設計框架。Uni-ELF通過兩階段預訓練來實現(xiàn)電解質(zhì)的多級表示學習:在分子層面,利用Uni-Mol模型重建三維分子結(jié)構(gòu);在混合物層面,從分子動力學模擬中預測統(tǒng)計結(jié)構(gòu)性質(zhì)(例如徑向分布函數(shù))。這種全面的預訓練使Uni-ELF能夠捕捉復雜的分子和混合物級別的信息,從而顯著提升其預測能力。通過分子與配方階段的預訓練,Uni-ELF在預測熔點、沸點、可合成性的分子性質(zhì)和電導率、庫侖效率配方性質(zhì)結(jié)果中測試集和驗證集結(jié)果相比R2超過84%,效果上優(yōu)于現(xiàn)有的配方預測方法[圖5(i)~(k)]。
(4)數(shù)據(jù)驅(qū)動的電芯健康狀態(tài)預測預訓練模型
基于彈性網(wǎng)正則化技術或深度遷移學習技術,模型利用大量電化學仿真數(shù)據(jù)進行預訓練,并通過不同的預訓練任務學習電池在循環(huán)內(nèi)、循環(huán)間、電池間的信息。電池研發(fā)人員只需使用少量實驗數(shù)據(jù)對下游電芯預測任務進行微調(diào),使得模型可以獲得相應的電信號預測能力。
3.2 AI4S依托工程實踐,加速研發(fā)智能化,率先進行落地探索
掌握先進的算法技術是電池研發(fā)成功的關鍵。盡管多尺度模擬算法和預訓練模型在理論上展現(xiàn)了較強的計算和預測能力,但要將其有效應用于實際電池研發(fā),仍需依賴具有深厚專業(yè)知識和豐富時間經(jīng)驗的研發(fā)人員。目前行業(yè)內(nèi)這類專業(yè)人才相對匱乏,且他們的時間和資源受限,這在一定程度上限制了先進算法在電池研發(fā)中的廣泛應用。
為了讓更多的研發(fā)人員能夠利用這些先進算法,結(jié)合算法進行軟件工程開發(fā)和產(chǎn)品化變得越來越重要?;陬I域先進算法以及行業(yè)專家豐富經(jīng)驗開發(fā)的應用工具,能夠深入?yún)⑴c到電池設計研發(fā),推動產(chǎn)業(yè)上下游更高效地協(xié)作,進一步改變電池研發(fā)、制造、運營的整體格局,讓電池研發(fā)真正實現(xiàn)“全鏈條”全局優(yōu)化。
隨著算法的快速發(fā)展,各類型算法工程化開發(fā)工具也應運而生,包括Notebook、Workflow以及App。這些便攜的軟件產(chǎn)品工具在電池設計平臺化智能研發(fā)中發(fā)揮著重要的作用。例如Bohrium Notebook、Jupyter Notebook等Notebook記錄工具,允許研發(fā)人員以交互方式編寫和執(zhí)行代碼,同時能更方便地記錄、分享和交流研究過程。這些功能不僅促進知識的沉淀和標準化工作流的形成,而且對新入行的電池研發(fā)人員來說,是幫助快速掌握電池設計的關鍵技術和方法的寶貴資源。
Workflow中比較典型的代表有國內(nèi)自主開發(fā)的Dflow以及國外的AiiDAlab等工作流框架。這些工作流框架專為科學研究設計,將復雜的計算任務部署在云端,使研發(fā)人員能夠輕松進行大規(guī)模的模擬和數(shù)據(jù)分析。工作流憑借云原生特性能夠靈活地擴展資源,適應不同的計算需求,為電池設計提供了更高效的計算支持。
App類如Bohrium App、Hugging Face App等,使研發(fā)人員能夠快速部署和運行所需的算法,無需從零開始編寫復雜的代碼,同時還支持對外部用戶展示自定義的交互方式,降低用戶使用門檻。這種快速實現(xiàn)的能力讓研發(fā)人員能夠集中精力解決電池設計核心問題。此外,App還支持算法的快速迭代和優(yōu)化。隨著電池研發(fā)的不斷深入,研發(fā)人員可能需要對算法進行調(diào)整以適應新的研究需求,而App的模塊化設計使得算法的更新和優(yōu)化變得更加容易和快速,從而確保了電池研發(fā)的持續(xù)進步。
這些算法軟件產(chǎn)品的組合形成了一個強大的AI4S電池設計智能化研發(fā)平臺。平臺不僅提供了多尺度建模計算、預訓練AI模型微調(diào)及下游任務預測、數(shù)據(jù)分析等核心算法和功能,還通過集成不同的應用程序和服務,實現(xiàn)電池研發(fā)的平臺化,推動電池研發(fā)向著自動化和智能化發(fā)展。
目前這一系列創(chuàng)新的軟件產(chǎn)品已經(jīng)在電池研發(fā)領域中進行探索并形成應用案例。例如深勢科技自主開發(fā)的電池設計智能化研發(fā)平臺Piloteye,其電解液設計模塊目標輔助進行電解液的高通量虛擬篩選。該模塊通過集成Uni-Mol電解液分子基礎物性預測模型、Uni-ELF電解液配方設計模型以及多尺度計算模擬工具,能夠快速輔助電池研發(fā)人員在龐大的電解液分子化學空間中預測電導率、擴散系數(shù)等關鍵性質(zhì),并快速篩選符合目標要求的電解液配方[圖6(a)]。在電芯研發(fā)的場景,Piloteye平臺提供了電化學模型參數(shù)辨識優(yōu)化、電化學仿真、電池循環(huán)老化模式定量分析以及電芯健康狀態(tài)預測等功能[圖6(b)]。平臺內(nèi)置鈷酸鋰三元材料、石墨等主流電池材料體系的偽二維模型,通過參數(shù)優(yōu)化和并行仿真計算進行不同設計參數(shù)以及工況條件下的電池短期性能預測,加快實驗測試效率。循環(huán)老化定量分析功能通過利用老化機制識別模型定量獲取循環(huán)過程中LLI活性鋰損失、LAM活性材料損失和電阻變化曲線,分析不同衰減模式的變化來定量反映電池老化狀態(tài),從而預測電芯長時間循環(huán)后的容量?;诶匣瘷C制識別模型與預測電芯的容量保持率的方法也由Han等驗證,誤差大致在2%以內(nèi),這對比經(jīng)驗擬合式Q(t)=atz預測有了較大的提高。
先進算法模型和用戶友好界面結(jié)合進一步提高了電池研發(fā)的效率。軟件工程化能力不僅使先進算法變得更加容易使用,而且還支持根據(jù)不同的研究需求進行定制和擴展。隨著AI技術的不斷發(fā)展,電池平臺化智能研發(fā)將繼續(xù)進化,為領域帶來更廣闊的應用前景和創(chuàng)新潛力。
4 AI4S時代下的電池材料合成與制備
電池的合成和制備是電池研發(fā)過程中的重要階段,其中涵蓋電極材料的合成制備、電解液的合成制備以及電芯的設計制造。這一階段的核心任務是將理論配方轉(zhuǎn)化為可行的制造工藝,確保電池材料的合成過程高效和穩(wěn)定,保障最終電池產(chǎn)品性能和質(zhì)量。然而,合成反應中通常涉及多個參數(shù),參數(shù)之間還存在復雜的相互作用關系,這使得反應過程的控制和優(yōu)化充滿挑戰(zhàn)。
目前在產(chǎn)品研發(fā)和工藝優(yōu)化方面主要依賴試錯法,研發(fā)人員通過現(xiàn)有經(jīng)驗和認知來調(diào)整反應工藝參數(shù),并進行大量實驗和分析來探索最優(yōu)的工藝條件。這種方法存在局限性:由于材料合成制備工藝反應時間通常較長,且工藝規(guī)律尚未完全探索和理解,研發(fā)人員難以準確預判實驗結(jié)果,從而增加了當前工藝優(yōu)化的成本和復雜性。
為克服這些挑戰(zhàn),需要更先進的理論模型和計算工具,以輔助研發(fā)人員深入理解合成過程中的參數(shù)關系,優(yōu)化工藝條件,減少試錯次數(shù),提高研發(fā)效率。通過隨機森林回歸、梯度提升回歸等算法對合成制備的歷史實驗數(shù)據(jù)構(gòu)建機器學習模型,挖掘材料合成制備中的規(guī)律,拓寬對材料合成的認知邊界。
例如在“正極前體-正極材料-電芯”多尺度模擬場景中,通過利用前期大量小試研發(fā)數(shù)據(jù),包括正極合成原料信息、合成工藝參數(shù)、工藝流程、材料表征數(shù)據(jù)等,構(gòu)建機器學習模型從而實現(xiàn)精度更高的單一關鍵指標預測。進一步地,將中試和量產(chǎn)的數(shù)據(jù)導入模型,建立“小試-中試-量產(chǎn)”的對應關系,實現(xiàn)中試和量產(chǎn)的最優(yōu)工藝模擬。在此基礎上,結(jié)合多尺度模擬方法,該模型還能輸出前體生長的相關機理,揭示前體形貌與正極物性的對應關系(圖7)。
SimpFine是針對電池材料合成與制備場景開發(fā)的數(shù)據(jù)建模與分析AI4S產(chǎn)品工具。當中包含數(shù)據(jù)建模、數(shù)據(jù)預測、采樣優(yōu)化、數(shù)據(jù)分析等通用功能模塊。“數(shù)據(jù)建?!惫δ苤С謶脵C器學習技術對原始數(shù)據(jù)集構(gòu)建預測模型。生成的模型可以用于“模型預測”模塊,以預測工藝參數(shù)的變化對電池材料性能的影響。預測結(jié)果可以輸入到“數(shù)據(jù)分析”模塊,一鍵生成可視化的結(jié)果報告,幫助研發(fā)人員直觀地進行性能分析評估。SimpFine還支持工作流形式的操作,實現(xiàn)特定任務工作流程搭建。SimpFine通過簡單便攜的使用操作,以及統(tǒng)一化、可視化的方式實現(xiàn)數(shù)據(jù)操作,快速提高在實驗操作和投入生產(chǎn)前進行方案設計和篩選的效率,實現(xiàn)科學和工程領域的材料成分調(diào)控和合成制備工藝優(yōu)化。
5 AI4S時代下的電池材料表征與性能測試
在電池領域的實際應用中,表征測試對于理解電池材料的形態(tài)和粒徑分布對于電池的性能至關重要。合成制備完成后,通過表征分析電池材料的微觀結(jié)構(gòu)、化學組成和物理特性,驗證材料是否符合目標要求。性能測試則用于評估電池的實際工作表現(xiàn),包括充放電效率、穩(wěn)定性和安全性等。這些測試結(jié)果對于優(yōu)化電池設計、指導生產(chǎn)工藝調(diào)整以及預測電池壽命至關重要,是電池從實驗室走向商業(yè)應用的必經(jīng)之路。
常見的表征測試方法包括電化學性能測試,如循環(huán)伏安法測試、恒電流間歇滴定測試、交流阻抗譜測試等,用于評估電池的充放電性能、電化學活性、循環(huán)穩(wěn)定性等;結(jié)構(gòu)表征技術,例如X射線衍射、SEM掃描電子顯微鏡、STEM掃描透射電子顯微鏡等原子尺度表征工具,用于觀察材料的晶體結(jié)構(gòu)和微觀形貌;熱分析技術,如差示掃描量熱法和熱重分析,來研究材料的熱穩(wěn)定性;物理性能測試,測量電導率和機械強度等;安全性測試,評估電池在極端條件下的反應。
在傳統(tǒng)的材料表征中,通過表征設備獲得的圖像通常存在噪聲和顆粒重疊等問題,這些問題對顆粒進行準確的識別和表征帶來了挑戰(zhàn)。隨著人工智能的發(fā)展,不少研究發(fā)現(xiàn)通過深度學習算法,如對抗網(wǎng)絡模型、全卷積神經(jīng)網(wǎng)絡、U-Net架構(gòu)等,能夠?qū)﹄婄R圖像中的顆粒進行有效識別。例如SEM Particle Detector表征分析工具通過一系列的表征計算,生成直觀全面的統(tǒng)計報告,幫助研發(fā)人員更好地理解、識別材料表征圖中顆粒的形態(tài)、尺寸、組成和分布等特征(圖8),從而為領域的研究和應用提供有力支持。
6 AI4S時代下的電池研發(fā)結(jié)果分析優(yōu)化
電池研發(fā)中的分析優(yōu)化過程通常是對材料表征和電化學測試數(shù)據(jù)的深入分析,以識別電池性能的限制因素并探索改進途徑。
在電池材料表征和電化學測試中,數(shù)據(jù)量龐大、特征提取復雜以及數(shù)據(jù)維度高的問題普遍存在,這些因素共同構(gòu)成了數(shù)據(jù)分析優(yōu)化的挑戰(zhàn)。傳統(tǒng)的數(shù)據(jù)處理和分析方法因其復雜性而效率受限。針對這一問題,人工智能的“降維”能力提供了新的解決方案。例如,卷積神經(jīng)網(wǎng)絡從測試結(jié)果數(shù)據(jù)中提取特征,評估電池狀態(tài);遺傳算法自動識別電化學測試數(shù)據(jù)的等效電路模型;隨機森林或XGBoost等集成學習方法,通過構(gòu)建并整合多個弱預測模型,增強了對高維數(shù)據(jù)集的處理能力和整體預測性能。
除了針對電池數(shù)據(jù)分析的方法外,一些開源軟件包也為電池測試數(shù)據(jù)的分析處理提供了支持。例如,Cellpy是一個用于處理和分析電池測試數(shù)據(jù)的開源庫,該庫提供了電芯測試數(shù)據(jù)讀取、預處理、分析和可視化等功能。另外一個用于電化學阻抗分析的Python軟件包impedance.py,也已經(jīng)實現(xiàn)了EIS數(shù)據(jù)的擬合、模擬和可視化等功能。
AI4S先進算法以及產(chǎn)品工具的開發(fā)和應用不僅極大提高了數(shù)據(jù)分析的效率,而且降低研發(fā)人員的使用門檻,快速通過從復雜的數(shù)據(jù)中提取出關鍵特征,增強了研發(fā)人員快速識別有潛力電池設計參數(shù)的能力(圖9)。AI技術的這些優(yōu)勢不僅優(yōu)化了電池材料的性能,還為電池性能的提升提供了新的視角和工具,有助于推動電池技術的創(chuàng)新和發(fā)展。
7 展 望
在AI for Science范式的推動下,電池研發(fā)已經(jīng)邁入了一個平臺化智能研發(fā)的新時代。通過構(gòu)建電池設計智能化BDA平臺,實現(xiàn)對文獻、專利、計算模擬、表征、測試、工藝和生產(chǎn)數(shù)據(jù)的自動采集,同時調(diào)用多模態(tài)電池預訓練大模型,高精度預測電池壽命并建立構(gòu)效關系。BDA平臺致力于發(fā)展面向文獻、材料設計、表征測試、工藝優(yōu)化和分析優(yōu)化的五大智能平臺,通過采用“軟硬件一體化、實驗與計算模擬結(jié)合”的研發(fā)范式,構(gòu)建一個從理論研究到實驗室測試,再到工業(yè)應用的完整研發(fā)生產(chǎn)閉環(huán),為電池行業(yè)提供全面的技術支持與創(chuàng)新解決方案(圖10)。
AI技術的應用在電池研發(fā)領域發(fā)揮著日益重要的作用,特別是在機器學習預訓練模型和多尺度建模算法方面。這些技術為電池研發(fā)提供了強大的數(shù)據(jù)分析和預測能力,使得研發(fā)人員能夠快速處理和分析大量的電池數(shù)據(jù),加速了電池材料的發(fā)現(xiàn)和電池設計的迭代優(yōu)化。通過深度整合AI與電池仿真、實驗設計、合成制備、表征測試以及數(shù)據(jù)分析技術,形成了一個電池全生命周期的智慧大裝置和超級實驗室,實現(xiàn)了從材料選擇、制備過程到最終應用的每一個環(huán)節(jié)的智能化研發(fā)設計和優(yōu)化分析,為電池研發(fā)提供全面的平臺化技術支持。
盡管AI技術的融合為電池工業(yè)研發(fā)帶來了革命性變革,并加速了新能源技術的創(chuàng)新和發(fā)展,但在電池研發(fā)領域持續(xù)深耕的過程中,仍面臨著一些挑戰(zhàn),例如,深入理解電池中界面形成以及構(gòu)效關系等關鍵問題,生產(chǎn)和收集高質(zhì)量電池表征和測試數(shù)據(jù),更高效的多尺度建模算法和機器學習模型,更便攜、更貼合電池研發(fā)場景的算法工程化工具等。解決這些挑戰(zhàn),需要跨學科的合作和交叉學科人才的培養(yǎng),以及面向電池研發(fā)場景的先進算法和平臺工具的持續(xù)發(fā)展。
我們有理由相信,隨著AI技術的不斷深入應用,電池研發(fā)將變得更加高效、智能,這為人類社會提供更加清潔、高效的能源解決方案,為可持續(xù)發(fā)展做出重要貢獻。隨著技術的不斷進步和創(chuàng)新,電池研發(fā)的未來充滿了無限可能。
第一作者:謝瑩瑩(1997—),女,學士,主要從事BDA平臺產(chǎn)品研發(fā);
通訊作者:王曉旭,博士,副研究員,主要從事AI及多尺度計算理性研發(fā)設計新型能源材料和器件,包括電池、催化化工、光伏等方向。