1. 孫寬、陸仕榮、肖澤云Sci. Adv.: 機器學習輔助的高性能有機光伏材料分子設計和效率預測
有機光伏(OPV)電池提供一個直接的和經濟的方式來將太陽能轉化為電能。近年來,OPV的研究迅速發展,功率轉換效率(PCE)已超過17%。迄今為止,OPV研究的主流一直集中在建立新的OPV分子結構與其光伏性質之間的關系。該過程通常涉及光伏材料的設計和合成,材料的光電性能表征以及光伏電池的組裝和優化。
這些傳統方法通常需要精細控制化學合成、制造精密裝置、費力的純化和繁瑣的實驗步驟,這導致大量的資源投入以及較長的研究周期。因此,OPV的開發效率低下且緩慢,例如,自1973年首次報告以來,僅在光伏電池中合成并測試了不到2000個OPV供體分子。
重慶大學的孫寬教授、中科院的陸仕榮教授和肖澤云教授共同建立了一個數據庫,其中包含從文獻中收集的1719個經過實驗測試的OPV供體材料。他們首先研究了分子的表達對ML性能的重要性。為了確定最合適的表達式,我們測試了不同類型的表達式,包括圖像、ASCII字符串、兩種類型的描述符和七種類型的分子指紋。根據PCE值,描述符可將材料分為“低”和“高性能”。指紋具有最佳性能(預測PCE類的準確度為81.76%),并且其長度對預測的準確性有顯著影響。
此外,作者使用了多種ML算法進行分類。研究發現,當處理小型數據庫時,RF模型的性能優于其他模型。最后,作者通過合成10種新的OPV供體材料獨立驗證了ML模型。該模型的預測與實驗結果吻合良好。
通過這項工作,作者為OPV研究建立了一種新方法,即通過ML模型預篩選設計的OPV分子,然后僅關注在后續實驗中通過ML虛擬評估的分子。這種方法將大大加快開發用于OPV應用的新型高效有機半導體材料的探索過程。
文獻鏈接:
Machine learning–assisted molecular design and efficiency prediction for high-performance organic photovoltaic materials (Sci. Adv., 2019, DOI: 10.1126/sciadv.aay4275)
2. Nat. Commun.: 從大量沸石材料合成記錄中將合成和結構相聯系
在計算能力的提高、算法開發的進步以及海量數據的可用性的推動下,機器學習的應用已擴展到解決人類層面的問題,包括材料科學領域的問題。應用于機器學習的材料科學中的數據集大量來自理論計算。一旦經過培訓,機器學習就可以應用于成千上萬甚至數百萬候選材料的高通量篩選。這些詳盡的計算機模擬數據挖掘方法能夠從大型的,通過計算生成的數據庫中識別出非凡的材料。
材料的合成也可以從機器學習中受益。例如,從大量實驗數據中構建了一系列監督分類模型,以使用一組綜合描述符來預測綜合結果。這種基于機器學習的實驗數據庫方法能夠從化學空間中提取最重要的合成描述符,這些化學描述符具有高維和大量條目,有時人類很難處理。機器學習的模式識別能力被認為對于通過動力學控制的途徑合成的材料非常有效,而這些途徑很難用簡單的方法論來處理。
這項研究使用機器學習技術分析了從文獻中收集的沸石的合成記錄,以合理化對其性質和結構的理解。從機器學習模型中提取的綜合描述符用于識別具有適當重要性的結構描述符?;诮Y構描述符的晶體結構相似性網絡,顯示了由合成相似材料組成的群落的形成。基于先前被忽略的結構相似性的交叉實驗,揭示了沸石的合成相似性,證實了合成結構之間的關系。該方法適用于使經驗知識合理化、填充合成記錄并發現新穎材料的系統。
文獻鏈接:
Linking synthesis and structure descriptors from a large collection of synthetic records of zeolite materials (Nat. Commun., 2019, DOI: 10.1038/s41467-019-12394-0)
3. npj Computational Materials: 半監控機器學習在材料合成過程中的應用
在過去的30年中,計算材料學的進步已在材料設計方面取得了巨大的成功,其中包括數十種通過計算設計的新穎化合物以及從頭開始預測的特性的按需可用性。但是,材料發現流程仍然受到實驗合成挑戰的限制,在合成新化合物之前,這可能需要數月的反復試驗。
目前,很難設計如何在實驗室中合成預測的材料。當前理解和預測材料合成的方法涉及原位X射線衍射(XRD)研究、從頭算熱力學建模、經典熱力學觀點以及機器學習指導的合成參數搜索。
最近,機器學習方法在有機化學中逆向合成的應用被證明是有效的,激發了類似方法在預測無機材料合成中的應用。這些有機化學合成反應的機器學習研究已經通過有機化學反應數據庫(例如Reaxys)實現,該數據庫包括》 1200萬個單步反應。當前沒有類似的數據庫全面地分類無機材料合成的合成反應。但是,即使是有限的材料合成反應數據庫也可以對合成參數與反應產物之間的關系產生有價值的見解,例如Kim等人所證明的那樣。
在這項工作中,作者演示了一種半監督的機器學習方法,用于根據書面自然語言對無機材料的合成程序進行分類。無需任何人工輸入,潛在的Dirichlet分配就可以將關鍵字聚集到與特定實驗材料合成步驟相對應的主題,例如“研磨”和“加熱”,“溶解”和“離心分離”等。在少量注釋的指導下,隨機分類可以將這些步驟與不同類別的材料合成(例如固態或水熱合成)相關聯。
最后,作者證明了實驗步驟順序的馬爾可夫鏈表示可以準確地重建可能的合成程序流程圖。這種機器學習方法提供了一種可擴展的方法,可以從文獻中解鎖大量的無機材料合成信息,并將其處理為標準化的機器可讀數據庫。
文獻鏈接:
Semi-supervised machine-learning classication of materials synthesis procedures (npj Computational Materials, 2019, DOI: 10.1038/s41524-019-0204-1)
4. npj Computational Materials:機器學習在固態材料科學中的最新進展和應用
機器學習是近年來進入材料科學的最令人興奮的研究方法之一。這種統計方法的收集已經證明能夠大大加快基礎研究和應用研究的速度。目前,科研工作者已經見證了將機器學習廣泛應用于材料研究的實例。
在這篇文章中,作者提供了有關機器學習在材料研究中的最新研究的全面概述和分析。首先,作者介紹材料科學中的機器學習原理、算法、描述符和數據庫。隨后,作者繼續介紹了不同的機器學習方法,以發現穩定的材料并預測其晶體結構。然后,作者討論了眾多定量結構與屬性之間的關系,以及通過機器學習替代第一原理計算的各種方法。
這篇綜述回顧了如何應用主動學習和基于算法的優化來改善合理的設計過程和相關的應用示例。兩個主要問題始終是機器學習模型的可解釋性和對機器學習模型的物理理解。因此,作者考慮了可解釋性的不同方面及其在材料科學中的重要性。最后,文章針對計算材料科學中的各種挑戰提出了解決方案和未來的研究發展。
文獻鏈接:
Recent advances and applications of machine learning in solid-state materials science (npj Computational Materials, 2019, DOI: 10.1038/s41524-019-0221-0)
5. npj Computational Materials:通過可解釋的機器學習識別高級自旋驅動熱電材料
機器學習正在成為科學發現的重要工具。機器學習方法在材料開發領域中的應用尤其吸引人,它可以通過發現新的/更好的功能材料來實現創新。要將機器學習應用于實際的材料開發,科學家和機器學習工具之間必須緊密協作。但是,到目前為止,許多機器學習算法的黑匣子屬性都阻礙了這種協作。從材料科學和物理學的觀點來看,科學家通常很難解釋數據驅動的模型。
在這個工作中,作者通過使用一種可解釋的機器學習方法來說明具有異常能斯特效應的自旋驅動熱電材料的發展?;诓牧峡茖W和物理學的先驗知識,作者能夠從可解釋的機器學習中提取一些相關性以及有關自旋驅動熱電材料的新知識。在此指導下,作者進行了實際的材料合成,從而確定了新型自旋驅動的熱電材料。
文獻鏈接:
Identication of advanced spin-driven thermoelectric materials via interpretable machine learning (npj Computational Materials, 2019, DOI: 10.1038/s41524-019-0241-9)
6. npj Computational Materials:可靠且可解釋的機器學習方法可加速材料的開發
盡管ML在商業應用中表現出色,但是將ML應用于材料科學仍存在一些獨特的挑戰。在這種情況下,這項工作是雙重的。
首先,當從代表性不足/失衡的材料數據中學習時,作者確定了現有機器學習技術的常見陷阱。具體而言,在數據不平衡的情況下,評估ML模型質量的標準方法會有問題,并導致令人誤解的結論。
此外,作者發現模型本身的置信度得分不能被信任,模型自省方法(使用更簡單的模型)也無濟于事,因為它們會導致預測性能下降(可靠性與可解釋性之間的權衡)。
其次,為了克服這些挑戰,作者提出了一個通用的可解釋且可靠的機器學習框架。具體來說,作者提出了一種通用方法,該方法采用一組更簡單的模型來可靠地預測材料特性。文章還提出了一種轉移學習技術,并表明可以通過利用不同材料特性之間的相關性來克服由于模型簡單而導致的性能損失。同時,還提出了一種新的評估指標和一個信任分數,以更好地量化預測中的置信度。為了提高可解釋性,作者在框架中添加了基本原理生成器組件,該組件提供了模型級別和決策級別的解釋。
最后,文章證明了這種技術在兩種應用中的多功能性:(1)預測晶體化合物的特性;(2)確定潛在穩定的太陽能電池材料。文章還指出了ML在材料科學中的成功應用尚待解決的一些懸而未決的問題。
文獻鏈接:
Reliable and explainable machine-learning methods for accelerated material discovery (npj Computational Materials, 2019, DOI: 10.1038/s41524-019-0248-2)
7. Nat. Mater.:利用機器學習進行藥物發現和開發
各種各樣的機器學習方法,例如貝葉斯(Bayesian),支持向量以及最近的深度神經網絡,都證明了它們在藥物發現和開發中的效用。這利用了從高通量篩選數據創建的更大的數據集,并能夠以更高的準確度預測目標和分子特性的生物活性。
科研工作者才剛剛開始挖掘這些技術的潛力,但是它們可能已經從根本上改變了識別新分子或重新使用舊藥物的研究過程。這種針對端到端(E2E)應用的機器學習模型的集成應用具有廣泛的意義,并且對開發未來的療法及其目標具有重要意義。
文獻鏈接:
Exploiting machine learning for end-to-end drug discovery and development (Nat. Mater., 2019, DOI: 10.1038/s41563-019-0338-z)
8. Nature Reviews Chemistry:人工智能驅動的有機合成化學
合成有機化學是化學領域的基礎,包括藥物發現、化學生物學、材料科學和工程學。但是,執行復雜的化學合成本身需要很豐富的背景知識,通常是在多年的研究和動手實驗實踐中獲得的。具有簡化和自動化化學合成潛力的技術開發是一個耗費半世紀尚未實現的努力。隨著計算能力、數據可用性和算法的提高,人們對人工智能(AI)的興趣再次興起。
在這篇綜述中,作者討論了AI對合成化學不同任務的近期影響,并從文獻中剖析了一些實例。通過研究基本概念,作者旨在使化學家了解AI,以便他們可以將其作為工具,通過指出知識差距并描繪化學AI如何在化學工業中運行來刺激未來的研究。
-
光伏電池
+關注
關注
5文章
267瀏覽量
33017 -
數據庫
+關注
關注
7文章
3905瀏覽量
65864 -
機器學習
+關注
關注
66文章
8496瀏覽量
134207
發布評論請先 登錄
上海和晟儀器參與2025人工智能助力PI 及特種高分子產業對接論壇

亞馬遜一年助力兩百萬人提升人工智能技能的關鍵洞察

評論