概述
目前人類雖然已掌握數以億計的分子數量,但也只占未知分子數目的一小部分,阻擋化學家發現未知分子的一個重要因素是缺乏分子的合成路線,而有機合成能夠為化學家們提供一種從簡單結構分子破碎重組合成復雜的分子的方法。在有機合成領域早期主要依靠化學家累計的經驗及制定的模板來進行合成實驗,隨著分子機器學習中的生成模型逐漸成熟,用數據驅動的方法應對有機合成的挑戰成為當下化學產品研究及研發的重要手段之一。
隨著人工智能技術日漸成熟,其在化學領域應用優勢也逐漸展現出來,有機合成預測就是其中之一。在傳統的化學實驗室中,實驗員想了解兩種分子的產物,必須通過真實的化學實驗才能得到結果。而借助國工數據大腦平臺中有機合成算法,實驗員僅通過簡單的點擊就可以得到兩種分子反應的多條預測結果,以供相關人員進行參考。這不僅能夠節省時間成本,同時還能夠降低了相關的實驗成本,及相關的實驗風險。
平臺優勢
國工數據大腦平臺是一個集成人工智能算法、統計學算法的數據分析平臺,服務于傳統行業的智能化改造升級。經過多年的積累,國工數據大腦平臺在數據、算法等方面具有明顯的優勢。針對于有機合成預測算法,其主要優勢如下:
第一,集成于國工數據大腦平臺,降低了該算法的使用門檻,使用者僅需輸入參與反應的SMILES代碼即可;具有較快的運行速度,可以快速響應用戶的需求;
第二,建模數據規模龐大,主要得益于國工智能在化工行業深耕多年,慢慢積累得來;
第三,采用transformer AI技術框架進行訓練,克服對既有經驗以及模板庫的依賴,同時擁有較高的預測準確率;
第四,數據、模型可信度高,每條數據均出自于相關專利文獻,并且模型的預測線路均參考相關文獻專利;
第五,多條預測線路展示,該算法可以為每個預測線路進行可靠性計算,并按照可靠性高低展示給用戶。
預測過程
首先,打開國工數據大腦平臺。依次進行操作:機器學習-->工作臺—>新建正向合成計算流程—>拉取正向合成組件(圖1)
圖1
然后,進行組件配置。資源項選擇正向合成云服務,分子式填入參與反應的相關反應的SMILES表達式,并按照相應規則填入,如圖2所示。最后點擊調試,當顯示運行成功時即表示運行預測算法成功,平臺會將預測結果展現給用戶,結果如圖3所示。
圖2
分析結果
圖3
如圖3所示,數據大腦平臺運行預測算法可以同時得到多條預測結果,以供實驗人員進行參考。同時其排序順序則是按照算法預測結果的可靠性計算后展示給用戶。
其中每條結果都是由參與反應的反應分子的分子結構圖及其SMILES表達式與預測生成物的SMILES的分子結構圖及其SMILES表達式共同組成。分子結構圖可以幫助實驗人員快速的定位到發生反應的官能團,以及具體的化學鍵的斷裂與重組的情況。依據以上信息以及其本身的經驗,實驗人員可以分析出分子間結合反應的合理性,并以此作為該反應是否保留進行真實實驗的依據。通過使用國工數據大腦的正向合成服務,可以有效的幫助實驗人員節省時間以及實驗成本,加快研發的效率。是學術、研發人手必備的科研利器。
名詞解釋
SMILES表達式:全稱Simplified molecular input line entry system,是一種簡化分子線性輸入規范,一種用ASCII字符串明確描述分子結構的規范。
分子式填入規則:反應分子的SMILES表達式中間由“.”進行隔開。
適用范圍
有機合成預測應用場景:各大化學研發中心的小分子研發實驗室,以及各高校化學研究實驗室。
中秋節是中國傳統節日之一,也是一年中最重要、最盛大的節日之一。在這一天,以明亮的月亮和家人團聚為特點,承載著人們無盡的思念和美好的祝福。 國慶、中秋兩節遇, 合家團圓精神俱。 團團圓圓過中秋, 歡歡喜喜
2023年8月28日,國工智能與鎂伽科技舉行戰略合作簽約儀式,國工智能董事長柳彥宏與鎂伽科技創始人兼首席執行官黃瑜清先生代表雙方簽訂正式戰略合作協議,標志著AI輔助化工研發領先者、智能自動化實驗室引領者開啟強強聯合發展之路。&n
創新是一個民族進步的靈魂,是一個國家興旺發達的不竭動力,也是中華民族最深沉的民族稟賦。在激烈的國際競爭中,惟創新者進,惟創新者強,惟創新者勝。 5月27日
4月6日,陜西2023年一季度重點項目觀摩活動走進渭南。當日,觀摩組深入蒲城海泰高端液晶顯示材料生產項目等重點項目建設現場進行觀摩。 作為國工智能的重要合作伙伴,近年來,