眾所周知,蛋白質是生命的基石。對蛋白質獨特的三維結構以及其動力學性質的探索不僅有助于我們解讀生命密碼,更有助于加速藥物研發。近期,深勢科技將基于神經網絡的強化動力學方法(Reinforced Dynamics, RiD)進一步應用于擁有更高維集合變量(Collective Variables, CVs)的體系中,這一研究將推進蛋白質結構采樣、結構精修或環區優化等工作的進行,讓研究人員能夠通過計算方法向蛋白質的天然狀態更近一步。

(論文:Efficient sampling of high-dimensional free energy landscapes using adaptive reinforced dynamics)
此項成果于近日登上Nature旗下專注于計算科學的頂級期刊《自然-計算科學》(Nature Computational Science),該期刊關注最新計算方法的發展及其如何在各學科中解決實際問題。論文題為《利用自適應強化動力學對高維自由能面進行高效采樣》(Efficient sampling of high-dimensional free energy landscapes using adaptive reinforced dynamics),據了解,文章中使用了超過100個集合變量加速采樣進程,此前的采樣方法從未處理過如此高維的集合變量。該文章作者目前均在深勢科技團隊。這是繼12月8日推出蛋白質結構預測工具Uni-Fold,并開源訓練、推理代碼后,深勢科技團隊的又一重磅成果。

(RiD工作流,RiD方法應用在超過100個集合變量的體系上)
神經網絡加持下,對蛋白結構的”精雕細琢”再進一步
幾十年來,科學家們通過各種實驗手段解析了十幾萬個蛋白質結構,但這相較于已經測序的數十億計蛋白質來說還遠遠不夠。實驗方法成本高、周期長,因此能否用計算方法還原蛋白質生理狀態并加速研究工作成為計算生物學中最具挑戰性的問題之一。
盡管在2020年的國際蛋白質結構預測頂級競賽CASP(Critical Assessment of protein Structure Prediction)中,來自DeepMind的AI算法AlphaFold2的表現引發生物界巨大轟動。但相比于蛋白質真實的生理狀態,AlphaFold2的預測結果仍需要進一步的蛋白結構精修。
目前在蛋白質結構優化中,基于經典分子動力學(Molecular Dynamics, MD)的優化方案在近兩期的CASP上都取得了優異的結果。但是,經典分子動力學模擬方法在蛋白質體系中采樣效率低,而傳統增強采樣算法又面臨著計算量大、難以選取集合變量以及維數災難的問題。強化動力學(Reinforced Dynamics,RiD)方法則可以借助神經網絡,處理幾十甚至上百維的集合變量,使其能夠應用在復雜體系中。RiD方法在蛋白質結構優化問題上處理了超過100個集合變量,讓經典分子動力學方法無法得到的蛋白質天然結構在強化動力學方案下成為現實。

(在R0974s1, R0986s1 和 R1002-D2 三個案例中的蛋白結構精修結果)
在CASP13比賽中三個典型例子(R0974s1, R0986s1 和 R1002-D2)上,RiD做到了大幅提升。相比于初始結構,RiD優化后的結構平均提升了14.6點GDT-HA分數,其中最高分數分別達到了92.4,82.6和79.7。同時,優化結果具有良好的魯棒性(圖a和b)。特別地,在R1002-D2的例子上,經典分子動力學模擬只采樣的很小的區域(圖c 紫紅色區域),RiD可以從初始結構(圖c 黑色X,圖d)經過去折疊(圖e),最終模擬到天然狀態結構(圖c 藍色X,圖f)。
蛋白質在生物體內是不斷運動的,目前描述蛋白質構象系綜的最佳方式之一是借助分子模擬手段。對于生物大分子體系的高效采樣是分子模擬的一個關鍵問題,RiD作為這一問題的出色解決方案,為多個領域的突破帶來可能。對于藥物設計而言,RiD能夠在更多的場景發揮重要作用:探尋構象變化中的隱藏口袋和別構口袋,困難藥物靶點中固有無序蛋白的構象采樣,抗體環區優化等。對于藥物科研人員來說,這些難題的解決能有效提升藥物研發效率。
為了方便學術開發與應用,深勢科技團隊已將RiD方法重構為開源軟件供用戶使用(https://github.com/deepmodeling/rid-kit)。同時深勢科技也針對藥物設計場景,對RiD進行了進一步的開發和優化,集成于旗下一站式計算輔助藥物設計平臺Hermite中。用戶可通過Hermite-ProteinRefine對輸入的蛋白質進行結構優化,獲得更接近天然狀態的蛋白結構。

(Hermite界面-通道蛋白在膜里面)
去年,深勢科技核心成員的工作開辟了“AI+物理模型+高性能計算”的科學計算新范式,一舉斬獲“計算應用領域諾貝爾獎”、國際高性能計算應用領域最高獎項“戈登·貝爾獎”。 如今RiD的誕生與應用,也是深勢科技團隊“AI+物理模型+高性能計算”組合拳的極佳體現,也是新一代分子模擬算法在藥物設計領域落地,實現效率與精度統一的例證之一。深勢科技致力于運用領跑行業的分子模擬技術,為人類文明最基礎的生命、能源、材料科學與工程研究打造新一代微尺度工業設計和仿真平臺。
Hermite作為根植于云計算的臨床前計算機輔助藥物設計平臺,能為藥物開發人員提供數據、算法、算力三位一體的一站式解決方案。除RiD模塊外,Hermite上已集成多個重量級功能,例如近期上線的蛋白質結構預測工具Uni-Fold,在藥物優化階段比較不同分子與蛋白靶點結合活性差別的Uni-FEP,等等。
在結構生物學領域,利用Uni-Fold、RiD等AI+計算模擬的算法,并結合冷凍電鏡等實驗手段,深勢科技正致力于打造一套模擬—AI—實驗三者聯合驅動的結構生物學解決方案,為基于結構的藥物設計提供更高的起點,加速科學家們的藥物發現進程。
特別提醒:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。