1. <rp id="rdavu"></rp>

    2. 材料前沿

      當前位置: 首頁 > 新聞動態 > 材料前沿
      中科大江俊JACS:可遷移的機器學習模型預測蛋白質紅外光譜
      發布時間:2020-11-11 來源:機數科技 瀏覽:1124次



      研究背景

      A.如何獲得蛋白質動態過程的結構信息,以建立蛋白質分子精準的構效關系是一個重大的挑戰


      蛋白質分子是生命的基石。生物系統的各種功能,依賴于各種蛋白質分子不同形式和程度的表達。認識蛋白質的功能,建立在對其結構精準認識的基礎上。特別是,蛋白質分子動態過程中結構的實時變化,對揭示具體環境中的蛋白質性質、發展現代生命科學和醫學藥物研究具有至關重要的意義。因此,《SCIENCE》期刊提出的現代科學125個前沿重要問題中就有三個重大科學問題與測定蛋白質結構相關。如何獲得蛋白質動態過程的結構信息,以建立蛋白質分子精準的構效關系,是蛋白質結構研究的核心問題。


      B.發展快速響應并實時探測蛋白質動態結構的分子光譜技術是一個重要的科學問題


      分子光譜技術,可以通過測量蛋白質對光照的響應信號,利用不同蛋白質的光學特征不同來測定蛋白質結構。比如,X射線光譜,紅外吸收光譜,拉曼光譜,圓二色光譜,都可以指認出蛋白質的光學指紋。特別是紅外光譜,因其對二級結構變化的高敏感,成為測定蛋白質結構的一種重要手段 (Nature 2020, 577, 52-59;Science 2016, 353,1040-1044;Chem. Rev. 2017,117, 10623-10664)。

      利用紅外光譜光學指紋信息預測結構信息,離不開理論模擬的對比和確認。然而,蛋白質分子光譜的理論模擬面臨嚴重的計算瓶頸問題。蛋白質在溶液中的結構是溶質分子與周圍環境相互作用的整體效果的反映,由于原子數多,自由度極大,給精確的光譜計算帶來了相當大的挑戰,因此限制了實驗光譜的解讀和原位譜學探測技術的發展。因此,光譜模擬如何幫助實現快速響應和實時探測蛋白質動態結構的分子光譜技術,是一個重要的科學問題。



      研究出發點

      A.蛋白質模型哈密頓量的構建:

      蛋白質在紅外光譜中有很多特征吸收帶,其中酰胺 I (1600-1700cm-1),包含了蛋白質豐富的二級結構信息,α-螺旋、β-折疊、β-轉角、卷曲等, 因此測量酰胺 I 紅外光譜可獲得蛋白質的光學指紋信息。然而蛋白質分子中的原子數成百上千,結構自由度相當大,如果用整個分子的結構信息去預測單一的譜學信號,變量太多且不可控,構建機器學習模型相當難而且效果不好?尚械臋C器學習模型,必須建立在對蛋白質分子結構的合理劃分和對片段的性質進行學習和預測的基礎上,即分而治之的策略。


      Figure 1. Model Hamiltonian for amide I vibrations in a protein.

      以酰胺I紅外譜為例,我們構建了這樣一個哈密頓矩陣,如圖1所示。在上述描述酰胺I振動的哈密頓矩陣中,對角元為每個肽鍵的振動頻率(ωi),由N-甲基乙酰胺分子(NMA)的神經網絡模型預測得到,兩側的非對角元為相鄰兩個肽鍵的振動耦合系數(Jij),由甘氨酸二肽(GLDP)分子的神經網絡模型預測得到,其他非對角元元素為非相鄰肽


      B.機器學習數據產生以及描述符的選。


      為了充分采樣結構差異大的NMA分子,我們使用不同的初始構象運行了七組一共241.5 ps時長的從頭算分子動力學模擬 (ab initio molecular dynamics, AIMD),每隔50步進行采樣以避免結構之間的相關性。為了充分考慮溶劑效應對肽鍵振動頻率的影響,我們提取了動力學軌跡中NMA分子以及其周圍5 Å以內的水分子一共9660組數據進行量化計算。對于二肽GLDP分子,為了節省計算資源,我們采用對Ramachandran (-180°≤ϕ≤180°, -180°≤ψ≤180°)每隔進行系統式掃描方式產生初始構象,一共產生了5128組二肽數據用于量化計算產生近鄰振動耦合數據。

      我們使用NMA以及GLDP分子的庫倫矩陣作為機器學習訓練的描述符,采用深度神經網絡模型對(ωi,Jij)進行學習和預測。所有模擬均在TensorFlow程序上進行。由于庫倫矩陣描述符自身的旋轉不變性,為了消除 () 訓練過程中的方向依賴性,我們對每個NMA分子進行了旋轉矩陣操作,將羰基C原子設置為xyz坐標系中的零點,將C-O鍵轉至y軸正方向,將OCN置于x-y平面,然后,對于新的NMA分子的()預測通過乘以旋轉矩陣的逆矩陣來獲得其原來坐標系下的值。



      結果與討論

      A.機器學習模型評估:



      Figure 2. (a) Correlation between the DFT-computed (ω_DFT) (black lines/dots) and NN-predicted (ω_NN) (red lines/dots) amide I vibrational frequencies after cross-validation. (b-d) Comparison of the DFT-computed amide I vibrational transition dipole moment in the x, y, z direction (μx,y,z_DFT) (black lines/dots) and NN-predicted (μx,y,z_NN) (red lines/dots) after cross-validation. (e) Amide I vibrational normal modes (a, b) and local modes (c, d) of GLDP with DFT B3LYP/cc-pVDZ. (f) Comparison of DFT-computed (J_DFT) (black lines/dots) and NN-predicted (J_NN) (red lines/dots) coupling constants of nearest neighboring amide I modes after cross-validation.

      我們采用交叉檢驗的方式來衡量神經網絡模型的預測效果,從圖2中可以直觀的看到,神經網絡對于頻率以及振動耦合常數的預測效果很好,這是因為它們主要取決于基態結構。但是,由于躍遷態(例如,振動躍遷偶極矩)涉及兩個不同的振動態,它對結構的變化更加敏感,而我們的描述符只包含基態信息,因此會看到更多的異常值?傮w來說,我們對(ωi,, Jij)的預測有著高的皮爾遜系數(r>0.9)以及極低的誤差保證了我們后續構建振動激子哈密頓量的準確性。


      Figure 3. Machine learning protocol for predicting protein IR spectroscopy.

      使用機器學習預測蛋白質紅外光譜的整個流程如圖3所示,首先我們將蛋白質拆分為單獨的肽鍵和二肽,由NMA分子NN模型預測的(ωi)以及()用于生成哈密頓量的對角元元素和由非相鄰肽鍵之間的耦合產生的非對角元素(通過偶極近似計算)。從GLDP分子NN模型預測的Jij值作為鄰近二肽的振動耦合用于生成非對角線元素。最后,我們對整個模型哈密頓量進行對角化求解得到蛋白質的紅外光譜。同時,我們也將這個ML工具發布到了網上,提供實時的蛋白質光譜預測(http://dcaiku.com:12880/platform/first)。



      B. ML protocol對蛋白質二級結構的分辨


      為了測試我們開發的機器學習方案預測光譜的準確性,我們測試了12中不同類型的蛋白質,即不同比例的α-螺旋和β-折疊,使用機器學習預測了它們的紅外光譜并與實驗光譜進行了比較。


      Figure 4. Good agreement (the quantitative agreement between the predicted and experimental spectra were measured by Spearman rank correlation coefficients, see Table 1) is obtained between the experimental spectra of the proteins measured in D2O (black lines) and the ML predictions based on 1000 MD configurations (red lines). Intensity is scaled to have the same maximum intensity for each panel.

      Table 1. ML predicts IR protein spectra with the root mean square error (RMSE) and high Spearman rank correlation (ρ) indicates the quantitative agreement with experiment. Structures of 12 proteins with different sizes were taken from the Protein Data Bank, representing a diverse range of secondary structure contents, i.e., different fractions of α-helix and β-sheet. The IR spectrum of each protein was computed based on 1000 MD configurations. All reported calculation times refer to calculations on eight cores of an Intel(R) Xeon(R) CPU (E5-2683v4 @ 2.1GHz).


      我們從Spearman rank correlation(ρ)來衡量理論模擬光譜與實驗測量光譜之間的相似度。從4和表1中可知,理論預測與實驗測量吻合較好(11個蛋白ρ> 0.80,僅有1DHRρ0.71)。得益于機器學習對光譜模擬巨大的速度提升,我們可以模擬1000個蛋白質動力學快照(這對直接的量子化學計算會非常昂貴)來預測紅外光譜,從而捕獲每種蛋白質的動態特征?傮w來說,機器學習模型預測的光譜成功地再現了實驗光譜的基本特征(主峰和線形)。


      Figure 5. (a) From left to right : Simulated (red line) and Experimental (black line) IR spectra of Ubiquitin at four different temperatures (1.6 ° C ~ 82.6 ° C) and the temperature variation of the dominant peak position. (b) The ML-predicted IR spectra of the Trp-cage protein along its folding path (S1the original unfolded strand structure; S25: slightly folded but retaining the coil structure; S50: folding rapidly with the emergence of helix elements; S75-S100: stably folded protein with helix structures forming a cage.) All spectra are averaged over 100 (1000) MD snapshots for each state of Trp-cage (Ubiquitin).

      為了進一步測試我們機器學習模型的魯棒性和遷移性,我們模擬了不同溫度下(1.6℃, 28.6℃, 55.6℃, 82.6℃)Ubiquitin蛋白的紅外光譜,從圖中我們可以看到,隨著溫度的逐漸升高,Ubiquitin蛋白的紅外光譜逐漸藍移,機器學習模擬的結果與實驗光譜很好的吻合。這說明我們的機器學習模型對于變化的外部環境因素(溫度變化)具有良好的遷移性。隨后,我們使用開發的機器學模型去跟蹤Trp-Cage蛋白質折疊過程,從圖中可以看到,隨著折疊過程的進行,紅外光譜有著10cm-1(S1:1652 cm-1, S25:1650 cm-1, S50:1646 cm-1, S75:1644 cm-1, S100:1642 cm-1)紅移,機器模擬的結果與之前實驗以及理論模擬的結果一致,這同樣說明了我們的機器模型能準確的分辨蛋白質二級結構的變化,可以用于實時跟蹤蛋白質的折疊過程。



      總結與展望


      我們報道一種基于第一性原理數據的機器學習流程,該流程可以根據蛋白質的基態結構信息準確的預測蛋白質的酰胺I帶紅外光譜。與傳統的量子化學計算方法相比,它大大提高了蛋白質紅外光譜的理論模擬速度。更重要的是,所建立的機器學習模型具有優秀的可遷移性,可以預測訓練集范圍以外的蛋白質光譜響應,模擬不同狀態下的信號變化,從而分辨蛋白質的二級結構、考察溫度影響、跟蹤蛋白質折疊等。目前我們正在通過增加訓練數據集并且考慮顯性的溶劑效應來提高我們機器學習模型的準確性,并探索將該模型擴展到其他光譜性質研究,包括紫外吸收(UV)、拉曼(Raman)、和頻光譜 (SFG)、多維光譜(Multidimensional Spectroscopies)。


      文獻來源


      論文標題:A Machine Learning Protocol for Predicting Protein Infrared Spectra.

      論文鏈接:http://dx.doi.org/10.1021/jacs.0c06530.


      science編輯推薦我們的機器學習-量子化學技術







      美女mm131爽爽爽作爱视频,狼人青草久久网伊人,777米奇色狠狠8888影视,丰满毛多小少妇12p,女人18毛片a级毛片 日日摸夜夜添夜夜添影院 4399在线视频免费播放 99久久国语露脸精品国产 最近最新中文字幕大全直播 色综合久久综合欧美综合网 亚洲日韩av片在线观看 宝宝才几天没做就湿成这样 免费国产成人高清在线视频 国产成人精品日本亚洲 黃色a片三級三級三級 最新中文无码字字幕在线 四虎影视a片永久免费观看 桃花视频在线观看完整版 真实国产乱子伦对白视频 三级特黄60分钟在线播放 少妇人妻无码专区视频 中国亚洲日韩a在线欧美 成年肉动漫在线观看无码 四虎影视a片永久免费观看 日本亚洲欧美日韩国产ay 三级特黄60分钟在线播放 99久久国语露脸精品国产 欧美成人午夜免费全部完 岛国无码不卡av在线观看 妈妈的朋友6 狠狠色丁香婷婷综合久久图片
      不戴乳罩露全乳的熟妇 天天操天天干 精品综合久久久久久97 男女性高爱潮是免费国产 中国女人69xxxxx免费 俄罗斯女人与动z0z0 2012中文高清在线观看 日本a级视频在线播放 亚洲日韩av片在线观看 欧美a级v片 国产高清亚洲日韩字幕一区 日本黄 色 成 人网站免费 中国女人69xxxxx免费 无限资源免费韩国日本 国啪产自制福利2020 аⅴ中文天堂最新版在线 午夜影视免费体验区入口 人妻自慰20p| 久久精品天天中文字幕 久久人人超97人妻免费 人妻无码av中文一二三区 青青青青久久精品国产vr 成在线人永久免费视频播放 久久精品国产亚洲av gogo人体美鮑销魂 大龄熟妇特黄a片 亚洲av无码久久 性xxxx视频播放 在线视频网站www色 熟女体下毛毛黑森林 在线不卡av片免费观看 人妻无码av中文系列久久免费 国产三级av在在线观看 2020精品国产自在现线看 女总裁的贴身兵王 伊人伊成久久人综合网996 日本xxwwxxww视频免费 狼人青草久久网伊人 亚洲日韩av片在线观看 亚洲日本va一区二区三区 不戴乳罩露全乳的熟妇 亚洲av无码精品色午夜 免费国产黄网站在线观看 日日摸日日碰夜夜爽无码 看成年女人午夜毛片免费 久久人人做人人玩人人妻精品 学生精品国自产拍中文字幕 亚洲日本va一区二区三区 男人激烈吃奶让女人爽动态图 天干天干夜啦天干天干国产 欧美成人午夜免费全部完 无码av中文一二三区 中文无码福利视频岛国片 色噜噜狠狼综合在线 波多野结衣教师系列精品 思思久99久女女精品视频 依依成人精品视频在线观看 国产不卡无码视频在线观看 天堂v亚洲国产ⅴ第一次 gogo人体美鮑销魂 婷婷色婷婷开心五月四房播播 成年片黄网站色大全免费国产 又硬又水多又坚少妇18p 57pao国产成视频永久免费 天天夜夜草草久久伊人 天堂v亚洲国产ⅴ第一次 亚洲国产aⅴ综合网 日本高清乱理伦片中文字幕 免费a毛片 中国女人69xxxxx免费 亚洲av无码精品色午夜 综合亚洲伊人午夜网 欧美换爱交换乱理伦片 午夜影视免费体验区入口 各类熟女熟妇真实视频 天堂v亚洲国产ⅴ第一次 欧美成人午夜免费全部完 4399在线看片免费韩国 无码av中文一二三区 女总裁的贴身兵王 中文字幕日产乱码久久 永久免费av无码网站国产 在线欧美精品视频二区 国产三级av在在线观看 王者荣耀cos黄网站无码 中国亚洲日韩a在线欧美 gogo人体美鮑销魂 2012中文高清在线观看 亚洲国产aⅴ综合网 久久综合九色综合欧美98 无限资源免费韩国日本 2012中文高清在线观看 a级情欲片在线观看免费 欧美换爱交换乱理伦片 青青青国产免费线在线观看 аⅴ中文天堂最新版在线 特级婬片女子高清视频 高效天堂bt在线www 加勒比hezyo无码专区 人妻无码av中文系列久久免费 日本免费大黄在线观看 久久99国产综合精品 王者荣耀cos黄网站无码 在线观看热码亚洲av每日更新 伊人久久大香线蕉av仙人 青青青国产免费线在线观看 丰满的熟妇露脸大屁股 学生精品国自产拍中文字幕 av天堂久久天堂av色综合 黄网站男人免费大全 日本a级视频在线播放 亚洲国产在线精品国 波多野结衣教师系列精品 日本a级视频在线播放 久久se精品一区二区 亚洲国产aⅴ综合网 色综合热无码热国产 麻酥酥自慰多次喷水25分钟 亚洲va久久久噜噜噜久久 免费的美女色视频网站 欧美亚洲日本国产黑白配 亚洲中文无码av永久 2020给个免费网站好人有好报 亚洲中文无码av永久 亚洲午夜久久久久久 加勒比hezyo无码专区 日本高清乱理伦片中文字幕 成在线人永久免费视频播放 欧美亚洲日本国产黑白配 美女被黑人巨大进入的视频 在线a亚洲v天堂网2018 亚洲午夜久久久久久 草莓黄瓜丝瓜香蕉成人秋葵向日葵 久久人人97超碰爱香蕉 日本高清不卡aⅴ免费网站 免费的美女色视频网站 a级情欲片在线观看免费 国产不卡无码视频在线观看 gogo全球大胆高清人体 高清国产天干天干天干 欧美人与动性行为视频 一区二区三区不卡免费视频 天天夜夜草草久久伊人 超碰97人人模人人爽人人喊 欧美乱子伦xxxx 亚洲欧美人高清精品a∨ 24小时更新在线观看免费 无码免费无线观看在线视频 性欧美乱妇come 韩国三级中文字幕hd 又色又爽又黄的视频免费不卡 亚洲色欲在线播放一区 各种高潮videos抽搐合集 国产女人高潮抽搐喷水视频 亚洲av无码久久 高清videosgratis欧美69 永久免费av无码网站国产 大香伊蕉在人线国产最新 免费a毛片 深夜特黄a级毛片免费视频 国产三级韩国三级日产三级 美女mm131爽爽爽作爱视频 床震摸腿吻胸娇喘把腿张开 美女极度色诱视频国产 深夜特黄a级毛片免费视频 男女真人后进式猛烈动态图 少妇高潮惨叫喷水正在播放 特黄 大片做受又粗又硬又大 国产亚洲日韩在线三区 无码高潮少妇多水多毛 国产精品综合色区小说 57pao国产成视频永久免费 波多野结衣教师系列精品 丰满毛多小少妇12p 日韩中文无码有码免费视频 亚洲成a人片在线观看国产 人妻的渴望波多野结衣 久久综合九色综合欧美98 草莓黄瓜丝瓜香蕉成人秋葵向日葵 亚洲欧洲中文日韩乱码av 午夜影视免费体验区入口 无遮挡很爽很污很黄的网站 久久99国产综合精品 人妻自慰20p| 777米奇色狠狠8888影视 日韩中文无码有码免费视频 男人激烈吃奶让女人爽动态图 人妻少妇久久中文字幕 婷婷色婷婷开心五月四房播播 免费a毛片 亚洲日本va一区二区三区 中文无遮挡h肉视频在线观看 2012中文高清在线观看 国产三级韩国三级日产三级 熟女体下毛毛黑森林 中国女人69xxxxx免费 国产精品青春草原在线 在线视频网站www色 手机在线观看av无码片 国产在线拍揄自揄视频不卡 国模吧双双大尺度炮交gogo 大龄熟妇特黄a片 女人18毛片a级毛片 俄罗斯女人与动z0z0 男女性高爱潮是免费国产 国产女人高潮抽搐喷水视频 免费的美女色视频网站 99久久无色码中文字幕 无码免费无线观看在线视频 综合亚洲伊人午夜网 各种高潮videos抽搐合集 欧美人与动性行为视频 国产高清亚洲日韩字幕一区 欧美xxxx做受3d 美女极度色诱视频国产 思思久99久女女精品视频 久久综合亚洲鲁鲁五月天 аⅴ中文天堂最新版在线 国产成人av大片大片在线播放 无码高潮少妇多水多毛 在线观看日韩av无码 美女胸18下看禁止免费视频 国产精品永久免费 人妻少妇久久中文字幕 日日摸日日碰夜夜爽无码 综合自拍亚洲综合图区高清 大香伊蕉在人线免费视频 美女胸18下看禁止免费视频 成 人 a v免费视频 国产xxxxx在线观看 小蝌蚪午夜精品国产专区 久久人人超97人妻免费 小蝌蚪午夜精品国产专区 久久人人超97人妻免费 我和岳坶双飞a片 国产精品永久免费 成 人 a v免费视频 人人揉揉香蕉大免费 国产av一区二区三区无码 国产女人高潮抽搐喷水视频 人人揉揉香蕉大免费 国产成人av大片大片在线播放 婷婷五月综合丁香在线 最新亚洲人成无码网站 国产精品永久免费 2020精品国产自在现线看 深夜特黄a级毛片免费视频 亚洲va久久久噜噜噜久久 中文无遮挡h肉视频在线观看 日本免费一区二区三区最新 中国亚洲日韩a在线欧美 欧美xxxx做受3d 色综合热无码热国产 2012中文高清在线观看 中国亚洲日韩a在线欧美 激情偷乱人伦小说视频 亚洲国产在线精品国 日本高清乱理伦片中文字幕 超碰97人人模人人爽人人喊 在线欧美精品视频二区 在线精品自偷自拍无码 在线bt天堂www 精品综合久久久久久97 思思久99久女女精品视频 在线视频网站www色 a片在线视频免费观看网址 无码高潮少妇多水多毛 激情偷乱人伦小说视频 欧美亚洲日本国产黑白配 色噜噜狠狼综合在线 漂亮人妻被夫上司强了 依依成人精品视频在线观看 大香伊蕉在人线国产最新 亂倫近親相姦中文字幕 女生的小兔子长什么样 亚洲av无码精品色午夜 国产高清亚洲日韩字幕一区 又色又爽又黄的视频免费不卡 天天夜夜草草久久伊人 久久人人97超碰爱香蕉 a片毛在线视频免费观看 中文字幕亚洲一区二区三区 国产免费破外女真实出血视频 美女极度色诱视频国产 各类熟女熟妇真实视频 激情偷乱人伦小说视频 777米奇色狠狠8888影视 h无码精品动漫在线观看 亚洲午夜久久久久久 王者荣耀cos黄网站无码 日本高清视频在线www色 国产女人高潮抽搐视频360 国产xxxxx在线观看 久久se精品一区二区 天天操天天干 高清国产天干天干天干 午夜影视免费体验区入口 亚洲五月久自拍区自拍区 香港典型a片在线观看 国产不卡无码视频在线观看