在隨后舉辦的CASP15中,這一技術(shù)變革的影響更為顯著。所有表現(xiàn)優(yōu)異的研究團(tuán)隊(duì)均采用了基于深度學(xué)習(xí)的預(yù)測(cè)方法,表明該技術(shù)已成為該領(lǐng)域的新標(biāo)準(zhǔn)。單蛋白質(zhì)或其結(jié)構(gòu)域的三維結(jié)構(gòu)預(yù)測(cè)這一長(zhǎng)期困擾學(xué)界的核心問(wèn)題已得到基本解決,研究重點(diǎn)正逐步轉(zhuǎn)向更具挑戰(zhàn)性的復(fù)雜問(wèn)題。

初始版本的預(yù)測(cè)工具主要針對(duì)單蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)設(shè)計(jì),對(duì)復(fù)合物的預(yù)測(cè)能力有限。為此,研究團(tuán)隊(duì)開(kāi)發(fā)了專門(mén)針對(duì)復(fù)合物預(yù)測(cè)的改進(jìn)版本,通過(guò)算法優(yōu)化和訓(xùn)練策略調(diào)整,在CASP15中展現(xiàn)出令人鼓舞的預(yù)測(cè)能力。例如,對(duì)于由相同蛋白鏈組成的病毒分子結(jié)構(gòu)、包含20條鏈的細(xì)菌酶復(fù)合物,以及抗體與病毒蛋白的相互作用模式,改進(jìn)后的算法都實(shí)現(xiàn)了接近實(shí)驗(yàn)精度的預(yù)測(cè)結(jié)果。
然而,仍有相當(dāng)比例的蛋白質(zhì)復(fù)合物結(jié)構(gòu)預(yù)測(cè)未能達(dá)到理想精度,表明該領(lǐng)域仍存在巨大的技術(shù)提升空間。特別是對(duì)于構(gòu)象變化顯著的復(fù)合物、瞬時(shí)相互作用的蛋白質(zhì)對(duì),以及存在翻譯后修飾的蛋白質(zhì)組裝體,當(dāng)前預(yù)測(cè)方法的準(zhǔn)確性仍有待提高。
三、蛋白質(zhì)復(fù)合物預(yù)測(cè)為何成為研究焦點(diǎn)?在藥物研發(fā)領(lǐng)域,蛋白質(zhì)復(fù)合物結(jié)構(gòu)預(yù)測(cè)具有特殊價(jià)值。大多數(shù)藥物靶點(diǎn)都是蛋白質(zhì)復(fù)合物,如受體-配體復(fù)合物、酶-抑制劑復(fù)合物等。準(zhǔn)確預(yù)測(cè)這些復(fù)合物的結(jié)構(gòu)能夠顯著加速藥物設(shè)計(jì)過(guò)程,提高候選化合物的篩選效率。特別是在應(yīng)對(duì)新發(fā)傳染病時(shí),快速預(yù)測(cè)病原體蛋白與宿主蛋白的相互作用模式,可為疫苗設(shè)計(jì)和抗病毒藥物開(kāi)發(fā)提供關(guān)鍵信息。
從技術(shù)發(fā)展角度看,蛋白質(zhì)復(fù)合物預(yù)測(cè)代表了該領(lǐng)域自然演進(jìn)的方向。在單蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)問(wèn)題基本解決后,復(fù)合物預(yù)測(cè)成為更具挑戰(zhàn)性且更具生物學(xué)意義的研究目標(biāo)。這一轉(zhuǎn)變也反映了計(jì)算生物學(xué)研究從基礎(chǔ)問(wèn)題向?qū)嶋H應(yīng)用拓展的趨勢(shì)。
四、新型計(jì)算方法如何推動(dòng)領(lǐng)域發(fā)展?圖神經(jīng)網(wǎng)絡(luò)為蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)提供了另一條技術(shù)路線。通過(guò)將蛋白質(zhì)表示為氨基酸節(jié)點(diǎn)和相互作用的圖結(jié)構(gòu),圖神經(jīng)網(wǎng)絡(luò)能夠有效學(xué)習(xí)蛋白質(zhì)的空間約束規(guī)則。這類方法特別適合于蛋白質(zhì)-蛋白質(zhì)相互作用界面預(yù)測(cè)和構(gòu)象集合采樣,為理解蛋白質(zhì)動(dòng)態(tài)行為提供了新的工具。
在突變效應(yīng)預(yù)測(cè)方面,計(jì)算方法正面臨新的機(jī)遇與挑戰(zhàn)。準(zhǔn)確預(yù)測(cè)氨基酸突變對(duì)蛋白質(zhì)結(jié)構(gòu)、穩(wěn)定性和功能的影響,對(duì)于理解遺傳性疾病機(jī)制、設(shè)計(jì)優(yōu)化蛋白質(zhì)藥物等都至關(guān)重要,F(xiàn)有方法在此方面的性能仍有較大提升空間,需要開(kāi)發(fā)專門(mén)針對(duì)突變效應(yīng)預(yù)測(cè)的新算法。
五、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的未來(lái)發(fā)展方向何在?動(dòng)態(tài)構(gòu)象預(yù)測(cè)是另一個(gè)關(guān)鍵方向。蛋白質(zhì)在行使功能時(shí)經(jīng)歷復(fù)雜的構(gòu)象變化,這些動(dòng)態(tài)過(guò)程對(duì)于理解蛋白質(zhì)的工作機(jī)制至關(guān)重要。開(kāi)發(fā)能夠預(yù)測(cè)蛋白質(zhì)構(gòu)象集合而不僅僅是單一靜態(tài)結(jié)構(gòu)的方法,將成為領(lǐng)域的重要突破。
與實(shí)驗(yàn)方法的深度融合也將塑造領(lǐng)域未來(lái)。盡管計(jì)算預(yù)測(cè)精度顯著提高,實(shí)驗(yàn)測(cè)定仍然是結(jié)構(gòu)生物學(xué)的金標(biāo)準(zhǔn)。開(kāi)發(fā)能夠整合稀疏實(shí)驗(yàn)數(shù)據(jù)(如 cryo-EM 密度圖、化學(xué)交聯(lián)質(zhì)譜數(shù)據(jù))的計(jì)算方法,實(shí)現(xiàn)計(jì)算與實(shí)驗(yàn)的互補(bǔ)優(yōu)勢(shì),將推動(dòng)結(jié)構(gòu)生物學(xué)研究范式的變革。
在應(yīng)用拓展方面,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)技術(shù)將更多地向藥物發(fā)現(xiàn)、酶工程設(shè)計(jì)、合成生物學(xué)等應(yīng)用領(lǐng)域滲透。特別是個(gè)性化醫(yī)療領(lǐng)域,基于患者特定基因序列預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)變異的影響,有望為精準(zhǔn)醫(yī)療提供新的技術(shù)支持。
六、當(dāng)前技術(shù)面臨哪些重要挑戰(zhàn)?算法效率與可擴(kuò)展性也是實(shí)際應(yīng)用中的瓶頸。隨著預(yù)測(cè)目標(biāo)復(fù)雜度的增加(如大型復(fù)合物、全細(xì)胞尺度建模),計(jì)算資源需求呈指數(shù)增長(zhǎng)。開(kāi)發(fā)更高效的算法,降低計(jì)算成本,將使更多研究團(tuán)隊(duì)能夠利用這些先進(jìn)工具。
標(biāo)準(zhǔn)化評(píng)估體系的完善同樣不可或缺。隨著研究重點(diǎn)轉(zhuǎn)向更復(fù)雜的問(wèn)題,需要建立相應(yīng)的評(píng)估標(biāo)準(zhǔn)和基準(zhǔn)測(cè)試集,以客觀衡量不同方法的性能并指導(dǎo)技術(shù)發(fā)展方向。特別是在臨床應(yīng)用場(chǎng)景下,預(yù)測(cè)結(jié)果的可信度評(píng)估和不確定性量化變得尤為重要。
結(jié)語(yǔ)未來(lái)發(fā)展的關(guān)鍵將在于多學(xué)科方法的深度融合,包括計(jì)算方法創(chuàng)新、實(shí)驗(yàn)技術(shù)進(jìn)步以及生物學(xué)洞見(jiàn)的指導(dǎo)。隨著這些方向的持續(xù)推進(jìn),蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)技術(shù)有望在生命科學(xué)研究和醫(yī)學(xué)應(yīng)用中發(fā)揮更加重要的作用,為理解生命的基本規(guī)律和解決人類健康問(wèn)題提供強(qiáng)大支持。
樂(lè)備實(shí)是國(guó)內(nèi)專注于提供高質(zhì)量蛋白檢測(cè)以及組學(xué)分析服務(wù)的實(shí)驗(yàn)服務(wù)專家,自2018年成立以來(lái),樂(lè)備實(shí)不斷尋求突破,公司的服務(wù)技術(shù)平臺(tái)已擴(kuò)展到單細(xì)胞測(cè)序、空間多組學(xué)、流式檢測(cè)、超敏電化學(xué)發(fā)光、Luminex多因子檢測(cè)、抗體芯片、PCR Array、ELISA、Elispot、PLA蛋白互作、多色免疫組化、DSP空間多組學(xué)等30多個(gè),建立起了一套涵蓋基因、蛋白、細(xì)胞以及組織水平實(shí)驗(yàn)的完整檢測(cè)體系。