中國科學(xué)院遺傳與發(fā)育生物學(xué)研究所高彩霞研究組開創(chuàng)性地運用AI輔助結(jié)構(gòu)預(yù)測,建立起基于三級結(jié)構(gòu)的蛋白聚類方法,并擴展為全新的脫氨酶挖掘體系,開發(fā)了一系列具有中國自主知識產(chǎn)權(quán)的新型堿基編輯工具。該工作為蛋白功能分析、新功能元件挖掘提供了全新策略。新研發(fā)的堿基編輯系統(tǒng)具有我國自主知識產(chǎn)權(quán)的精準(zhǔn)基因編輯技術(shù)(已申請PCT發(fā)明專利)。6月27日,相關(guān)研究成果發(fā)表在《細胞》上。

蛋白質(zhì)是生命活動的主要承擔(dān)者。對蛋白質(zhì)進行功能聚類,是探索其參與的生理過程、設(shè)計新型蛋白質(zhì)等的重要手段?,F(xiàn)有的方法主要基于氨基酸一級序列的相似性對蛋白質(zhì)進行聚類分析,并以此推斷其功能和演化關(guān)系。然而,蛋白質(zhì)功能由其三維空間結(jié)構(gòu)所決定,開發(fā)基于三維結(jié)構(gòu)的高通量蛋白質(zhì)聚類方法,將為蛋白質(zhì)功能研究提供更直接、可靠的手段,并推動未知蛋白質(zhì)的功能挖掘。

堿基編輯系統(tǒng)可以實現(xiàn)單核苷酸精度的DNA或RNA精準(zhǔn)編輯,是基因功能研究、疾病治療、生物育種的變革性技術(shù)。然而,現(xiàn)有堿基編輯系統(tǒng)的核心元件脫氨酶來源于單一家族,導(dǎo)致堿基編輯仍有諸多局限,編輯尚難以滿足多元化的應(yīng)用需求。因此,創(chuàng)新地挖掘新型脫氨酶,開發(fā)適用于不同應(yīng)用場景的新型堿基編輯工具顯得尤為重要。

為解決上述問題,高彩霞研究組創(chuàng)新性地運用AI輔助的大規(guī)模蛋白結(jié)構(gòu)預(yù)測,建立起全新的基于三級結(jié)構(gòu)的高通量蛋白聚類方法,實現(xiàn)了脫氨酶功能結(jié)構(gòu)的深入挖掘,鑒定到完全區(qū)別于已知脫氨工具酶的全新底盤元件,并開發(fā)了一系列具有我國自主知識產(chǎn)權(quán)的新型堿基編輯工具。

研究人員通過蛋白質(zhì)結(jié)構(gòu)預(yù)測模型AlphaFold2對具有代表性的脫氨功能序列進行批量三維結(jié)構(gòu)預(yù)測,進一步創(chuàng)新性地開展了基于三維結(jié)構(gòu)的蛋白質(zhì)多重比對與聚類,將潛在的脫氨酶劃分為20個不同的分支。除已報道的APOBEC/AID胞嘧啶脫氨酶外,研究檢測到5個結(jié)構(gòu)、序列全新的具有活性的胞嘧啶脫氨酶分支。在這些分支中,研究對具有類DddA(Double-stranded DNA deaminase toxin A-like)脫氨結(jié)構(gòu)域的蛋白進行進一步結(jié)構(gòu)聚類和功能驗證發(fā)現(xiàn),除以前推測的具有雙鏈DNA脫氨活性的蛋白外,該分支還包含了大量只具有單鏈DNA脫氨活性的蛋白,這顛覆了之前對該類蛋白功能的認知。上述研究表明,當(dāng)?shù)鞍准系男蛄型葱暂^低且功能多樣時,相比于傳統(tǒng)的基于氨基酸一級序列的聚類方法,通過AI輔助的蛋白質(zhì)結(jié)構(gòu)聚類能夠得到更準(zhǔn)確的結(jié)果。因此,該方法為蛋白質(zhì)功能分析和挖掘提供了高效、可靠的新策略。

科研人員基于上述進一步聚類的結(jié)果,全新鑒定到45個單鏈胞嘧啶脫氨酶(Sdd)和13個雙鏈胞嘧啶脫氨酶(Ddd)。這些脫氨酶是目前唯一全部來自于原核生物(細菌)的脫氨酶,而現(xiàn)有APOBEC/AID脫氨酶家族成員均來自真核生物(主要包括人、哺乳動物或魚類)。研究人員基于這些脫氨酶開發(fā)了一系列新型堿基編輯系統(tǒng),并在動、植物細胞中進行測試。結(jié)果表明,新開發(fā)的基于Ddd1和Ddd9脫氨酶的雙鏈堿基編輯系統(tǒng)克服了常規(guī)編輯器對GC序列編輯效率明顯降低的缺陷;基于Sdd7和Sdd3的單鏈堿基編輯系統(tǒng)展現(xiàn)出了非常高的編輯活性,在GC序列同樣具有可觀的堿基編輯能力;基于Sdd6的單鏈堿基編輯系統(tǒng)則展現(xiàn)出了極高的特異性,幾乎檢測不到脫靶事件。研究進一步通過蛋白理性設(shè)計和功能驗證,開發(fā)了新型的可被單個腺相關(guān)病毒(AAV)包被的Sdd6-CBE堿基編輯器,在小鼠細胞系中獲得高達43.1%的編輯效率,解決了常規(guī)堿基編輯器過大而無法被腺病毒顆包被遞送的難題。此外,針對大豆中長期存在堿基編輯效率低下的問題,該團隊新開發(fā)了Sdd7-CBE系統(tǒng),在154株大豆陽性苗中獲得了34株穩(wěn)定編輯的植株,編輯效率高達22.1%。該研究突破了現(xiàn)有脫氨酶的應(yīng)用瓶頸,展現(xiàn)出新型堿基編輯系統(tǒng)在醫(yī)學(xué)和農(nóng)業(yè)方面廣泛的應(yīng)用前景。

研究工作得到國家自然科學(xué)基金、國家重點研發(fā)計劃和中國科學(xué)院戰(zhàn)略性先導(dǎo)科技專項等的支持。

中科院通過創(chuàng)新蛋白聚類方法開發(fā)新型堿基編輯工具-肽度TIMEDOO

基于AI輔助的蛋白結(jié)構(gòu)聚類挖掘脫氨酶并開發(fā)具有新特性的堿基編輯系統(tǒng)

來源:中科院