RNA結(jié)合蛋白?(RBP)?在轉(zhuǎn)錄、RNA代謝以及翻譯過(guò)程中起重要的調(diào)控作用。CLIP實(shí)驗(yàn)技術(shù)作為RNA研究最重要的技術(shù)之一,可以解析RBP在整個(gè)轉(zhuǎn)錄組上的結(jié)合圖譜,是系統(tǒng)理解一個(gè)RBP功能及其調(diào)控機(jī)制的基礎(chǔ)。但CLIP實(shí)驗(yàn)費(fèi)時(shí)費(fèi)力,一次只能提供某一RBP在特定細(xì)胞環(huán)境下的RNA結(jié)合位點(diǎn),而且對(duì)于實(shí)驗(yàn)材料要求較高,很多情況下不能順利開展。然而研究發(fā)現(xiàn),蛋白質(zhì)和RNA的結(jié)合隨著細(xì)胞環(huán)境的變化可能發(fā)生很大的改變,因而研究蛋白質(zhì)對(duì)RNA的調(diào)控需要相同細(xì)胞環(huán)境的結(jié)合信息。這兩方面因素加起來(lái)對(duì)使用CLIP研究蛋白質(zhì)-RNA結(jié)合提出了很大的挑戰(zhàn)。從計(jì)算角度來(lái)說(shuō),目前已有的預(yù)測(cè)RBP結(jié)合位點(diǎn)的方法,毫無(wú)例外都是基于RNA序列以及從序列出發(fā)預(yù)測(cè)的RNA結(jié)構(gòu)。序列本身在不同細(xì)胞環(huán)境里面是沒有什么變化的,因而這些方法都不能解決RBP在不同細(xì)胞環(huán)境下結(jié)合動(dòng)態(tài)變化的問(wèn)題。
2021年2月23日,結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心張強(qiáng)鋒課題組在Cell Research雜志上,發(fā)表了題為Predicting dynamic cellular protein–RNA interactions by deep learning using in vivo RNA structures(使用人工智能方法基于細(xì)胞內(nèi)RNA結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)-RNA動(dòng)態(tài)相互作用)的研究長(zhǎng)文。該工作首先使用icSHAPE實(shí)驗(yàn)解析了七種常用細(xì)胞類型的RNA二級(jí)結(jié)構(gòu)圖譜,并開發(fā)人工智能算法整合實(shí)驗(yàn)獲得的細(xì)胞內(nèi)RNA結(jié)構(gòu)以及對(duì)應(yīng)細(xì)胞環(huán)境的RBP結(jié)合信息,建立了基于細(xì)胞內(nèi)RNA結(jié)構(gòu)信息預(yù)測(cè)細(xì)胞內(nèi)RBP動(dòng)態(tài)結(jié)合的新方法PrismNet(圖1)。
科研成果 | 張強(qiáng)鋒課題組開發(fā)基于細(xì)胞內(nèi)RNA結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)-RNA動(dòng)態(tài)相互作用的人工智能方法-肽度TIMEDOO科研成果 | 張強(qiáng)鋒課題組開發(fā)基于細(xì)胞內(nèi)RNA結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)-RNA動(dòng)態(tài)相互作用的人工智能方法-肽度TIMEDOO
圖1 PrismNet模型構(gòu)建以及應(yīng)用
RNA結(jié)構(gòu)是RNA功能和調(diào)控的基礎(chǔ)??蒲泄ぷ髡咄ㄟ^(guò)X射線晶體衍射、核磁共振、冷凍電子顯微鏡等方法解析了大量RNA結(jié)構(gòu),揭示了許多體外RNA結(jié)構(gòu)的重要功能。近年來(lái),通過(guò)人為引入細(xì)胞內(nèi)RNA化學(xué)修飾,開發(fā)高通量測(cè)序技術(shù),可以在全轉(zhuǎn)錄組水平檢測(cè)細(xì)胞內(nèi)的RNA二級(jí)結(jié)構(gòu)。這種新的RNA系統(tǒng)生物學(xué)的研究方法,揭示了RNA結(jié)構(gòu)參與轉(zhuǎn)錄后調(diào)控的規(guī)律和機(jī)制。張強(qiáng)鋒課題組一直致力于RNA結(jié)構(gòu)領(lǐng)域的研究。張強(qiáng)鋒研究員作為主要開發(fā)者參與開發(fā)了探測(cè)細(xì)胞內(nèi)RNA結(jié)構(gòu)和相互作用的icSHAPE技術(shù)與PARIS技術(shù)【1,2】。在此基礎(chǔ)上,通過(guò)整合亞細(xì)胞分離技術(shù),張強(qiáng)鋒課題組發(fā)現(xiàn)細(xì)胞內(nèi)RNA結(jié)構(gòu)在細(xì)胞內(nèi)不同亞細(xì)胞環(huán)境會(huì)發(fā)生動(dòng)態(tài)變化,并且RNA結(jié)構(gòu)的變化會(huì)影響RBP的結(jié)合【3】。張強(qiáng)鋒課題組與楊運(yùn)桂、劉峰課題組合作,通過(guò)斑馬魚胚胎發(fā)育過(guò)程不同階段RNA結(jié)構(gòu)動(dòng)態(tài)變化的研究,發(fā)現(xiàn)RNA結(jié)合蛋白Elavl1a及其靶標(biāo)RNA結(jié)構(gòu)變化共同作用,調(diào)控斑馬魚早期胚胎母源RNA降解的新機(jī)制【4】。在之前研究的基礎(chǔ)上,作者系統(tǒng)比較了多個(gè)RBP在K562和HepG2細(xì)胞之間結(jié)合位點(diǎn)的差異,發(fā)現(xiàn)相同RBP在不同類型細(xì)胞之間結(jié)合位點(diǎn)差異巨大。進(jìn)一步通過(guò)關(guān)聯(lián)比較兩個(gè)細(xì)胞系的全轉(zhuǎn)錄組RNA結(jié)構(gòu),作者發(fā)現(xiàn)在不同細(xì)胞系間RBP結(jié)合差異位點(diǎn)顯著富集在RNA結(jié)構(gòu)差異位點(diǎn)。這顯示了RNA結(jié)構(gòu)信息對(duì)不同細(xì)胞內(nèi)RBP結(jié)合位點(diǎn)的預(yù)測(cè)具有重要作用。

作者通過(guò)整合細(xì)胞內(nèi)RNA結(jié)構(gòu)信息以及對(duì)應(yīng)細(xì)胞系的RBP結(jié)合信息,利用深度神經(jīng)網(wǎng)絡(luò),構(gòu)建了預(yù)測(cè)RBP結(jié)合位點(diǎn)的PrismNet模型。該模型在168個(gè)人類RBP結(jié)合的CLIP數(shù)據(jù)集上進(jìn)行了訓(xùn)練學(xué)習(xí)和檢驗(yàn),發(fā)現(xiàn)其預(yù)測(cè)準(zhǔn)確率顯著高于之前僅僅利用RNA序列以及整合基于序列預(yù)測(cè)得到的RNA結(jié)構(gòu)的方法,預(yù)測(cè)和CLIP實(shí)驗(yàn)結(jié)果的吻合度甚至達(dá)到或超過(guò)同一條件下兩個(gè)CLIP實(shí)驗(yàn)的吻合度(圖2)。顯然,細(xì)胞內(nèi)RNA結(jié)構(gòu)信息對(duì)于預(yù)測(cè)準(zhǔn)確率的提高起到了重要作用。有意思的是,作者發(fā)現(xiàn)RNA結(jié)構(gòu)信息對(duì)于提高雙鏈結(jié)合蛋白預(yù)測(cè)準(zhǔn)確率的幫助更大。

科研成果 | 張強(qiáng)鋒課題組開發(fā)基于細(xì)胞內(nèi)RNA結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)-RNA動(dòng)態(tài)相互作用的人工智能方法-肽度TIMEDOO
圖2 PrismNet與其他方法預(yù)測(cè)準(zhǔn)確性比較。A,PrismNet與其他方法預(yù)測(cè)IGF2BP1在EIF3F轉(zhuǎn)錄本上的結(jié)合。B-D,PrismNet與其他方法比較(B-C)以及不同數(shù)據(jù)訓(xùn)練模型的預(yù)測(cè)準(zhǔn)確性(D)。
利用深度學(xué)習(xí)模型中的注意力機(jī)制,作者提取了RBP結(jié)合RNA的關(guān)鍵識(shí)別位點(diǎn),構(gòu)建了序列與結(jié)構(gòu)的整合motif來(lái)描述RBP結(jié)合位點(diǎn)的RNA序列和結(jié)構(gòu)偏好。長(zhǎng)久以來(lái),人們都依賴于傳統(tǒng)的序列motif來(lái)刻畫RBP結(jié)合RNA的特征,對(duì)于同樣重要的結(jié)合位點(diǎn)的結(jié)構(gòu)特征,由于信息缺乏,只能選擇忽略。這里的工作表明,和人們的期望一樣,序列與結(jié)構(gòu)整合motif可以更全面地體現(xiàn)RBP的結(jié)合特征,可以用在通過(guò)簡(jiǎn)單的motif匹配,方便快捷地在整個(gè)轉(zhuǎn)錄組中更準(zhǔn)確地找到RBP的結(jié)合位點(diǎn)。有意思的是,這些通過(guò)PrismNet找到的RBP結(jié)合RNA的關(guān)鍵識(shí)別位點(diǎn)比其它轉(zhuǎn)錄本區(qū)域更加保守,同時(shí)也更加富集包括自閉癥,精神分裂癥等精神類疾病的突變位點(diǎn)。同時(shí),作者發(fā)現(xiàn),相對(duì)于RNA結(jié)構(gòu)沒有改變的突變位點(diǎn),造成RNA結(jié)構(gòu)改變的突變位點(diǎn)?(riboSNitch)?更容易造成疾病。這些研究暗示了PrismNet模型未來(lái)在研究RBP結(jié)合、RNA結(jié)構(gòu)變化在疾病中作用的潛在應(yīng)用價(jià)值。

RBP和RNA研究領(lǐng)域內(nèi)多年的積累,產(chǎn)生了大約200個(gè)基于CLIP實(shí)驗(yàn)的RBP轉(zhuǎn)錄組結(jié)合圖譜,是研究RNA調(diào)控的重要資源。PrismNet的一個(gè)重要應(yīng)用價(jià)值在于大大擴(kuò)充了這個(gè)資源。比如,對(duì)于任意一個(gè)RBP,只要在這七個(gè)細(xì)胞系的任意一個(gè)細(xì)胞系內(nèi)做了CLIP實(shí)驗(yàn),PrismNet就可以通過(guò)構(gòu)建準(zhǔn)確的深度神經(jīng)網(wǎng)絡(luò)模型,把結(jié)合信息外推到所有七個(gè)細(xì)胞系中。對(duì)該研究所產(chǎn)生的大量細(xì)胞內(nèi)RNA結(jié)構(gòu)、所預(yù)測(cè)的不同RBP結(jié)合位點(diǎn)的信息資源,作者提供了查詢以及下載網(wǎng)站(http://prismnet.zhanglab.net/)供其他研究組訪問(wèn)和使用。

最后要提到的是,張強(qiáng)鋒研究組利用PrismNet模型,使用新冠病毒SARS-CoV-2在宿主細(xì)胞內(nèi)的RNA基因組結(jié)構(gòu)信息,預(yù)測(cè)了多個(gè)新冠病毒的宿主結(jié)合蛋白;從這些宿主蛋白出發(fā),找到了一些對(duì)抑制新冠傳播有效的重定位藥物【5】。這個(gè)研究再次證明了PrismNet的廣闊應(yīng)用前景。

據(jù)悉,清華大學(xué)生命學(xué)院博士后孫磊、博士生徐魁、博士生黃文澤等為論文第一作者,結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心張強(qiáng)鋒研究員為論文通訊作者。課題組其他成員李盼、唐磊、熊團(tuán)林博士、樸美玲博士等為本研究做出了重要貢獻(xiàn)。清華大學(xué)醫(yī)學(xué)院沈曉驊實(shí)驗(yàn)室尹亞飛博士、紀(jì)家葵實(shí)驗(yàn)室王楠提供了相關(guān)細(xì)胞系。香港中文大學(xué)王曉剛教授與邵靜博士為深度學(xué)習(xí)模型設(shè)計(jì)提供了寶貴建議。商湯研究院在GPU計(jì)算設(shè)施上提供了幫助。

原文鏈接
https://www.nature.com/articles/s41422-021-00476-y.pdf
參考文獻(xiàn)
1.?Lu, Z., Zhang, Q.C., Lee, B., Flynn, R.A., Smith, M.A., Robinson, J.T., Davidovich, C., Gooding, A.R., Goodrich, K.J., Mattick, J.S., et al. (2016). RNA Duplex Map in Living Cells Reveals Higher-Order Transcriptome Structure.?Cell?165, 1267-1279.2. Spitale, R.C., Flynn, R.A., Zhang, Q.C., Crisalli, P., Lee, B., Jung, J.W., Kuchelmeister, H.Y., Batista, P.J., Torre, E.A., Kool, E.T., et al. (2015). Structural imprints in vivo decode RNA regulatory mechanisms.?Nature?519, 486-490.

3. Sun, L., Fazal, F.M., Li, P., Broughton, J.P., Lee, B., Tang, L., Huang, W., Kool, E.T., Chang, H.Y., and Zhang, Q.C. (2019). RNA structure maps across mammalian cellular compartments.?Nature structural & molecular biology?26, 322-330.

4. Shi, B., Zhang, J., Heng, J., Gong, J., Zhang, T., Li, P., Sun, B.F., Yang, Y., Zhang, N., Zhao, Y.L., et al. (2020). RNA structural dynamics regulate early embryogenesis through controlling transcriptome fate and function.?Genome Biol?21, 120.

5. Sun, L., Li, P., Ju, X., Rao, J., Huang, W., Zhang, S., Xiong, T., Xu, K., Zhou, X., Ren, L., et al. (2021). In vivo structural characterization of the whole SARS-CoV-2 RNA genome identifies host cell target proteins vulnerable to re-purposed drugs. Cell

https://doi.org/10.1016/j.cell.2021.02.008.

來(lái)源:結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心