導(dǎo)讀
近年來,RNA修飾的研究已成為當(dāng)今生命科學(xué)領(lǐng)域最前沿最熱門的研究方向之一,不斷有CNS的文章問世,m5C RNA修飾的分子機(jī)理研究越來越清晰,也不斷有學(xué)者探尋如何更全面的獲得貼近真實(shí)的m5C修飾的原貌。近期,來自德國的Frank Lyko和Mark Helm團(tuán)隊(duì)在GENOME RESEARCH(IF=11.922)上發(fā)表一篇題為“Statistically robust methylation calling for whole-transcriptome bisulfite sequencing reveals distinct methylation patterns for mouse RNAs” 的文章。在本文中,他們運(yùn)用了綜合的甲基化分析方法檢測了小鼠胚胎干細(xì)胞中tRNAs、rRNAs和mRNAs的m5C修飾。
文中指出,基于重亞硫酸鹽轉(zhuǎn)換的技術(shù)是檢測m5C修飾的經(jīng)典方法,而二代測序?yàn)榇颂峁┝藱z測轉(zhuǎn)錄組水平整體修飾圖譜的機(jī)會(huì)。將m5C RNA修飾位點(diǎn)直接匹配到其天然序列上的方法目前僅由基于重亞硫酸鹽處理的轉(zhuǎn)錄組測序提供。(Schaefer et al. 2009)。 這一測序原理是選擇性脫氨基:把那些非甲基化的胞嘧啶(C)轉(zhuǎn)化為尿嘧啶(U),然后通過二代測揭示甲基化相關(guān)序列多態(tài)性。
在本研究中,研究者通過基于重亞硫酸鹽轉(zhuǎn)換的全轉(zhuǎn)錄組測序發(fā)現(xiàn)了所有已知的tRNA甲基化位點(diǎn)及兩個(gè)以往未知的但是在28S rRNA中進(jìn)化保守的位點(diǎn)。此外,他們發(fā)現(xiàn)mRNAs的甲基化位點(diǎn)稀疏或完全不甲基化。研究者稱他們的方法可用于許多實(shí)驗(yàn)中描述m5C RNA甲基化模式探索,幫助我們更深的理解RNA生物學(xué)和人類疾病中m5C RNA甲基化的功能。
1. 基于重亞硫酸鹽轉(zhuǎn)換的m5C RNA甲基化全轉(zhuǎn)錄組測序
研究者建立了一套自己的完整分析流程,對小鼠胚胎干細(xì)胞進(jìn)行了基于重亞硫酸鹽處理的m5C RNA甲基化全轉(zhuǎn)錄組測序。他們將總RNA樣本分為小RNA(<200nt)和長RNA(>200nt)的兩個(gè)部分;谑欠褚獧z測樣本內(nèi)的rRNA,一個(gè)去除rRNA的步驟被選擇性地添加。長RNA部分還進(jìn)行了進(jìn)一步的片段化以滿足Illumina測序流程。在進(jìn)行深度測序之前,兩個(gè)部分的RNA都用DNase處理,隨后進(jìn)過重亞硫酸鹽轉(zhuǎn)化,末端補(bǔ)齊加接頭以進(jìn)行cDNA文庫構(gòu)建。經(jīng)過詳細(xì)質(zhì)控和測序比對數(shù)據(jù)庫后,得到一系列原始數(shù)據(jù)。考慮到候選RNA甲基化位點(diǎn)的不完全轉(zhuǎn)化,他們設(shè)置了一套專門的數(shù)據(jù)過濾條件。在甲基化peak calling階段,每個(gè)樣本都進(jìn)行了泊松分布,并計(jì)算非轉(zhuǎn)換率p值。最后,對3個(gè)生物學(xué)重復(fù)都進(jìn)行了計(jì)算,并計(jì)算一個(gè)綜合的非轉(zhuǎn)換率p值。
圖1:基于重亞硫酸鹽處理的m5C RNA甲基化全轉(zhuǎn)錄組測序示意圖
2. 對第一個(gè)文庫原始數(shù)據(jù)進(jìn)行mRNA相關(guān)甲基化位點(diǎn)分析
研究者發(fā)現(xiàn)大部分的胞嘧啶的轉(zhuǎn)化率都>90%.為了進(jìn)一步分析那些未轉(zhuǎn)化的胞嘧啶reads,他們設(shè)置了一個(gè)泊松參數(shù)λp,計(jì)為在每個(gè)覆蓋范圍層內(nèi)(10X-1200X)未轉(zhuǎn)化胞嘧啶的計(jì)數(shù)Nn;并計(jì)算了一個(gè)比率r=λp/(Nn+Nc),其中Nc為轉(zhuǎn)化的胞嘧啶計(jì)數(shù),N= Nn+Nc為覆蓋范圍層(coverage)。在隨后的步驟中,他們比較了非轉(zhuǎn)化率和非轉(zhuǎn)化率高于λp/coverage的每個(gè)胞嘧啶位點(diǎn)的基礎(chǔ)分布。在3,338,384個(gè)胞嘧啶中,53,510個(gè)未轉(zhuǎn)化率高于或等于0.2,這和前人的發(fā)現(xiàn)一致。然而在Benjamini-Hochberg糾正多重測試后,53,510個(gè)胞嘧啶中只有266個(gè)符合p<0.05。大量的未符合p值的數(shù)據(jù)說明,在整個(gè)轉(zhuǎn)錄本組氨酸亞基測序數(shù)據(jù)集的分析中需要統(tǒng)計(jì)方法來衡量。他們的這套泊松參數(shù)方法在對3個(gè)生物學(xué)重復(fù)的數(shù)據(jù)都進(jìn)行了非轉(zhuǎn)化率數(shù)據(jù)過濾后得到肯定。
圖2:對小鼠ES細(xì)胞mRNA的測序結(jié)果數(shù)據(jù)分析
3. 對泊松檢驗(yàn)數(shù)據(jù)分析法的進(jìn)一步衡量
為了評估這一統(tǒng)計(jì)學(xué)分析方法的I型誤差,他們還通過模擬幾百個(gè)隨機(jī)未轉(zhuǎn)換胞嘧啶的實(shí)例來評估由泊松檢驗(yàn)產(chǎn)生的假陽性的比例。結(jié)果就是這套分析方法能夠可靠地(統(tǒng)計(jì)功率= 99.9±0.04%)檢測到在20X以上的非轉(zhuǎn)換率低至20%的位點(diǎn)。 在他們的測序數(shù)據(jù)集中,> 50%的胞嘧啶殘基的覆蓋度> 20X,因此顯示出足夠的統(tǒng)計(jì)功效。
然而,盡管在進(jìn)行了泊松檢驗(yàn)方法后,一些候選位點(diǎn)依然不能被認(rèn)為是真正的甲基化位點(diǎn)。為了進(jìn)一步驗(yàn)證候選甲基化位點(diǎn)的可重復(fù)檢出性,他們挑選了10個(gè)候選位點(diǎn),這些位點(diǎn)有著最小的標(biāo)準(zhǔn)化p值,以及補(bǔ)充了4個(gè)額外的候選位點(diǎn),他們的甲基化水平幾近于1.0并且p值達(dá)到顯著標(biāo)準(zhǔn)。這14個(gè)位點(diǎn)被用于擴(kuò)增子重測序。結(jié)果表明這14個(gè)位點(diǎn)中有4個(gè)并沒有發(fā)生甲基化修飾。這再一次證明有極低一部分候選甲基化位點(diǎn)有一定的假陽性。
圖3:進(jìn)一步的數(shù)據(jù)分析
4. LC-MS/MS檢測mRNA的整體甲基化水平
接下來,研究者用LC-MS/MS技術(shù)檢測mRNA的整體甲基化水平?俁NA經(jīng)過連續(xù)的兩輪polyA-seleciton富集出mRNA,去除小RNA,連續(xù)兩輪去除rRNA。每一步都取樣進(jìn)行RNA-seq看三種RNA的組成,并用LC-MS/MS看堿基改變。RNA-seq的結(jié)果顯示這一分流過程富集到越來越多的mRNA。然而在最后一步富集仍然檢測到了7.1%的rRNA,這可能是由于不完全的rRNA碎片去除。LC-MS/MS的結(jié)果說明隨著富集的進(jìn)行,m5C修飾劇烈減少,并且和測序觀察到的rRNA去除密切相關(guān)。此外,他們沒有檢測到任何的mRNA 5-羥甲基化修飾。使用果蠅S2細(xì)胞進(jìn)行同樣的檢測,得到相似的結(jié)果。這顯然與前人的研究相悖,這一實(shí)驗(yàn)的結(jié)果也揭示mRNA的m5C甲基化修飾非常稀疏甚至是完全不甲基化。
圖4:LC-MS/MS檢測mRNA的整體甲基化水平
5. LC-MS/MS檢測mRNA的整體甲基化水平
接下來,研究者用LC-MS/MS技術(shù)檢測mRNA的整體甲基化水平。總RNA經(jīng)過連續(xù)的兩輪polyA-seleciton富集出mRNA,去除小RNA,連續(xù)兩輪去除rRNA。每一步都取樣進(jìn)行RNA-seq看三種RNA的組成,并用LC-MS/MS看堿基改變。RNA-seq的結(jié)果顯示這一分流過程富集到越來越多的mRNA。然而在最后一步富集仍然檢測到了7.1%的rRNA,這可能是由于不完全的rRNA碎片去除。LC-MS/MS的結(jié)果說明隨著富集的進(jìn)行,m5C修飾劇烈減少,并且和測序觀察到的rRNA去除密切相關(guān)。此外,他們沒有檢測到任何的mRNA 5-羥甲基化修飾。使用果蠅S2細(xì)胞進(jìn)行同樣的檢測,得到相似的結(jié)果。這顯然與前人的研究相悖,這一實(shí)驗(yàn)的結(jié)果也揭示mRNA的m5C甲基化修飾非常稀疏甚至是完全不甲基化。
圖5:比較mRNA、rRNA、tRNA3種RNA的甲基化水平
6. 運(yùn)用泊松檢驗(yàn)法檢測m5C相關(guān)甲基化酶的影響
研究者最后對RNA m5C酶特異性表征進(jìn)行了檢測;谛麻_發(fā)的計(jì)算流程,以提供特定類型RNA的標(biāo)準(zhǔn)分析,并比較不同基因型之間的甲基化模式。他們按照存在或不存在tRNA甲基轉(zhuǎn)移酶DNMT2,確定了對tRNA,rRNA和mRNA甲基化水平的影響。結(jié)果顯示DNMT2是一個(gè)高度特異性的酶,DNMT2突變的一組數(shù)據(jù)顯示,tRNA(Asp)、tRNA(Gly)和tRNA(Val)中C38位點(diǎn)的甲基化修飾缺失。rRNA的分析則揭示了28S rRNA中存在2個(gè)新的完全甲基化的胞嘧啶,即C3438和C4099。
圖6:散點(diǎn)圖顯示野生型和DNMT2敲除小鼠ES細(xì)胞中tRNA(A),rRNA(B),mRNA(C)的未轉(zhuǎn)化胞嘧啶
小結(jié):本文確定了全轉(zhuǎn)錄組重亞硫酸鹽測序?yàn)閙5C RNA甲基化單堿基分析最為可靠方法,并表明tRNA,rRNA和mRNA上m5C甲基化模式存在巨大差異,預(yù)測其與不同RNA行使特定生理功能密切相關(guān)。
作者簡介:
Frank Lyko教授,博士,任職于德國海德堡大學(xué)德國癌癥研究中心(DKFZ)表觀遺傳組,發(fā)表文章學(xué)科類別細(xì)胞生物學(xué)和腫瘤生物學(xué),主要研究方向?yàn)榘籽。?995年至今總計(jì)發(fā)表92篇sci article,19篇綜述,2篇short survey,2篇letter,共計(jì)被引用8719次,主要涉及到DNA、RNA的表觀修飾、甲基化修飾及甲基化轉(zhuǎn)移酶等。曾獲諾華基礎(chǔ)藥理研究獎(jiǎng)等。
參考文獻(xiàn):Statistically robust methylation calling for whole-transcriptome bisulfite sequencing reveals distinct methylation patterns for mouse RNAs
云序相關(guān)推薦
m6A RNA甲基化測序
m5C RNA甲基化測序
全轉(zhuǎn)錄組測序
上海云序生物科技有限公司
Shanghai Cloud-seq Biotech Co.,Ltd
地址:上海市漕河涇高新技術(shù)開發(fā)區(qū)欽州北路1066弄71號樓6樓
電話:021-64878766
網(wǎng)站:www.cloud-seq.com.cn
郵箱:market@cloud-seq.com.cn