導讀
近年來,RNA修飾的研究已成為當今生命科學領域最前沿最熱門的研究方向之一,不斷有CNS的文章問世,m5C RNA修飾的分子機理研究越來越清晰,也不斷有學者探尋如何更全面的獲得貼近真實的m5C修飾的原貌。近期,來自德國的Frank Lyko和Mark Helm團隊在GENOME RESEARCH(IF=11.922)上發(fā)表一篇題為“Statistically robust methylation calling for whole-transcriptome bisulfite sequencing reveals distinct methylation patterns for mouse RNAs” 的文章。在本文中,他們運用了綜合的甲基化分析方法檢測了小鼠胚胎干細胞中tRNAs、rRNAs和mRNAs的m5C修飾。
文中指出,基于重亞硫酸鹽轉換的技術是檢測m5C修飾的經典方法,而二代測序為此提供了檢測轉錄組水平整體修飾圖譜的機會。將m5C RNA修飾位點直接匹配到其天然序列上的方法目前僅由基于重亞硫酸鹽處理的轉錄組測序提供。(Schaefer et al. 2009)。 這一測序原理是選擇性脫氨基:把那些非甲基化的胞嘧啶(C)轉化為尿嘧啶(U),然后通過二代測揭示甲基化相關序列多態(tài)性。
在本研究中,研究者通過基于重亞硫酸鹽轉換的全轉錄組測序發(fā)現了所有已知的tRNA甲基化位點及兩個以往未知的但是在28S rRNA中進化保守的位點。此外,他們發(fā)現mRNAs的甲基化位點稀疏或完全不甲基化。研究者稱他們的方法可用于許多實驗中描述m5C RNA甲基化模式探索,幫助我們更深的理解RNA生物學和人類疾病中m5C RNA甲基化的功能。
1. 基于重亞硫酸鹽轉換的m5C RNA甲基化全轉錄組測序
研究者建立了一套自己的完整分析流程,對小鼠胚胎干細胞進行了基于重亞硫酸鹽處理的m5C RNA甲基化全轉錄組測序。他們將總RNA樣本分為小RNA(<200nt)和長RNA(>200nt)的兩個部分。基于是否要檢測樣本內的rRNA,一個去除rRNA的步驟被選擇性地添加。長RNA部分還進行了進一步的片段化以滿足Illumina測序流程。在進行深度測序之前,兩個部分的RNA都用DNase處理,隨后進過重亞硫酸鹽轉化,末端補齊加接頭以進行cDNA文庫構建。經過詳細質控和測序比對數據庫后,得到一系列原始數據。考慮到候選RNA甲基化位點的不完全轉化,他們設置了一套專門的數據過濾條件。在甲基化peak calling階段,每個樣本都進行了泊松分布,并計算非轉換率p值。最后,對3個生物學重復都進行了計算,并計算一個綜合的非轉換率p值。
圖1:基于重亞硫酸鹽處理的m5C RNA甲基化全轉錄組測序示意圖
2. 對第一個文庫原始數據進行mRNA相關甲基化位點分析
研究者發(fā)現大部分的胞嘧啶的轉化率都>90%.為了進一步分析那些未轉化的胞嘧啶reads,他們設置了一個泊松參數λp,計為在每個覆蓋范圍層內(10X-1200X)未轉化胞嘧啶的計數Nn;并計算了一個比率r=λp/(Nn+Nc),其中Nc為轉化的胞嘧啶計數,N= Nn+Nc為覆蓋范圍層(coverage)。在隨后的步驟中,他們比較了非轉化率和非轉化率高于λp/coverage的每個胞嘧啶位點的基礎分布。在3,338,384個胞嘧啶中,53,510個未轉化率高于或等于0.2,這和前人的發(fā)現一致。然而在Benjamini-Hochberg糾正多重測試后,53,510個胞嘧啶中只有266個符合p<0.05。大量的未符合p值的數據說明,在整個轉錄本組氨酸亞基測序數據集的分析中需要統(tǒng)計方法來衡量。他們的這套泊松參數方法在對3個生物學重復的數據都進行了非轉化率數據過濾后得到肯定。
圖2:對小鼠ES細胞mRNA的測序結果數據分析
3. 對泊松檢驗數據分析法的進一步衡量
為了評估這一統(tǒng)計學分析方法的I型誤差,他們還通過模擬幾百個隨機未轉換胞嘧啶的實例來評估由泊松檢驗產生的假陽性的比例。結果就是這套分析方法能夠可靠地(統(tǒng)計功率= 99.9±0.04%)檢測到在20X以上的非轉換率低至20%的位點。 在他們的測序數據集中,> 50%的胞嘧啶殘基的覆蓋度> 20X,因此顯示出足夠的統(tǒng)計功效。
然而,盡管在進行了泊松檢驗方法后,一些候選位點依然不能被認為是真正的甲基化位點。為了進一步驗證候選甲基化位點的可重復檢出性,他們挑選了10個候選位點,這些位點有著最小的標準化p值,以及補充了4個額外的候選位點,他們的甲基化水平幾近于1.0并且p值達到顯著標準。這14個位點被用于擴增子重測序。結果表明這14個位點中有4個并沒有發(fā)生甲基化修飾。這再一次證明有極低一部分候選甲基化位點有一定的假陽性。
圖3:進一步的數據分析
4. LC-MS/MS檢測mRNA的整體甲基化水平
接下來,研究者用LC-MS/MS技術檢測mRNA的整體甲基化水平?俁NA經過連續(xù)的兩輪polyA-seleciton富集出mRNA,去除小RNA,連續(xù)兩輪去除rRNA。每一步都取樣進行RNA-seq看三種RNA的組成,并用LC-MS/MS看堿基改變。RNA-seq的結果顯示這一分流過程富集到越來越多的mRNA。然而在最后一步富集仍然檢測到了7.1%的rRNA,這可能是由于不完全的rRNA碎片去除。LC-MS/MS的結果說明隨著富集的進行,m5C修飾劇烈減少,并且和測序觀察到的rRNA去除密切相關。此外,他們沒有檢測到任何的mRNA 5-羥甲基化修飾。使用果蠅S2細胞進行同樣的檢測,得到相似的結果。這顯然與前人的研究相悖,這一實驗的結果也揭示mRNA的m5C甲基化修飾非常稀疏甚至是完全不甲基化。
圖4:LC-MS/MS檢測mRNA的整體甲基化水平
5. LC-MS/MS檢測mRNA的整體甲基化水平
接下來,研究者用LC-MS/MS技術檢測mRNA的整體甲基化水平?俁NA經過連續(xù)的兩輪polyA-seleciton富集出mRNA,去除小RNA,連續(xù)兩輪去除rRNA。每一步都取樣進行RNA-seq看三種RNA的組成,并用LC-MS/MS看堿基改變。RNA-seq的結果顯示這一分流過程富集到越來越多的mRNA。然而在最后一步富集仍然檢測到了7.1%的rRNA,這可能是由于不完全的rRNA碎片去除。LC-MS/MS的結果說明隨著富集的進行,m5C修飾劇烈減少,并且和測序觀察到的rRNA去除密切相關。此外,他們沒有檢測到任何的mRNA 5-羥甲基化修飾。使用果蠅S2細胞進行同樣的檢測,得到相似的結果。這顯然與前人的研究相悖,這一實驗的結果也揭示mRNA的m5C甲基化修飾非常稀疏甚至是完全不甲基化。
圖5:比較mRNA、rRNA、tRNA3種RNA的甲基化水平
6. 運用泊松檢驗法檢測m5C相關甲基化酶的影響
研究者最后對RNA m5C酶特異性表征進行了檢測;谛麻_發(fā)的計算流程,以提供特定類型RNA的標準分析,并比較不同基因型之間的甲基化模式。他們按照存在或不存在tRNA甲基轉移酶DNMT2,確定了對tRNA,rRNA和mRNA甲基化水平的影響。結果顯示DNMT2是一個高度特異性的酶,DNMT2突變的一組數據顯示,tRNA(Asp)、tRNA(Gly)和tRNA(Val)中C38位點的甲基化修飾缺失。rRNA的分析則揭示了28S rRNA中存在2個新的完全甲基化的胞嘧啶,即C3438和C4099。
圖6:散點圖顯示野生型和DNMT2敲除小鼠ES細胞中tRNA(A),rRNA(B),mRNA(C)的未轉化胞嘧啶
小結:本文確定了全轉錄組重亞硫酸鹽測序為m5C RNA甲基化單堿基分析最為可靠方法,并表明tRNA,rRNA和mRNA上m5C甲基化模式存在巨大差異,預測其與不同RNA行使特定生理功能密切相關。
作者簡介:
Frank Lyko教授,博士,任職于德國海德堡大學德國癌癥研究中心(DKFZ)表觀遺傳組,發(fā)表文章學科類別細胞生物學和腫瘤生物學,主要研究方向為白血病。從1995年至今總計發(fā)表92篇sci article,19篇綜述,2篇short survey,2篇letter,共計被引用8719次,主要涉及到DNA、RNA的表觀修飾、甲基化修飾及甲基化轉移酶等。曾獲諾華基礎藥理研究獎等。
參考文獻:Statistically robust methylation calling for whole-transcriptome bisulfite sequencing reveals distinct methylation patterns for mouse RNAs
云序相關推薦
m6A RNA甲基化測序
m5C RNA甲基化測序
全轉錄組測序
上海云序生物科技有限公司
Shanghai Cloud-seq Biotech Co.,Ltd
地址:上海市漕河涇高新技術開發(fā)區(qū)欽州北路1066弄71號樓6樓
電話:021-64878766
網站:www.cloud-seq.com.cn
郵箱:market@cloud-seq.com.cn