設(shè)置重復(fù)樣本的重要意義:測序無法消除個體間基因表達(dá)水平的差異
瀏覽次數(shù):464 發(fā)布日期:2023-4-12
來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)
二代測序及基因芯片技術(shù)使得過去的十多年涌現(xiàn)出大量關(guān)于RNA-seq的研究。但似乎一些研究人員沒有注意到,基因表達(dá)的異質(zhì)性不僅僅是由技術(shù)誤差導(dǎo)致的。基因表達(dá)是一個相對隨機(jī)的過程,同一類型樣本中的不同個體,基因的表達(dá)可能會不一樣。一般來說,基因表達(dá)的異質(zhì)性(Var(Expr))可以被分解為以下三個部分:
Var(Expr) = Across Group Variability + Measurement Error + Biological Variability
Across Group Variability即由于不同的處理或不同的細(xì)胞類型等導(dǎo)致的表達(dá)水平差異,即通常所說的組間差異。例如,腫瘤樣本與正常樣本之間的表達(dá)差異。
Measurement Error指實(shí)驗(yàn)或測序過程中的技術(shù)誤差。技術(shù)誤差會導(dǎo)致一定的基因表達(dá)異質(zhì)性,但其可以通過對同一樣本進(jìn)行多次實(shí)驗(yàn)/測序(即技術(shù)重復(fù))來消除。
Biological Variability指同一分組的不同樣本之間的表達(dá)差異。即使排除掉Measurement Error,這種樣本間的表達(dá)差異也是存在的,即無法通過測序來消除Biological Variability。
在實(shí)驗(yàn)設(shè)計(jì)中,如果關(guān)注的是組間差異(Across Group Variability),那么Measurement Error和Biological Variability就會成為影響分析結(jié)果的因素。
Measurement Error可以通過技術(shù)重復(fù)來消除,我們下面主要關(guān)注一下Biological Variability為何不能通過測序來消除。
以下利用兩個研究的數(shù)據(jù),評估了不同測量方法(二代測序和基因芯片)導(dǎo)致的表達(dá)水平差異:
說明:
每個點(diǎn)表示一個基因;
橫坐標(biāo)表示利用基因芯片方法檢測得到的某個基因在不同樣本之間的表達(dá)水平的標(biāo)準(zhǔn)差;
縱坐標(biāo)表示利用二代測序方法檢測得到的某個基因在不同樣本之間的表達(dá)水平的標(biāo)準(zhǔn)差;
黑色線表示對表達(dá)異質(zhì)性(s.d.)的最佳線性擬合;
紅色線表示y=x。
高亮的兩個點(diǎn)/三角表示基因COX4NB和RASGRP1。
從上述結(jié)果可以看到,兩種技術(shù)檢測得到的表達(dá)抑制性相差很小。
以下展示了不同樣本的兩個基因(COX4NB和RASGRP1)的標(biāo)準(zhǔn)化(圓:均值歸一化;三角:中心化)后的表達(dá)量。上圖表示二代測序,下圖表示基因芯片。
從結(jié)果可見,無論使用哪種技術(shù),基因COX4NB在不同樣本中的表達(dá)水平都較為一致,基因RASGRP1則異質(zhì)性較高。
綜合上述兩個結(jié)果,Biological Variability是基因的特性,而與檢測方法無關(guān)。
Biological Variability對于實(shí)驗(yàn)設(shè)計(jì)、數(shù)據(jù)分析影響很大?紤]上述基因COX4NB和RASGRP1,如果檢測到不同處理組之間COX4NB的表達(dá)有差異,那么這個差異很可能是真陽性,因?yàn)榻M內(nèi)異質(zhì)性很;但如果檢測到兩組之間RASGRP1表達(dá)有差異,如果重復(fù)樣本數(shù)量不夠,很有可能檢測到的差異是假陽性,因?yàn)闊o法排除是否是Biological Variability導(dǎo)致的。
綜上所述,為了得到更可信的結(jié)果,需要足夠的生物學(xué)重復(fù)。