單細(xì)胞數(shù)據(jù)細(xì)胞分類與功能挖掘的基因分析法介紹
瀏覽次數(shù):6393 發(fā)布日期:2019-8-14
來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)
接觸過單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)的小伙伴們都知道,數(shù)據(jù)的核心結(jié)果在于根據(jù)每個(gè)細(xì)胞的基因表達(dá)數(shù)據(jù),來對(duì)細(xì)胞進(jìn)行分群分類,F(xiàn)有通用的分析思路如下:首先根據(jù)轉(zhuǎn)錄組稀疏矩陣,通過計(jì)算和分析,找到不同的細(xì)胞Cluster,并找到每一類集群的Marker基因。根據(jù)已有對(duì)細(xì)胞特定Marker基因的認(rèn)識(shí),來對(duì)細(xì)胞可能的集群進(jìn)行分類。因此,在該框架下,可以得到以下幾個(gè)圖:
圖1. A.t-SNE細(xì)胞分群圖及B細(xì)胞標(biāo)記;B. B 細(xì)胞4個(gè)Marker基因標(biāo)記分布圖
上述結(jié)果有兩個(gè)特點(diǎn):1.通過在Marker基因中尋找存在的細(xì)胞marker對(duì)細(xì)胞進(jìn)行標(biāo)記,但無(wú)法給出可靠性評(píng)價(jià);2.只能用一個(gè)基因的表達(dá)模式來反應(yīng)細(xì)胞特征,無(wú)法同時(shí)對(duì)幾個(gè)基因進(jìn)行整合展示。因此,能不能將上述多個(gè)基因同時(shí)對(duì)細(xì)胞分群結(jié)果進(jìn)行分類和量化,從基因集的角度來反應(yīng)細(xì)胞的類群?
通過對(duì)最近發(fā)表分析算法的調(diào)研和調(diào)試,我們實(shí)現(xiàn)了這樣一個(gè)需求。我們以上述標(biāo)記基因: MS4A1,CD79A,CD79B和CD19,這4個(gè)B細(xì)胞特有Marker為基礎(chǔ),分別以其中一個(gè)基因表達(dá)為特征,和用4個(gè)基因的表達(dá)為特征,計(jì)算綜合Score值,并將其結(jié)果在t-SNE結(jié)果中進(jìn)行可視化展示,如下圖:
圖2. A.1個(gè)基因的B細(xì)胞標(biāo)記分布圖;B. 4個(gè)基因計(jì)算綜合Score值后的細(xì)胞標(biāo)記分布圖
從上述結(jié)果可以看到,單純用一個(gè)基因進(jìn)行標(biāo)記時(shí),有些細(xì)胞不能進(jìn)行很好區(qū)分標(biāo)記,而當(dāng)用4個(gè)基因同時(shí)進(jìn)行計(jì)算標(biāo)記時(shí),得到的結(jié)果就非常完美。
有了基因集這樣一個(gè)概念,我們就能夠同時(shí)將多個(gè)基因?yàn)榛A(chǔ),對(duì)細(xì)胞進(jìn)行更加精細(xì)和準(zhǔn)確分類。同樣,有了基因集的概念,我們對(duì)單細(xì)胞的功能挖掘也變得更加簡(jiǎn)單可行。
GSEA相信大家都很熟悉,通過基因集的角度,可以去評(píng)價(jià)樣本間的功能差異,找到核心的功能和hallmarkers。但是,由于單細(xì)胞數(shù)據(jù)相比常規(guī)數(shù)據(jù)有數(shù)據(jù)稀疏和細(xì)胞數(shù)量多的特點(diǎn),用單細(xì)胞來進(jìn)行傳統(tǒng)的GSEA分析變的很難實(shí)現(xiàn)。幸運(yùn)的是,有了上述的單細(xì)胞基因集分析方法,我們就可以用不同功能基因集,來實(shí)現(xiàn)對(duì)單細(xì)胞的細(xì)胞功能富集。我們以氧化磷酸化功能基因集數(shù)據(jù)為基礎(chǔ),對(duì)上述細(xì)胞集群進(jìn)行分析和可視化展示,如下圖:
圖3. Oxidative Phosphorylation通路基因集結(jié)果
結(jié)果顯示,在該數(shù)據(jù)中,左邊顏色較深區(qū)域的細(xì)胞顯著富集氧化磷酸化細(xì)胞功能。因此,只要有感興趣功能的基因集,針對(duì)特定細(xì)胞集群的生物學(xué)功能挖掘,我們就能告訴您在哪些細(xì)胞中,該功能是顯著富集的。
上述分析結(jié)果及圖形化展示由SBC生物信息分析專家完成,如有基于基因集的細(xì)胞分類及功能挖掘需求,請(qǐng)聯(lián)系上海生物芯片有限公司服務(wù)平臺(tái)。