Data Driven Research: 組織細(xì)胞群體的深度解析
——神奇的質(zhì)譜流式技術(shù)
質(zhì)譜流式是單細(xì)胞分析技術(shù)的一大突破,目前應(yīng)用于血液、免疫、干細(xì)胞以及腫瘤等諸多研究領(lǐng)域。它創(chuàng)造性地使用了金屬元素做為抗體的標(biāo)簽,利用ICP質(zhì)譜實(shí)現(xiàn)了單細(xì)胞多參數(shù)的檢測(cè)。金屬標(biāo)簽具有極低的背景信號(hào)以及很好的標(biāo)簽化學(xué)穩(wěn)定,結(jié)合ICP檢測(cè)器的超高信號(hào)分辨能力,保證了質(zhì)譜流式可以獲得高質(zhì)量的數(shù)據(jù)。由于檢測(cè)通道數(shù)量已經(jīng)達(dá)到幾十個(gè),質(zhì)譜流式的數(shù)據(jù)中包含很大的信息量。
那么利用質(zhì)譜流式平臺(tái)獲得的數(shù)據(jù),我們究竟可以從中得到哪些信息呢?有該如何充分利用這些數(shù)據(jù)結(jié)果進(jìn)行分析,提高單次實(shí)驗(yàn)的效率呢?事實(shí)上,不同的數(shù)據(jù)分析方法賦予了質(zhì)譜流式不同的功能。這里,本文將就目前常見(jiàn)的一些數(shù)據(jù)分析方法及結(jié)果類(lèi)型為大家進(jìn)行簡(jiǎn)要的總結(jié)概述。
一、系統(tǒng)展示組織亞群構(gòu)成以及功能、狀態(tài)信息——Data Visualization
質(zhì)譜流式數(shù)據(jù)包含所有被測(cè)細(xì)胞方方面面的信息,是地地道道的高維數(shù)據(jù);這種數(shù)據(jù)的復(fù)雜性實(shí)際上是組織細(xì)胞本身異質(zhì)性的忠實(shí)寫(xiě)照。獲得這些數(shù)據(jù)后,科研人員首先想了解的其實(shí)就是組織的亞群構(gòu)成情況。雖然數(shù)據(jù)中已經(jīng)包含這樣的信息,但是仍然需要經(jīng)過(guò)加工處理才能轉(zhuǎn)變?yōu)橹庇^、易懂的圖表,這一過(guò)程就是數(shù)據(jù)的可視化。
SPADE是一種常用的數(shù)據(jù)可視化方法。它首先將表型類(lèi)似的細(xì)胞聚成小群,然后依照各小群的表型相似度進(jìn)行聚類(lèi)分析,最后得到一個(gè)樹(shù)形圖。SPADE樹(shù)形圖上每個(gè)節(jié)點(diǎn)(Node)都是由一群表型相似的細(xì)胞構(gòu)成的,節(jié)點(diǎn)相對(duì)位置不同也體現(xiàn)了其表型的差異。因此,SPADE樹(shù)形圖直觀展示出了組織細(xì)胞的亞群構(gòu)成。
圖一中展示的是不同時(shí)期的小鼠黑色素瘤中浸潤(rùn)的免疫細(xì)胞SPADE圖譜,可以明顯的看出單核細(xì)胞比例明顯增大。
圖一、小鼠黑色素瘤浸潤(rùn)淋巴細(xì)胞的亞群組成(利用32個(gè)表面標(biāo)志分子進(jìn)行SPADE分析圖譜,數(shù)據(jù)來(lái)源:Salmon et al., 2016, Immunity 44, 924–938)
降維分析是另一類(lèi)經(jīng)常使用的數(shù)據(jù)處理方法,在盡可能保持信息不丟失的基礎(chǔ)上,將多維信息壓縮到二維;這樣就可以用二維散點(diǎn)圖來(lái)展示高維數(shù)據(jù)的結(jié)構(gòu)了。常見(jiàn)的方法有viSNE、PCA等。
圖二是根據(jù)16個(gè)胞外標(biāo)志蛋白表達(dá)數(shù)據(jù),對(duì)外周血白細(xì)胞進(jìn)行viSNE分群結(jié)果?梢钥闯觯趘iSNE圖譜中,幾個(gè)主要免疫亞群各自聚群。同樣,我們也可以以“熱圖”的方式展示不同刺激條件下pSTAT5在各個(gè)亞群中的變化情況。(Adeeb H et al, 2015)
圖二、通過(guò)16個(gè)Marker對(duì)人外周血免疫細(xì)胞的viSNE分析圖譜(數(shù)據(jù)來(lái)源:Adeeb H. Rahman,Cytometry Part A,Volume 89, Issue 6,2016)
除了SPADE和viSNE以外,數(shù)據(jù)可視化的方法還有很多,例如PCA、Scaffold Map FLOW-MAP等等;
二、比手工設(shè)門(mén)更精細(xì)的自動(dòng)分群——Automated population identification
上述方法可以對(duì)在已有知識(shí)背景的前提下對(duì)已知表型的亞群進(jìn)行直觀數(shù)據(jù)分析,展示復(fù)雜的群體構(gòu)成。而當(dāng)關(guān)鍵亞群的表型是未知的,則需要一類(lèi)可以充分挖掘質(zhì)譜流式數(shù)據(jù)的自動(dòng)分群方法。這種計(jì)算機(jī)自主的亞群分析方法叫做“DensVM”。
小鼠髓系細(xì)胞具有復(fù)雜的細(xì)胞組成,新加坡SIgN的研究人源利用質(zhì)譜流式對(duì)不同組織來(lái)源的髓系細(xì)胞進(jìn)行了檢測(cè),圖三其viSNE分析結(jié)果。圖中用不同顏色標(biāo)記的是由計(jì)算機(jī)自動(dòng)識(shí)別出的28個(gè)細(xì)胞亞群。B圖中熱圖分析表明,這些亞群都具有不同的蛋白表達(dá)模式。很明顯,相比圖中手工識(shí)別的亞群(藍(lán)色線框),這種計(jì)算機(jī)自動(dòng)的分群方法要細(xì)致很多。例如,僅僅在Neutrophils(中性粒細(xì)胞)的藍(lán)色線框內(nèi)就識(shí)別出了5個(gè)表型不同的亞群。
圖三、小鼠不同組織中髓系細(xì)胞的組成(A viSNE圖譜;B 計(jì)算機(jī)識(shí)別的各個(gè)亞群的表型分析;數(shù)據(jù)來(lái)源Nat Immunol. 2014 Dec;15(12))
類(lèi)似功能的分析方法還有很多,Accense、PhenoGraph等都是在質(zhì)譜流式中經(jīng)常使用的亞群分群方法。它們能夠幫助我們識(shí)別在生理或病理情況下起到重要作用的細(xì)胞亞群、稀有亞群以及未知亞群。
三、精細(xì)解析細(xì)胞成熟、分化、去編程等動(dòng)態(tài)過(guò)程——Cell development modelling
除了可以靜態(tài)的分析組織細(xì)胞的亞群構(gòu)成,質(zhì)譜流式還可以對(duì)細(xì)胞分化、去編程等復(fù)雜的動(dòng)態(tài)變化過(guò)程進(jìn)行精細(xì)的分析。
我們以B細(xì)胞的在骨髓中的成熟過(guò)程為例說(shuō)明該問(wèn)題。我們知道,B細(xì)胞是在骨髓中發(fā)育成熟的,在骨髓樣本中存在從造血干細(xì)胞(HSC)到Immature Naïve B之間各分化階段的細(xì)胞;一般情況下,這些分化階段沒(méi)有絕對(duì)的界限,期間也存在大量的過(guò)渡狀態(tài)的細(xì)胞,這就是B分化過(guò)程的連續(xù)性。
因此理論上講,只要我們能檢測(cè)足夠多的骨髓細(xì)胞,就可以測(cè)得足夠多的中間過(guò)渡狀態(tài)的細(xì)胞,根據(jù)細(xì)胞表型的漸變我們就可以將這些細(xì)胞排列起來(lái)。這就是Wanderlust的分析基本思想,它讓我們從單個(gè)骨髓樣本獲得細(xì)胞分化的動(dòng)態(tài)信息。
圖四、Wanderlust分析展示的人B細(xì)胞在骨髓中成熟過(guò)程
(數(shù)據(jù)來(lái)源:Sean C. Bendall等,Cell 157, 714–725)
Wanderlust會(huì)根據(jù)每個(gè)細(xì)胞排列的位置賦予給細(xì)胞一個(gè)Wanderlust值,其大小就反映了分化程度:0代表起點(diǎn)(造血干細(xì)胞),1代表終點(diǎn)(Immature Naïve B),該數(shù)值越小說(shuō)明細(xì)胞越原始;
有了這個(gè)工具,我們可以觀察B細(xì)胞分化過(guò)程中任意一個(gè)蛋白的表達(dá)變化,這些信息可以幫助我們找到分化過(guò)程中一些重要的事件。
對(duì)于一些in vitro的實(shí)驗(yàn)體系,我們可以利用更簡(jiǎn)單的方法觀察細(xì)胞表型的變化過(guò)程。只需要將不同時(shí)間點(diǎn)的質(zhì)譜流式數(shù)據(jù)放在做降維分析,得到的圖譜就反映了細(xì)胞表型隨時(shí)間的變化。圖五中的Flow-MAP圖譜中反映的是MEF細(xì)胞經(jīng)過(guò)體外誘導(dǎo)成iPSC的全過(guò)程。顏色代表樣本處理的時(shí)間長(zhǎng)短,沿著由藍(lán)色-黃色-紅色的“時(shí)間軸”,我們可以看到MEF的去編程過(guò)程中細(xì)胞表型的變化過(guò)程。
圖五、對(duì)MEF細(xì)胞的去編程過(guò)程的Flow-MAP分析
(數(shù)據(jù)來(lái)源:Eli R. Zunder等,Cell Stem Cell 16, 323–337)
四、量化分析信號(hào)通路分子之間的相互作用關(guān)系
質(zhì)譜流式在信號(hào)通路的磷酸化蛋白的檢測(cè)中表現(xiàn)卓越。一方面,它可以檢測(cè)更多地信號(hào)通路分子,另一方面,相對(duì)于熒光基團(tuán),其抗體帶有的金屬標(biāo)簽穩(wěn)定性有很大提升。我們知道,信號(hào)通路蛋白之間有比較復(fù)雜的相互作用關(guān)系,質(zhì)譜流式可以將這種關(guān)系進(jìn)行量化比較。
這里要用到的是一個(gè)名為DREVI的分析方法,它可以幫助我們從單細(xì)胞數(shù)據(jù)中提取出兩個(gè)信號(hào)通路蛋白之間的“函數(shù)關(guān)系”,并用一系列參數(shù)對(duì)這種關(guān)系進(jìn)行量化。下圖I,II展示的是在不同的刺激條件下pCD3ζ和pSLP76之間的關(guān)系曲線。我們可以很容易看出,在第二種刺激條件下,較低的pCD3ζ水平就可以啟動(dòng)SLP76磷酸化,同時(shí)pSLP76也可以達(dá)到更高的水平。
圖六、DREVI分析可以直觀展示不同刺激條件下信號(hào)通路狀態(tài)的改變
(數(shù)據(jù)來(lái)源:SmitaKrishnaswamy等,Science. 2014 November 28; 346(6213))
五、尋找具有臨床指導(dǎo)意義的Bio-Marker
在比較貼近臨床的研究中,我們往往需要對(duì)一系列病人樣本和正常樣本進(jìn)行比較,找出病人樣本特征。一般情況下,很難從整體蛋白表達(dá)水平找到具有統(tǒng)計(jì)學(xué)意義的差別,因?yàn)榕R床樣本具有很大的異質(zhì)性,比較有規(guī)律性、代表性的差別往往只存在于少數(shù)亞群中。前文提到,質(zhì)譜流式可以將樣本精細(xì)的分成很多亞群,因此它可以很方便的對(duì)這些亞群中相關(guān)蛋白的表達(dá)數(shù)據(jù)進(jìn)行對(duì)比、相關(guān)性等統(tǒng)計(jì)學(xué)分析。
斯坦福大學(xué)的研究人員用質(zhì)譜流式檢測(cè)了多發(fā)性骨髓瘤病例和正常人外周血細(xì)胞39個(gè)蛋白的表達(dá)。為了尋找兩組樣本之間存在顯著差異的Bio-Marker,他們引入了Citrus分析。首先通過(guò)其中的24個(gè)表面Marker聚類(lèi)分成幾十個(gè)亞群,然后通過(guò)對(duì)比各亞群中14個(gè)蛋白的表達(dá),最終發(fā)現(xiàn)了圖中所示的兩個(gè)B細(xì)胞相關(guān)亞群(Cluster A 和Cluster B),在這兩個(gè)亞群中,CD27在多發(fā)性骨髓瘤病人組的表達(dá)量要明顯高于正常人。這一差異有希望做為該類(lèi)疾病的一個(gè)BioMarker用于疾病的診斷。
圖七、通過(guò)Citrus 分析識(shí)別出多發(fā)性骨髓瘤的特征性亞群
(數(shù)據(jù)來(lái)源:Leo Hansmann等,Cancer Immunol Res; 3(6) June 2015)
小結(jié):數(shù)據(jù)驅(qū)動(dòng)的研究方式,不斷降低的技術(shù)門(mén)檻
可以看出,質(zhì)譜流式數(shù)據(jù)分析具有很大的靈活性,研究者可以根據(jù)實(shí)驗(yàn)設(shè)計(jì)以及實(shí)驗(yàn)?zāi)康牡牟煌,選擇幾種適合的分析方法結(jié)合使用,有效挖掘出需要的信息。這種研究方式也被稱(chēng)為數(shù)據(jù)驅(qū)動(dòng)的研究(Data Driven Research)。
經(jīng)過(guò)了幾年的發(fā)展,質(zhì)譜流式數(shù)據(jù)分析方法已經(jīng)漸成體系。隨著一些基于云的在線分析系統(tǒng)的出現(xiàn),數(shù)據(jù)分析的技術(shù)門(mén)檻也大大降低。例如Cytobank,可以支持SPADE、viSNE以及Citrus等多種數(shù)據(jù)分析方法,軟件界面也非常友好,研究人員只需要將數(shù)據(jù)上傳到服務(wù)器,設(shè)定少數(shù)幾個(gè)參數(shù)就可以完成這些分析。這也為質(zhì)譜流式技術(shù)的普及創(chuàng)造了有利條件。