細胞的轉錄狀態(tài)來自于一個潛在的基因調控網絡(GRN),在這個網絡中,有限數量的轉錄因子和輔助因子相互調控,并調控它們的下游靶基因。組織內細胞異質性的基礎是細胞轉錄狀態(tài)的差異,轉錄狀態(tài)的特異性又是由轉錄因子主導的基因調控網絡所決定并維持穩(wěn)定的。因此分析單細胞的GRNS有助于深入挖掘細胞異質性背后的生物學意義。
2017年發(fā)表在Nature Methods雜志上的SCENIC算法,利用scRNA-seq數據,同時進行基因調控網絡重建和細胞狀態(tài)鑒定,應用于腫瘤和小鼠大腦單細胞圖譜數據,提出并證明了順式調控網絡分析能夠用于指導轉錄因子和細胞狀態(tài)的鑒定。SCENIC(single-cell regulatory network inference and clustering)官網:https://scenic.aertslab.org/ ,是一款分析轉錄因子活性的軟件,其可基于單細胞轉錄組數據來推斷轉錄因子、基因調控網絡和細胞類型。SCENIC分析的核心是利用motif enrichment將候選TF調控因子與候選靶基因連接起來。此軟件目前配置了人、小鼠、果蠅數據庫,其他物種需要自己構建數據庫。
我們統(tǒng)計發(fā)現百篇文獻中近20%的文獻中存在此次分析結果,共出現33次,文獻中的出現的結果如下:
這是我們復現結果,如下:使用AUCell算法來對每個細胞中的每個regulon的活性進行評分。
上圖為各組細胞中regulons的RAS(regulon activity score)活性熱圖。行表示不同的regulon,列表示不同的細胞,顏色越紅代表RAS活性得分越高,進而表示regulon在該組中的活性越強。
除了展示轉錄因子在不同亞群的活性,我們還可以挑選各個單細胞亞群特異性的轉錄因子構建特異性熱圖,各組中regulons的RSS(regulon specificity score)特異性熱圖展示如下:
行表示不同的regulon,列表示不同的組別,顏色越紅代表RSS特異性得分越高,進而表示regulon在該組中的特異性越強。
我們還可以用散點圖來展示每個亞群中轉錄因子的特異性排序,各組regulons特異性排序圖結果如下:
橫坐標表示排名,縱坐標表示RSS得分,RSS越高的調控子可能與該細胞群特異性相關,帶標簽的點代表RSS得分top3的regulon。
為了更好地展示研究成果,可以將我們所關注的在特定亞群中特異性表達的轉錄因子單獨畫FeaturePlot展示圖,結果如下,這樣得到的可視化結果更容易與我們之前的分析聯系起來。
左一為轉錄因子原始AUC表達分布,左二為轉錄因子標準化AUC表達分布,右一為單細胞數據按照細胞類型的分群結果?梢钥吹睫D錄因子在monocytes亞群和cdc亞群中高度表達。然后,我們通過RAS來計算不同regulon之間的相關性系數(PCC, Pearson Correlation Coefficient),基于PCC,計算了CSI(Connection Specificity Index)來衡量regulon pairs之間的相關性,構建Regulon模塊的CSI(connection specificity index)關聯性聚類熱圖,展示結果如下:
行、列均表示regulon,顏色越黃表示CSI關聯性越高,CSI都高的regulon可能具有相似的細胞功能,共同調控下游基因。
我們也可以提取所關注的轉錄因子單獨構圖,可以得到以下結果:
以上為本次單細胞測序高級分析SCENIC分析的結果,其他高級分析且聽下回分解。