SBC ToolBox VIP專區(qū)再添新模塊—GSEA,GSEA(基因集富集分析),基因在差異比較中表達(dá)的上下調(diào)與富集分析的碰撞,尋找出與差異上調(diào)或者下調(diào)密切相關(guān)的基因條目(GO、Pathway等)。與經(jīng)常使用的GO、KEGG富集分析不同,GO、KEGG富集分析不考慮基因表達(dá)變化程度,GSEA把基因表達(dá)值作為考慮因素,也可以把全部表達(dá)的基因進(jìn)行富集分析。一般情況下可以使用GSEA官網(wǎng)提供的客戶端進(jìn)行基因集富集分析,詳細(xì)的操作步驟也可以在官網(wǎng)找到。SBC ToolBox使用R包進(jìn)行GSEA數(shù)據(jù)分析,其具有輸入數(shù)據(jù)更簡潔,分析速度更快的特點(diǎn)。
GSEA官網(wǎng)鏈接:
https://www.gsea-msigdb.org/gsea/downloads.jsp
登錄GSEA模塊
a) 可以在SBC ToolBox導(dǎo)航頁面的VIP專區(qū)找到GSEA模塊。
b) 也可以直接登錄站點(diǎn):
https://www4.shbiochip.com/V2023/svip/gsea/
c) 與單細(xì)胞和空間轉(zhuǎn)錄分析一樣,此分析模塊為VIP模塊,請(qǐng)老師登錄注冊,審核通過后會(huì)以郵件和短信的的方式發(fā)放登錄信息。
登錄地址:
https://www1.shbiochip.com/sbc/regvip.jsp
SBC ToolBox GSEA都有什么?
a) 內(nèi)嵌MSigDB九大經(jīng)典數(shù)據(jù)集
i. H: hallmark gene sets:結(jié)合手動(dòng)篩選和自動(dòng)化計(jì)算方法生成的50個(gè)hallmark基因集,包含了細(xì)胞組分、發(fā)育、DNA損傷、免疫、代謝、通路、增值、信號(hào)相關(guān)的基因集。
ii. C1: positional gene sets:基因位置信息基因集。
iii. C2:curated gene sets:精選數(shù)據(jù)集包含了經(jīng)典通路和化學(xué)及遺傳擾動(dòng)相關(guān)基因集。
iv. C3:motif gene sets:轉(zhuǎn)錄因子,miRNA靶基因調(diào)節(jié)相關(guān)的基因集。
v. C4:computational gene sets:對(duì)癌癥相關(guān)的基因芯片數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘的癌癥相關(guān)基因集。
vi. C5:GO gene sets:GO基因集。
vii.C6:oncogenic signatures:致癌相關(guān)特征基因集。
viii.C7:immunologic signatures:免疫相關(guān)特征基因集。
ix. C8:cell type signature gene sets:細(xì)胞類型相關(guān)特征基因集。
b) 自定義數(shù)據(jù)庫
i. 感興趣的基因集不在內(nèi)嵌數(shù)據(jù)庫中,可以將自有數(shù)據(jù)庫上傳GSEA模塊進(jìn)行基因集富集分析。
ii. 手搓數(shù)據(jù)集,老師自己收集組成的數(shù)據(jù)集也是支持的,但是比附符合以下格式。
iii. SBC ToolBox GSEA模塊自定義數(shù)據(jù)集格式:
一共兩列:第一列為基因集條目名字,第二列為數(shù)據(jù)集條目名字對(duì)應(yīng)的基因集GeneSymbol名字,這里的自定義數(shù)據(jù)集僅支持.xlsx格式的文件。
注意:一個(gè)基因集條目對(duì)應(yīng)多個(gè)基因,多個(gè)基因集條目組成GSEA分析參考基因集。
c) 可視化
i. 對(duì)GSEA結(jié)果進(jìn)行基因集條目展示。
SBC ToolBox GSEA怎么使用
a) 數(shù)據(jù)準(zhǔn)備及上傳
i.數(shù)據(jù)準(zhǔn)備:.xlsx格式包含兩列,第一列為GeneSymbol(該列與基因集中的GeneSymbol一致),第二列為差異倍數(shù)的log2變換。
ii.數(shù)據(jù)上傳:側(cè)邊欄點(diǎn)擊MSigDb GSEA組件,直接將數(shù)據(jù)點(diǎn)擊上傳或者拖拽下面紅框中,此接口為MSigDb和自定義數(shù)據(jù)集的統(tǒng)一數(shù)據(jù)上傳接口。
b)MSigDB GSEA參數(shù)調(diào)整
i.物種選擇:下拉菜單欄,可供選擇的為Human、Mouse及Rat三種物種。
ii.數(shù)據(jù)庫選擇:MSigDb數(shù)據(jù)庫的九個(gè)基因集,詳細(xì)內(nèi)容見MSigDB九大經(jīng)典數(shù)據(jù)集詳解。
c)MSigDB GSEA分析及結(jié)果展示保存
i.點(diǎn)擊提交分析按鈕,程序運(yùn)行,下圖黑色區(qū)域小花花轉(zhuǎn)圈圈,表示正在分析。
ii.完成分析,會(huì)彈出完成對(duì)話框,默認(rèn)會(huì)展示兩個(gè)條目的GSEA展示,及GSEA富集分析結(jié)果表格。
iii.結(jié)果保存,一共可保存三項(xiàng),1,GSEA富集表格。2,GSEA Top2富集條目展示,3,GSEA 結(jié)果.RDS文件,可用于可視化結(jié)果。
d)自定義數(shù)據(jù)庫分析
i.在下圖紅框中上傳自定義數(shù)據(jù)集,這里不用選擇物種,需要注釋差異基因的GeneSymbol與基因集的GeneSymbol需要一致。
ii.點(diǎn)擊提交分析,分析過程及結(jié)果展示與MSigDb GSEA一致,可以保存自定義數(shù)據(jù)庫的GSEA結(jié)果。
e)可視化,GSEA保存的.rds文件做為上傳數(shù)據(jù)進(jìn)行結(jié)果可視化。
i.默認(rèn)結(jié)果展示:
ii.展示單個(gè)條目,并調(diào)整顏色,這里的條目序號(hào)與表格:
iii.調(diào)整展示類型及取消顯著性
iv.可視化結(jié)果詳解
v.與上調(diào)相關(guān)的條目展示
vi.與上調(diào)相關(guān)的條目展示
完成以上步驟,您的GSEA數(shù)據(jù)分析就妥妥完成了。各位老師同學(xué)趕緊開啟您的SBC ToolBox云分析之旅吧!SBC ToolBox 是您科研路上的好搭檔,好幫手,助您在科研道路上披荊斬棘。