本期為大家介紹一個開放源碼的生物資訊軟件 –Cytoscape,它可以建構(gòu)可視化的分子交互作用網(wǎng)絡(luò),并可將已有的基因表達信息(gene expression profiles) 整合進此網(wǎng)絡(luò)中,輕易觀察分子間 (蛋白質(zhì)—蛋白質(zhì) 或 蛋白質(zhì)—DNA…) 的關(guān)聯(lián)性。
Cytoscape 是 Institute for Systems Biology (Leroy Hood 實驗室)、加州大學(xué)圣地亞哥分校 (Trey Ideker 實驗室)、加州大學(xué)舊金山分校 (Bruce Conklin 實驗室)、Memorial_Sloan-Kettering 癌癥研究中心 (Chris Sander 實驗室)、Pasteur 研究院 (Benno Schwikowski 實驗室) 等研究單位共同合作開發(fā)的一個開放源碼的生物信息分析軟件。Cytoscape 的核心即是網(wǎng)絡(luò) (圖一),每個節(jié)點 (node) 是基因、蛋白質(zhì)或分子,而節(jié)點與節(jié)點之間的連接 (edge) 則代表著這些生物分子之間的相互作用 (圖二)。
使用 Cytoscape 案例
我們先舉一些有使用 Cytoscape 的文獻作為例子,讓大家知道它所帶來的意義為何。Jie Wang1 等人利用華聯(lián)的 HOA 和 HmiOA 芯片產(chǎn)品,于今年發(fā)表了一篇文章,研究是否可以從 mRNA 和 miRNA 基因表現(xiàn)整合的網(wǎng)絡(luò)調(diào)控關(guān)系中找出影響疾病 (有 BSS 癥狀的心絞痛病人) 可能的關(guān)鍵因子(biomarker);實驗結(jié)果發(fā)現(xiàn) 23 個 miRNA 被正向調(diào)控 (up-regulated) 以及 408 個基因被負向調(diào)控,作者將這些資料全部丟進在線分析網(wǎng)站miRTrail (Laczny2 等人于 2012 年發(fā)表整合 mRNA 和 miRNA 芯片表現(xiàn)分析工具) 進行分析, 利用內(nèi)建的 microCosm 預(yù)測 miRNA 對應(yīng)的標(biāo)的基因 (target genes) 并和 408 基因做交叉比對,發(fā)現(xiàn)交集的基因總共有115個;并依據(jù)預(yù)測標(biāo)的基因和 408 基因交叉比對且符合負向調(diào)控程度較高的基因群,作優(yōu)先選擇的 miRNA 標(biāo)的(前百分之五),從 23 個 miRNA 中挑出了 6 個(miR-146b-5p, miR-199a-3p, miR-199a-5p, miR-326, miR-423-3p and miR-484)。最后將找到的 115 基因和 6 個 miRNA 繪制成 network (圖三),我們就可以清楚觀察這 6 個 miRNA 和經(jīng)過芯片實驗驗證的基因之間調(diào)控的關(guān)系,找出交互作用頻率高的基因_(尺寸較大的圓圈)。作者最后挑選了miR-146b-5p、miR-199a-5p 以及 TP53、CALR 基因,另外找了一群病人 (包含控制組 15 人、BBS 癥狀的心絞痛疾病 30 人以及非 BSS 癥狀的心絞痛疾病 30 人)做 RT-PCR 驗證,也得到一致的結(jié)果,可以當(dāng)成醫(yī)生治療這類病人的重要生物指標(biāo)。
另外,蛋白質(zhì)之間的調(diào)控作用本來就是 Cytoscape 的分析強項,所以為了觀察 115 負向調(diào)控基因?qū)?yīng)的蛋白質(zhì)之間的交互作用(PPI,Protein-Protein Interaction),作者將 Reactome FI 這個配件 plug-in 于 Cytoscape 中,將對應(yīng)的蛋白質(zhì)交互作用,以圖形方式呈現(xiàn)(圖四),也提供后續(xù)蛋白質(zhì)研究做一個參考。
除了利用顏色觀察表現(xiàn)量的變化,也可以用來表示其他量化的連續(xù)性數(shù)據(jù);2012 年 Pahl 3 等人的研究中利用 TargetScan、MirTarget2 以及 Pictar 提供的數(shù)據(jù)庫預(yù)測實驗有顯著表現(xiàn)差異miRNA 所對應(yīng)的標(biāo)的基因,并使用 Cytoscape表現(xiàn)之間的相關(guān)性(圖五)。這些預(yù)測的標(biāo)的基因和 miRNA 也被放入 RNAhybrid version 2.1 程序中仿真計算 mRNA-miRNA 之間雜交的minimum free energy (△G,kcal/mole),藉此評估 mRNA-miRNA 之間鍵結(jié)的強度。前提是計算 minimum free energy 必須于 Ensembl Biomart 取得標(biāo)的基因的 3’UTR 序列,若沒有對應(yīng)的序列數(shù)據(jù)將無法計算,圖中會以黑線和黑色圈圈表示。從圖中的四個 miRNA network 中,可以得知 miR-331-3p 擁有最低的 minimum free energy,表示此 miRNA 和對應(yīng)的標(biāo)的基因之間有較強的親和性;miR-133a 和 miR-133b 因為序列相似所以對應(yīng)到大部分重復(fù)的標(biāo)的基因,但由于兩者之間差了兩個 base pair,導(dǎo)致和基因之間的親和性不同。作者也進一步找出圖中可能的潛在標(biāo)的基因,例如:CSRNP1、SLC7AB、PLK3、FURIN 同時是 miR-133a、miR-133b、miR-331-3p 的預(yù)測 target genes;DNM2、DNAJB1、TGFBR1、TGOLN2、BCL11A、EDEM1、SFXN2、YTHDF3 八個基因同時是miR-204、miR-133a、miR-133b 的預(yù)測標(biāo)的基因, 而Hypermethy- lated_in cancer 2 (HIC2) gene 則是唯一被四個 miRNA 同時所預(yù)測的標(biāo)的基因;它屬于 HIC1 家族基因,極可能是重要的腫瘤抑制基因。
如何使用 Cytoscape
要完成一個 Cytoscape 的網(wǎng)絡(luò)分析,基本上有 4 個步驟:(搭配影片教學(xué),事半功倍!)
1. Create a network
2. Import a attribute / expression profile
3. Filtering & editing
4. Annotation & data analysis
步驟 1,要先有一個網(wǎng)絡(luò),可以是從已知的數(shù)據(jù)庫中取得某個特定的網(wǎng)絡(luò),例如有 TP53 參與的基因網(wǎng)絡(luò)、Apoptosis pathway 基因網(wǎng)絡(luò)…,或可自行建立,而后續(xù)的動作則會架構(gòu)在此網(wǎng)絡(luò)上進行分析;步驟 2,加載想要分析的屬性數(shù)據(jù),亦或是使用華聯(lián)芯片服務(wù)得到的 gene expression profile (fold change、p-value…);步驟 3,由于加載的數(shù)據(jù)往往是很龐大的,要利用篩選、編輯,變成想要的信息;步驟 4,最后可利用此結(jié)果再進行后續(xù)的批注或分析。
小結(jié)
Cytoscape 源自系統(tǒng)生物學(xué),用于將生物分子交互網(wǎng)絡(luò)與高通量基因表達數(shù)據(jù)和其他的分子狀態(tài)信息整合在一起。其最強大的功能在于大規(guī)模蛋白質(zhì)與蛋白質(zhì)相互作用、蛋白質(zhì)-DNA或遺傳分子交互作用的分析。Cytoscape 是開放源碼的軟件,任何人都可依自己的需求作修改,或是 Plug-in 后,修改成自己想要的形式,若有厲害的程序開發(fā)高手,亦可快速建構(gòu)出新的功能。各位在使用上若有任何問題,都歡迎與我們討論。
另外,帶來一個好消息:華聯(lián) 2013 最新力作,累積 6 年服務(wù)經(jīng)驗深蘊,整合推出 30 項生物信息分析服務(wù) - BiXOneArray,帶給大家從初階到進階的全方位分析服務(wù) !
參考資料
(1) Jie Wang et. al. A Systems Biology Approach to Characterize Biomarkers for Blood Stasis Syndrome of Unstable Angina Patients by Integrating MicroRNA and Messenger RNA Expression Profiling. Evidence-Based Complementary and Alternative Medicine (2013) March 29
(2) Laczny C et. al. miRTrail - a comprehensive webserver for analyzing gene and miRNA patterns to enhance the understanding of regulatory mechanisms in diseases. BMC Bioinformatics (2012) 13:36
(3) Matthew C Pahl et. al. MicroRNA expression signature in human abdominal aortic aneurysms. BMC Medical Genomics (2012) 5:25