GenBank數(shù)據(jù)庫(kù)簡(jiǎn)介
瀏覽次數(shù):10584 發(fā)布日期:2008-5-11
來(lái)源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)
1. GenBank屬于一個(gè)序列數(shù)據(jù)庫(kù)的國(guó)際合作組織,包括EMBL和DDBJ。是NIH遺傳序列數(shù)據(jù)庫(kù),一個(gè)所有可以公開獲得的DNA序列的注釋過(guò)的收集。GenBank同日本和歐洲分子生物學(xué)實(shí)驗(yàn)室的DNA數(shù)據(jù)庫(kù)共同構(gòu)成了國(guó)際核酸序列數(shù)據(jù)庫(kù)合作。唯一人類基因序列集合(UniGene),人類基因組基因圖譜,分類學(xué)瀏覽器,同國(guó)立癌癥研究所合作的癌癥基因組剖析計(jì)劃(CGAP)等數(shù)據(jù)庫(kù)。GenBank以指數(shù)形式增長(zhǎng),核酸堿基數(shù)目大概每14個(gè)月就翻一個(gè)倍。
2. 紀(jì)錄樣本 - 關(guān)于GenBank的各個(gè)字段的詳細(xì)描述,以及同Entrez搜索字段的交叉索引。
3. 訪問(wèn)GenBank - 通過(guò)Entrez Nucleotides來(lái)查詢。用accession number,作者姓名,物種,基因/蛋白名字,還有許多其他的文本術(shù)語(yǔ)來(lái)查詢。關(guān)于Entrez更多的信息請(qǐng)看下文。用BLAST來(lái)在GenBank和其他數(shù)據(jù)庫(kù)中進(jìn)行序列相似搜索。用E-mail來(lái)訪問(wèn)Entrez和BLAST可以通過(guò)Query和BLAST服務(wù)器。另外一種選擇是可以用FTP下載整個(gè)的GenBank和更新數(shù)據(jù)。
4. 增長(zhǎng)統(tǒng)計(jì) - 參見(jiàn)公布通知的2.2.6(每個(gè)分類的統(tǒng)計(jì)),2.2.7(每個(gè)物種的統(tǒng)計(jì)),2.2.8(GenBank增長(zhǎng))小節(jié)。
5. 公布通知,最新 - 最近和即將有的變化,GenBank的分類,數(shù)據(jù)增長(zhǎng)統(tǒng)計(jì),GenBank的引用。
6. 公布通知,舊 - 同上相同,是過(guò)去公布的統(tǒng)計(jì)。
7. 遺傳密碼 - 15個(gè)遺傳密碼的概要。用來(lái)確保GenBank中紀(jì)錄的編碼序列被正確的翻譯。
向GenBank提交數(shù)據(jù) :
1. 關(guān)于提交序列數(shù)據(jù),收到accession number,和對(duì)紀(jì)錄作更新的一般信息。
2. BankIt - 用于一條或者少數(shù)條提交的基于WWW的提交工具軟件。(請(qǐng)?jiān)谔峤磺坝肰ecScreen去除載體)
3. Sequin - 提交軟件程序,用于一條或者很多條的提交,長(zhǎng)序列,完整基因組,alignments,人群/種系/突變研究的提交。可以獨(dú)立使用,或者用基于TCP/IP的“network aware”模式,可以鏈接到其他NCBI的資源和軟件比如Entrez和PowerBLAST。(請(qǐng)?jiān)谔峤磺坝肰ecScreen去除載體)
4. ESTs - 表達(dá)序列標(biāo)簽,短的、單次(測(cè)序)閱讀的cDNA序列。也包括來(lái)自于差異顯示和RACE實(shí)驗(yàn)的cDNA序列。
5. GSSs - 基因組調(diào)查序列,短的、單次(測(cè)序)閱讀的cDNA序列,exon trap獲得的序列,cosmid/BAC/YAC末端,及其他。
6. HTGs - 來(lái)自于大規(guī)模測(cè)序中心的高通量基因組序列,未完成的(階段0,1,2)和完成的(階段3)序列。(注意:完成的人類的HTG序列可以同時(shí)在GenBank和Human Genome Sequencing頁(yè)面上訪問(wèn)。)
7. STSs - 序列標(biāo)簽位點(diǎn)。短的在基因組上可以被唯一操作的序列,用于產(chǎn)生作圖位點(diǎn)。
8. 注:SNPs - 人類的和其他物種的遺傳變異數(shù)據(jù)可以提交到NCBI數(shù)據(jù)庫(kù)的單核苷酸多態(tài)性庫(kù)中(dbSNP)。
國(guó)際核苷酸序列數(shù)據(jù)庫(kù)合作組織 :
1. GenBank,DDBJ,EMBL - 合作計(jì)劃的概述,并鏈接到相應(yīng)的主頁(yè)。GenBank,DDBJ(DNA Data Bank of Japan),and EMBL (European Molecular Biology Laboratory)數(shù)據(jù)庫(kù)共享的數(shù)據(jù)是每天都交換的,因此他們是相等的。數(shù)據(jù)紀(jì)錄的格式和搜索方式可能會(huì)不一樣,但是accession number,序列數(shù)據(jù)和注解都是一模一樣的。即,你可以用accession number U12345在GenBank,DDBJ或EMBL中查找相應(yīng)紀(jì)錄,得到的結(jié)果是完全一樣的序列數(shù)據(jù),參考內(nèi)容等等。?
2. DDBJ/EMBJ/GenBank特性表 — 特性表格式和標(biāo)準(zhǔn)被合作數(shù)據(jù)庫(kù)用在序列記錄的注釋上,使得數(shù)據(jù)共享成為可能,包括詳細(xì)的描述生物特性和特性限定語(yǔ)的附錄,以及IUPAC規(guī)定的核苷酸和氨基酸的代號(hào)。?
FTP GenBank and Daily Updates:
1. GenBank普通文件格式 — 參見(jiàn)GenBank記錄樣本和在GenBank公布通知中的詳細(xì)描述,下載大多數(shù)最近的完全公告和日常積累或非積累更新數(shù)據(jù)。
2. ASN.1格式 — 摘要句法記號(hào)1,國(guó)際標(biāo)準(zhǔn)組織(ISO)數(shù)據(jù)表示格式,下載大多數(shù)最近的完全公告和日常積累或非積累更新數(shù)據(jù)。
3. FASTA格式 — 定義行號(hào)后只跟隨序列數(shù)據(jù)(示例),參見(jiàn)描述數(shù)據(jù)庫(kù)的readme文件,包括nt.Z(每天更新的非冗余BLAST核酸數(shù)據(jù)庫(kù),包括GenBank+EMBL+DDBJ+PDB序列,但是不包括EST, STS, GSS, or HTGS序列),nr.Z(每日更新的非冗余蛋白質(zhì)),est.Z, gss.Z, htg.Z, sts.Z,和其它文件。
分子數(shù)據(jù)庫(kù):
1. 核酸序列
1、 Entrez核酸: 用accession number,作者姓名,物種,基因/蛋白名字,以及很多其它的文本術(shù)語(yǔ)來(lái)搜索核酸序列記錄(在GenBank + PDB中)。更多的關(guān)于Entrez的信息見(jiàn)下。如果要檢索大量數(shù)據(jù),也可使用Batch Entrez(批量Entrez)。
2、 RefSeq : NCBI數(shù)據(jù)庫(kù)的參考序列。校正的,非冗余集合,包括基因組DNA contigs,已知基因的mRNAs和蛋白,在將來(lái),整個(gè)的染色體。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式來(lái)表示。
3、 dbEST :表達(dá)序列標(biāo)簽數(shù)據(jù)庫(kù),短的、單次(測(cè)序)閱讀的cDNA序列。也包括來(lái)自于差異顯示和RACE實(shí)驗(yàn)的cDNA序列。
4、 dbGSS :基因組調(diào)查序列的數(shù)據(jù)庫(kù),短的、單次(測(cè)序)閱讀的cDNA序列,exon trap獲得的序列,cosmid/BAC/YAC末端,及其他。
5、 dbSTS :序列標(biāo)簽位點(diǎn)的數(shù)據(jù)庫(kù),短的在基因組上可以被唯一操作的序列,用于產(chǎn)生作圖位點(diǎn)。
6、 dbSNP :?jiǎn)魏塑账岫鄳B(tài)性數(shù)據(jù)庫(kù),包括SNPs,小范圍的插入/缺失,多態(tài)重復(fù)單元,和微衛(wèi)星變異。
2. 完整的基因組 :
1、 參見(jiàn)下面Genome和Maps部分,包括各種物種資源,人,小鼠,大鼠,酵母,線蟲,瘧原蟲,細(xì)菌,病毒,viroids,質(zhì)粒。
2、 發(fā)UniGene : 被整理成簇的EST和全長(zhǎng)mRNA序列,每一個(gè)代表一種特定已知的或假設(shè)的人類基因,有定位圖和表達(dá)信息以及同其它資源的交叉參考。序列數(shù)據(jù)可以以cluster形式在Unigene網(wǎng)頁(yè)下載,完整的數(shù)據(jù)可以從FTP站點(diǎn)repository/UniGene目錄下下載。
1) 人類:UniGene
2) 小鼠:UniGene
3) 大鼠:UniGene
4) 斑馬魚:UniGene
3、 BLAST :將你的序列同核酸庫(kù)中的的序列比較,檢索相似的序列。(更詳細(xì)的信息見(jiàn)下面Tools/Sequence相似搜索部分)
蛋白序列 :
1、 Entrez蛋白 :用accession number,作者姓名,物種,基因/蛋白名字,以及很多其它的文本術(shù)語(yǔ)來(lái)搜索蛋白序列記錄(在GenPept + Swiss-Prot + PIR + RPF + PDB中)。更多的關(guān)于Entrez的信息見(jiàn)下。如果要檢索大量數(shù)據(jù),也可使用Batch Entrez(批量Entrez)。 RefSeq — NCBI數(shù)據(jù)庫(kù)的參考序列。Curated, 非冗余集合包括基因組DNA contigs,已知基因的mRNAs和蛋白,在將來(lái),整個(gè)的染色體。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式來(lái)表示。 FTPGenPept — 下載“genpept.fsa.Z”文件,這個(gè)文件包含了從GenBank/EMBL/DDBJ記錄中翻譯過(guò)來(lái)的FASTA格式的氨基酸序列,這些記錄都有一到兩個(gè)CDS特性的描述。
2、 完整基因組 :參見(jiàn)下面Genome和Maps部分,包括各種物種資源,人,小鼠,大鼠,酵母,線蟲,瘧原蟲,細(xì)菌,病毒,viroids,質(zhì)粒。
1) Entrez基因組 :提供了一個(gè)編碼區(qū)的概要和各種物種的分類表(TaxTable)。編碼區(qū)概要列出了在基因組中所有的的蛋白,并提供鏈接到FASTA文件和BLAST。分類表總結(jié)了蛋白BLAST分析的結(jié)果,建議他們的可能功能,并用顏色編碼的圖來(lái)顯示物種同其它物種之間的關(guān)系(參見(jiàn)下面''''Genomes和Maps,''''部分Entrez基因組的一般描述)
2) FTP基因組蛋白 :從ftp站點(diǎn)的genbank/genomes目錄下下載各種物種的FASTA格式的氨基酸序列*.faa和蛋白表文件*.ptt。參見(jiàn)readme文件。蛋白表也可以在Entrez基因組中看到。
3、 PROW : Web上的蛋白資源,關(guān)于大約200種人類的CD細(xì)胞表面分子的簡(jiǎn)短官方向?qū);ハ鄼z索,為每個(gè)CD抗原提供大約20中標(biāo)準(zhǔn)信息的分類(生化功能,配體,等等)
4、 BLAST : 將你的序列同蛋白庫(kù)中的的序列比較,檢索相似的序列。(更詳細(xì)的信息見(jiàn)下面Tools/Sequence相似搜索部分)
結(jié)構(gòu):
1、 結(jié)構(gòu)主頁(yè) — 關(guān)于NCBI結(jié)構(gòu)小組的一般信息和他們的研究計(jì)劃,另外也可以訪問(wèn)分子模型數(shù)據(jù)庫(kù)(MMDB)和用來(lái)搜索和顯示結(jié)構(gòu)的相關(guān)工具。
2、 MMDB:分子模型數(shù)據(jù)庫(kù) — 一個(gè)關(guān)于三維生物分子結(jié)構(gòu)的數(shù)據(jù)庫(kù),結(jié)構(gòu)來(lái)自于X-ray晶體衍射和NMR色譜分析。MMDB是來(lái)源于Brookhaven蛋白數(shù)據(jù)庫(kù)(PDB)三維結(jié)構(gòu)的一部分,排除了那些理論模型。MMDB重新組織和驗(yàn)證了這些信息,從而保證在化學(xué)和大分子三維結(jié)構(gòu)之間的交叉參考。數(shù)據(jù)的說(shuō)明書包括生物多聚體的空間結(jié)構(gòu),這個(gè)分子在化學(xué)上是如何組織的,以及聯(lián)系兩者的一套指針。利用將化學(xué),序列,和結(jié)構(gòu)信息整合在一起,MMDB計(jì)劃成為基于結(jié)構(gòu)的同源模型化和蛋白結(jié)構(gòu)預(yù)測(cè)的資源服務(wù)。MMDB的記錄以ASN.1格式存儲(chǔ),可以用Cn3D, Rasmol, 或 Kinemage來(lái)顯示。另外,數(shù)據(jù)庫(kù)中類似的結(jié)構(gòu)已經(jīng)被用VAST確認(rèn),新的結(jié)構(gòu)可以用VASTsearch來(lái)同數(shù)據(jù)庫(kù)進(jìn)行比較。
3、 Cn3D — “See in 3-D”, 一個(gè)用于NCBI數(shù)據(jù)庫(kù)的結(jié)構(gòu)和序列相似顯示工具,它允許觀察3-D結(jié)構(gòu)和序列—結(jié)構(gòu)或結(jié)構(gòu)—結(jié)構(gòu)同源比較。Cn3D用起來(lái)就象你瀏覽器上的一個(gè)幫助工具。
4、 VAST — 矢量同源比較搜索工具—一個(gè)在NCBI開發(fā)的計(jì)算算法,用于確定相似的蛋白三維結(jié)構(gòu)。每一個(gè)結(jié)構(gòu)的“結(jié)構(gòu)鄰居”都是預(yù)先計(jì)算好的,而且可以通過(guò)MMDB的結(jié)構(gòu)概要頁(yè)面的鏈接訪問(wèn)。這些鄰居可以用來(lái)確認(rèn)那些不能被序列比較識(shí)別的遠(yuǎn)的同源性。
5、 VAST 搜索 — 結(jié)構(gòu)—結(jié)構(gòu)相似搜索服務(wù)。比較一個(gè)新解出的蛋白結(jié)構(gòu)和在MMDB/PDB數(shù)據(jù)庫(kù)中的結(jié)構(gòu)的三維坐標(biāo)。VAST搜索計(jì)算一系列可能會(huì)被交互瀏覽的結(jié)構(gòu)鄰居,用分子圖形來(lái)觀察重疊和同源相似。
分類學(xué) :
1、 NCBI的分類數(shù)據(jù)庫(kù)主頁(yè) — 關(guān)于分類計(jì)劃的一般信息,包括分類資源和同NCBI分類學(xué)家合作的外部管理者的列表。
2、 分類瀏覽器 — 搜索NCBI的分類數(shù)據(jù)庫(kù),包括大于70000個(gè)物種的名字和種系,這些物種都至少在遺傳數(shù)據(jù)庫(kù)中有一條核酸或蛋白序列。可以檢索一個(gè)特定種或者更高分類(如屬,科)的核酸,蛋白,和結(jié)構(gòu)記錄。如果有新物種的序列數(shù)據(jù)被放到數(shù)據(jù)庫(kù)中,這個(gè)物種就北加到(分類)數(shù)據(jù)庫(kù)中。NCBI的分類數(shù)據(jù)庫(kù)的目的是為序列數(shù)據(jù)庫(kù)建立一個(gè)一致的種系發(fā)生分類學(xué)。
文獻(xiàn)數(shù)據(jù)庫(kù)概要 :
1、 PubMed — 一個(gè)關(guān)于生物醫(yī)藥科學(xué)的檢索系統(tǒng),包括引用,摘要,和雜志的索引術(shù)語(yǔ)。它包括直接由出版商提供給NCBI的文獻(xiàn)引用以及鏈接到在出版商網(wǎng)址上的全文的URLs。PubMed包括MEDLINE和PREMEDLINE的完整內(nèi)容。它還包括一些被MEDLINE認(rèn)為超出范圍的文章和雜志,(這些文章或雜志)由于內(nèi)容或在某一時(shí)期不在索引范圍內(nèi)。因此PubMed是比MEDLINE的更大的集合。
2、 雜志瀏覽器 — 允許你去查找收錄到PubMed系統(tǒng)的雜志的名字,MEDLINE的縮寫,或ISSN號(hào)碼。
3、 PubRef(開發(fā)中)— 一個(gè)關(guān)于來(lái)自于廣大范圍的科學(xué)雜志的數(shù)目記錄,和鏈接到出版商網(wǎng)址的全文。PubRef包含了PubMEd,加上了來(lái)自其它學(xué)科的雜志出版商提供的引用和摘要。因此它是比PubMed更大的集合。這個(gè)計(jì)劃的啟動(dòng)是因?yàn)镹AS要求為科學(xué)領(lǐng)域的核心刊物提供一個(gè)“白皮書”服務(wù)。
4、 PubMed中心(開發(fā)中) — PubMed中心是一個(gè)無(wú)障礙的NIH資源,用于在生命科學(xué)領(lǐng)域中同業(yè)互查的基礎(chǔ)研究報(bào)告。從2000年一月開始接受雜志文章。所有在PubMed中心的材料將由目前任一主要的摘要和索引服務(wù)中列出的雜志提供,或者在編輯委員會(huì)中擁有3個(gè)以上有主要資金機(jī)構(gòu)的研究經(jīng)費(fèi)的擁有人的雜志提供。
5、 OMIM — 在線人類孟德?tīng)栠z傳—經(jīng)常更新的人類基因和遺傳失調(diào)的目錄,有鏈接到其它相關(guān)的文獻(xiàn)參考,序列記錄,和相關(guān)數(shù)據(jù)庫(kù)。
6、 書籍 — 同書籍出版商合作NCBI為網(wǎng)絡(luò)改編了教科書,并把他們鏈接到PubMed—生物醫(yī)藥書目數(shù)據(jù)庫(kù)。這是為了給PubMed提供背景信息,這樣使用者可以探究在PubMed搜索結(jié)果中不熟悉的概念。目前收錄的書有:
7、 Molecular Biology of the Cell, 3rd ed. Alberts B., Bray D., Lewis J., Raff M., Roberts K., Watson J.D., 1994, Garland Publishing.
8、 外部鏈接 — 一個(gè)登記服務(wù),用于建立從在Entrez中的特定的文章,雜志,或生物數(shù)據(jù)到外部網(wǎng)址的鏈接。第三方可以提供一個(gè)URL,資源名字,關(guān)于他們網(wǎng)址的簡(jiǎn)要的描述,和關(guān)于從NCBI數(shù)據(jù)的哪里他們希望建立鏈接的詳細(xì)說(shuō)明。這個(gè)詳細(xì)說(shuō)明可以用對(duì)Entrez有效的布爾查詢來(lái)寫,也可以用特定的文章或序列的標(biāo)志列表來(lái)寫。這樣NCBI PubMed的用戶將可以通過(guò)“NCBI小房間”服務(wù)(開發(fā)中)來(lái)選擇哪個(gè)外部鏈接在他們的搜索中是可見(jiàn)的。
9、 引用匹配 — 允許你找到任何一篇在PubMed數(shù)據(jù)庫(kù)中的文章的PubMed ID或MEDLINE UID,給出書目信息(雜志,卷,頁(yè)碼等)。
10、 單篇文章的引用匹配。
11、 許多文章的批量引用匹配。
12、 E-mail引用匹配也是可以的,也可以用于單篇或許多文章。如果要獲得幫助文件,給citation_matcher@ncbi.nlm.nih.gov寫一封只有內(nèi)容為HELP的E-Mail。
Genomes and Maps Overview:
1、 Entrez基因組:人,小鼠,大鼠,酵母,線蟲,瘧原蟲,細(xì)菌,病毒,viroids,質(zhì)粒,和真核細(xì)胞器。
2、 Entrez基因組(各種物種)
3、 Entrez基因組 — 超過(guò)800種在GenBank中被完整測(cè)序的物種,包括大于500種病毒,〉25種細(xì)菌,酵母,和許多viroids,質(zhì)粒,和細(xì)胞器。還包括正在進(jìn)行中的基因組,比如人,小鼠,線蟲,瘧原蟲,果蠅,利什曼原蟲,水稻,和玉米。提供完成的基因組/染色體的圖形概覽,并可以探究那些逐步細(xì)化的區(qū)域。也提供那些已經(jīng)被NCBI工作人員分析過(guò)的物種的編碼區(qū)的摘要和TaxTables。另外,Entrez Map Viewer,Entrez基因組的一個(gè)軟件組成部分,提供整合的果蠅(細(xì)胞遺傳學(xué)和序列圖譜)和人類(細(xì)胞遺傳學(xué),遺傳連鎖,序列,放射雜交,和其它圖譜)的染色體圖譜的瀏覽。
4、 通過(guò)每個(gè)物種的Entrez基因組頁(yè)面來(lái)下載〈350kb的基因組。
5、 通過(guò)NCBI ftp站點(diǎn)來(lái)下載〉350kb的基因組—參見(jiàn)在genbank/genomes目錄下的readme文件,ftp鏈接在每個(gè)物種的Entrez基因組頁(yè)面上也有。
NCBI站點(diǎn)地圖---其他基因組數(shù)據(jù)介紹:
1、 小鼠基因組
1) 小鼠基因組資源向?qū)?:把從各個(gè)中心來(lái)的各種小鼠相關(guān)的資源整合在一起,包括序列,圖譜,和克隆信息以及指向小鼠種系和突變資源的指針。
2) 小鼠基因組測(cè)序:小鼠基因組計(jì)劃的測(cè)序進(jìn)展,HTG序列contigs(可以用大小和染色體號(hào)來(lái)瀏覽)由測(cè)序中心的數(shù)據(jù)建立,可以contig或染色體的形式來(lái)下載。
3) 小鼠UniGene :被整理成簇的EST和全長(zhǎng)mRNA序列,每一個(gè)代表一種特定已知的或假設(shè)的基因,有定位圖和表達(dá)信息以及同其它資源的交叉參考。序列數(shù)據(jù)可以以cluster形式在Unigene網(wǎng)頁(yè)下載,完整的數(shù)據(jù)可以從FTP站點(diǎn)repository/UniGene目錄下下載
4) 位點(diǎn)鏈接(LocusLink) :為校正過(guò)的序列和遺傳位點(diǎn)的描述信息提供一個(gè)單次查詢界面。LocusLink給每個(gè)位點(diǎn)發(fā)布一個(gè)穩(wěn)定的ID,并提供官方的命名,序列accesssion number, Unigene簇,圖譜信息,和相關(guān)的網(wǎng)址。LocusLink是NCBI,人類基因命名委員會(huì),OMIM和其它組織的合作結(jié)果。LocusLink目前包含人類,小鼠,大鼠,斑馬魚,和果蠅的位點(diǎn),物種可以被分開或合在一起查詢。
5) Entrez :包括了來(lái)自〉70000個(gè)物種的序列數(shù)據(jù),可以用物種字段來(lái)限制記錄只在小鼠搜索。
6) 人類/小鼠同源圖 :University of California at Davis的M. F. Seldin建立,一張比較人和老鼠在同源區(qū)段DNA上基因的表,按在每個(gè)基因組上的位置排列。
2、 大鼠基因組
1) 大鼠UniGene :被整理成簇的EST和全長(zhǎng)mRNA序列,每一個(gè)代表一種特定已知的或假設(shè)的基因,有定位圖和表達(dá)信息以及同其它資源的交叉參考。序列數(shù)據(jù)可以以cluster形式在Unigene網(wǎng)頁(yè)下載,完整的數(shù)據(jù)可以從FTP站點(diǎn)repository/UniGene目錄下下載
2) 位點(diǎn)鏈接(LocusLink):為校正過(guò)的序列和遺傳位點(diǎn)的描述信息提供一個(gè)單次查詢界面。LocusLink給每個(gè)位點(diǎn)發(fā)布一個(gè)穩(wěn)定的ID,并提供官方的命名,序列accesssion number, Unigene簇,圖譜信息,和相關(guān)的網(wǎng)址。LocusLink是NCBI,人類基因命名委員會(huì),OMIM和其它組織的合作結(jié)果。LocusLink目前包含人類,小鼠,大鼠,斑馬魚,和果蠅的位點(diǎn),物種可以被分開或合在一起查詢。
3、 斑馬魚基因組
1) 斑馬魚UniGene :被整理成簇的EST和全長(zhǎng)mRNA序列,每一個(gè)代表一種特定已知的或假設(shè)的基因,有定位圖和表達(dá)信息以及同其它資源的交叉參考。序列數(shù)據(jù)可以以cluster形式在Unigene網(wǎng)頁(yè)下載,完整的數(shù)據(jù)可以從FTP站點(diǎn)repository/UniGene目錄下下載
2) 位點(diǎn)鏈接(LocusLink) :為校正過(guò)的序列和遺傳位點(diǎn)的描述信息提供一個(gè)單次查詢界面。LocusLink給每個(gè)位點(diǎn)發(fā)布一個(gè)穩(wěn)定的ID,并提供官方的命名,序列accesssion number, Unigene簇,圖譜信息,和相關(guān)的網(wǎng)址。LocusLink是NCBI,人類基因命名委員會(huì),OMIM和其它組織的合作結(jié)果。LocusLink目前包含人類,小鼠,大鼠,斑馬魚,和果蠅的位點(diǎn),物種可以被分開或合在一起查詢。
4、 果蠅基因組
1) 黑腹果蠅主頁(yè) : 提供所有可使用的果蠅資源的概要,用圖形的方式顯示了染色體,允許你通過(guò)Entrez基因組瀏覽器的方法來(lái)搜索整個(gè)基因組的細(xì)胞遺傳和序列信息。Entrez基因組提供了對(duì)于一個(gè)物種一致的遺傳,物理,和序列數(shù)據(jù)的圖形界面。當(dāng)你用一個(gè)基因的代號(hào)來(lái)搜索時(shí),它給出搜索結(jié)果的一個(gè)圖形的基因組視圖,從那你可以放大到你所感興趣的區(qū)域的更詳細(xì)的圖譜視圖,并且鏈接到序列數(shù)據(jù)和包含更多信息的相關(guān)資源。
2) 黑腹果蠅基因組測(cè)序的狀態(tài) :描述了目前在GenBank,Entrez Genomes,和FTP站點(diǎn)中的數(shù)據(jù)的范圍
3) Entrez圖譜瀏覽器 :整合的染色體圖譜—圖譜瀏覽器是Entrez基因組的一個(gè)軟件組成部分,用來(lái)顯示一個(gè)或多個(gè)用共同標(biāo)記或基因名字互相align過(guò)的圖譜,以及用相同序列進(jìn)行比較過(guò)的序列圖譜。在人類基因組數(shù)據(jù)和搜索技巧文件中有關(guān)于目前可以使用的果蠅的序列和細(xì)胞遺傳學(xué)圖譜。Entrez圖譜瀏覽器的幫助文件提供了關(guān)于如何使用這個(gè)工具的一般說(shuō)明。
4) 位點(diǎn)鏈接(LocusLink): 為校正過(guò)的序列和遺傳位點(diǎn)的描述信息提供一個(gè)單次查詢界面。LocusLink給每個(gè)位點(diǎn)發(fā)布一個(gè)穩(wěn)定的ID,并提供官方的命名,序列accesssion number, Unigene簇,圖譜信息,和相關(guān)的網(wǎng)址。LocusLink是NCBI,人類基因命名委員會(huì),OMIM和其它組織的合作結(jié)果。LocusLink目前包含人類,小鼠,大鼠,斑馬魚,和果蠅的位點(diǎn),物種可以被分開或合在一起查詢。
5、 線蟲基因組
Entrez基因組:染色體的圖形表示,可以整個(gè)的查看,也可以逐步放大的看。鏈接到相關(guān)的序列數(shù)據(jù)。
6、 酵母基因組
1) Entrez基因組 :染色體的圖形表示,可以整個(gè)的查看,也可以逐步放大的看。鏈接到相關(guān)的序列數(shù)據(jù)。
2) COGs :相鄰類的聚簇 — 來(lái)自于完整基因組的基因家族自然系統(tǒng)。COGs用比較21種完整的基因組的編碼的蛋白序列描繪了17個(gè)主要的種系發(fā)生系統(tǒng)。每個(gè)COG包含至少來(lái)自3個(gè)世系的獨(dú)立蛋白或蛋白家族的相鄰體,所以對(duì)應(yīng)了一個(gè)古老的保守domain。
7、 瘧原蟲基因組
1) 瘧原蟲遺傳學(xué)和基因組:提供與瘧原蟲遺傳學(xué)和基因相關(guān)的數(shù)據(jù)和信息。資源包括物種特異的序列BLAST數(shù)據(jù)庫(kù)(惡性瘧原蟲,所有瘧原蟲,以及弓形蟲),基因組圖譜,連鎖標(biāo)記,以及遺傳學(xué)研究信息。鏈接到其他的瘧原蟲網(wǎng)站和相關(guān)的寄生蟲遺傳學(xué)數(shù)據(jù)庫(kù)包括弓形蟲。
2) Entrez基因組 — 惡性瘧原蟲的染色體全長(zhǎng)的圖形視圖,完整的染色體序列數(shù)據(jù)(2和3),鏈接到正在進(jìn)行的染色體的分離數(shù)據(jù)表(來(lái)自于HB3 X Dd2雜交的染色體),鏈接到其他基因組測(cè)序中心。
3) FTP站點(diǎn) (pub/Malaria目錄):用于查找在DNA序列中STS的電子PCR瘧原蟲版。
4) FTP站點(diǎn) (genbank/genomes 目錄):下載各種格式的完整的染色體序列數(shù)據(jù)(2和3),包括GenBank的flat file (*.gbk),GenBank的概要文件(*.gbs),F(xiàn)ASTA核酸文件(*.fna),F(xiàn)ASTA氨基酸文件(*.faa),蛋白表(*.ptt)和其他。
8、 細(xì)菌基因組
1) Entrez基因組 — 完整細(xì)菌基因組的圖形表示,可以整個(gè)的查看,也可以逐步放大的看。鏈接到相關(guān)的序列數(shù)據(jù)。對(duì)每一個(gè)細(xì)菌都提供了一個(gè)編碼區(qū)域的概要和TaxTable。
2) 微生物基因組測(cè)序計(jì)劃:完成的和正在進(jìn)行的測(cè)序計(jì)劃,鏈接到NCBI的圖形視圖和測(cè)序中心。
3) COGs :相鄰類的聚簇 — 來(lái)自于完整基因組的基因家族自然系統(tǒng)。COGs用比較21種完整的基因組的編碼的蛋白序列描繪了17個(gè)主要的種系發(fā)生系統(tǒng)。每個(gè)COG包含至少來(lái)自3個(gè)世系的獨(dú)立蛋白或蛋白家族的相鄰體,所以對(duì)應(yīng)了一個(gè)古老的保守domain。
4) FTP站點(diǎn): 下載各種格式的完整的細(xì)菌染色體序列數(shù)據(jù),包括GenBank的flat file (*.gbk),GenBank的概要文件(*.gbs),F(xiàn)ASTA核酸文件(*.fna),F(xiàn)ASTA氨基酸文件(*.faa),蛋白表(*.ptt)和其他。
5) 微生物基因組BLAST數(shù)據(jù)庫(kù) :與完成的和未完成的微生物基因組進(jìn)行BLAST