必備軟件
Aspera 插件 下載網(wǎng)址 :https://www.ncbi.nlm.nih.gov/Traces/sra_sub/sub.cgi
每個(gè)過程對(duì)應(yīng)的網(wǎng)址:
NCBI注冊(cè) 網(wǎng)址:https://www.ncbi.nlm.nih.gov/account/
申請(qǐng)BioProject 網(wǎng)址:https://submit.ncbi.nlm.nih.gov/subs/bioproject/
申請(qǐng)BioSample 網(wǎng)址:https://submit.ncbi.nlm.nih.gov/subs/biosample/
上傳SRA 網(wǎng)址:https://www.ncbi.nlm.nih.gov/Traces/sra_sub/sub.cgi
數(shù)據(jù)整體上傳的流程圖如下:
1. 注冊(cè)NCBI
打開 NCBI,點(diǎn)擊右上角的“Log in”,如下圖:
很多同學(xué)現(xiàn)在打開NCBI想注冊(cè)/登錄的時(shí)候,會(huì)發(fā)現(xiàn)如下提示:強(qiáng)制性使用第三方進(jìn)行注冊(cè)/登錄。
2 創(chuàng)建Bio-Project
01.
輸入BioProject網(wǎng)址,先進(jìn)行個(gè)人信息完善,以便成功申請(qǐng)到 Bio-Project。點(diǎn)擊“My profile”完善個(gè)人信息后并點(diǎn)擊“Save”,即可完成填寫。
02
點(diǎn)擊 BioProject,再點(diǎn)擊 New submission,進(jìn)入BioProject 的信息填寫頁面,按照步驟進(jìn)行填寫。
A
Submitter界面直接點(diǎn)擊continue;
B
Project Type 界面,選擇 Raw sequence reads,有組裝數(shù)據(jù)的也選擇 Genome sequencing and assembly;Sample scope 有 5 類選擇:單一樣本,多個(gè)樣本,多物種,環(huán)境樣本,合成樣本等,可按照實(shí)際點(diǎn)擊,其中普通轉(zhuǎn)錄組選擇:Multiisolate;微生物多樣性或宏基因選擇Environment;
C
Target 界面,只需填寫研究物種拉丁文名即可;
D
General Info 界面,選擇數(shù)據(jù)釋放日期(可以立馬釋放,也可指定日期),Public description 部分對(duì)自己的研究簡要描述即可
E
BIOSAMPLE、PUBLICATIONS 界面可直接跳過,最后點(diǎn)擊 Submit,等待 NCBI 審核通過,即可完成 Bio-Project 的創(chuàng)建。
3
創(chuàng)建Bio-Sample
01
輸入BioSample網(wǎng)址,點(diǎn)擊 New submission,即出現(xiàn) BioSample 界面,如下:
02
Submitter界面直接點(diǎn)擊Continue;
03
General Information 界面,選擇數(shù)據(jù)釋放日期和樣本個(gè)數(shù),點(diǎn)擊 Continue;
如上傳表格數(shù)據(jù),以下載Excel表格為例進(jìn)行操作:
這里需要注意一下表頭的顏色,其中綠色為必填項(xiàng),藍(lán)色為選填項(xiàng),黃色為非填項(xiàng)。如果綠色的任何必填字段的信息不可用,可輸入“not collected”、“not applicable”或“missing”替代。藍(lán)色雖為選填項(xiàng),但至少填寫一個(gè),同樣出現(xiàn)何必填字段的信息不可用,請(qǐng)輸入“not collected”、“not applicable”或“missing”替代。黃色可以不予填寫。每一個(gè)單元格填寫是有格式要求的,可以點(diǎn)擊需要填寫的列名查看具體格式!
06
BioSample accession:注冊(cè)好的Biosample編號(hào)直接填寫;
Library ID:它是唯一的,我們可以使用物種拉丁文名命名。
Library strategy可以選擇WGS,Library source可以選擇Genomic,Library selection可以選擇size fractionation,Library layout可以選擇paired,Platform可以選擇illumina,instrument model可以選擇Illumina NovaSeq 6000;
Filetype可以選擇fastq;后面的Filename 可依次填寫M_sinensis_A_illumina_R1.fastq.gz、M_sinensis_A_illumina_R2.fastq.gz等,填寫完畢后點(diǎn)擊Continue。
D
Files界面:數(shù)據(jù)上傳的選擇方式,若單個(gè)文件數(shù)據(jù)量小于10G,樣本數(shù)小于300個(gè),我們推薦Aspera方式上傳(如下圖);
然后我們點(diǎn)擊choose files,選擇相應(yīng)的桌面文件,如下:
注意事項(xiàng):
(1)所有樣本的原始數(shù)據(jù)需放在同一目錄下;
(2)原始數(shù)據(jù)為 fastq 格式的壓縮文件;
(3)若為雙端測序,需要提供雙端的原始數(shù)據(jù),即 R1 端和 R2 端。
接著會(huì)顯示上傳界面,網(wǎng)頁版顯示如下:
Aspera軟件界面顯示如下:
03
待所有數(shù)據(jù)上傳成功后,我們就可以進(jìn)入確認(rèn)界面,點(diǎn)擊submit,即SRA數(shù)據(jù)上傳完成,我們只需等待NCBI審核通過,就可獲得對(duì)應(yīng)樣本的SRA編號(hào)。