最近(2020年以来),Aspera(ascp)无法从NCBI下载SRA了,但是可以用ENA下载。现在以(SRR10609482)为例:
第一步:获取准确链接
访问https://www.ebi.ac.uk/ena/browser/view/SRR10609482,获取准确链接如下:
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR106/082/SRR10609482/SRR10609482_1.fastq.gz
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR106/082/SRR10609482/SRR10609482_2.fastq.gz
可以看出中间出现了一个奇怪的三位数082。
第二步:打开防火墙33001端口
-I INPUT -p tcp --dport 33001 -j ACCEPT
-I OUTPUT -p tcp --dport 33001 -j ACCEPT
第三步:下载
ascp -P 33001 -v -k 1 -T -l 300m -i XXX/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR881/002/SRR8815512/SRR8815512_1.fastq.gz .
# 注意最后一个参数(.)不要忘记了(指下载目标路径)
这样子还有一个好处:下载下来的就是gzip压缩的FASTQ,无需从SRA解压。
那么,中间那个奇怪的三位数是什么?
通常情况下,它就是0+SRR ID的最后两位,例如本例是SRR10609482,那么中间三位数就是082。
但是,有时候会有例外,例如SRR8815512的中间三位数就是002,而不是012。这是很令人头疼的。
如果遇到错误?
如果看到下列错误:
Session Stop (Error: Failed to open TCP connection for SSH)
ascp: Failed to open TCP connection for SSH, exiting.
这是说明对方服务器抽风了,等一段时间(有时是几个小时,有时是几天)即可。
最后更新于 2021 年 1 月 15 日 作者 springwood