Posted in: Biology Science, Science

从ENA下载SRA

最近(2020年以来),Aspera(ascp)无法从NCBI下载SRA了,但是可以用ENA下载。现在以(SRR10609482)为例:

第一步:获取准确链接

访问https://www.ebi.ac.uk/ena/browser/view/SRR10609482,获取准确链接如下:

ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR106/082/SRR10609482/SRR10609482_1.fastq.gz
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR106/082/SRR10609482/SRR10609482_2.fastq.gz

可以看出中间出现了一个奇怪的三位数082

第二步:打开防火墙33001端口

-I INPUT -p tcp --dport 33001 -j ACCEPT
-I OUTPUT -p tcp --dport 33001 -j ACCEPT

第三步:下载

ascp -P 33001 -v -k 1 -T -l 300m -i XXX/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR881/002/SRR8815512/SRR8815512_1.fastq.gz .
# 注意最后一个参数(.)不要忘记了(指下载目标路径)

这样子还有一个好处:下载下来的就是gzip压缩的FASTQ,无需从SRA解压。

那么,中间那个奇怪的三位数是什么?

通常情况下,它就是0+SRR ID的最后两位,例如本例是SRR10609482,那么中间三位数就是082。

但是,有时候会有例外,例如SRR8815512的中间三位数就是002,而不是012。这是很令人头疼的。

如果遇到错误?

如果看到下列错误:

Session Stop (Error: Failed to open TCP connection for SSH)
ascp: Failed to open TCP connection for SSH, exiting.

这是说明对方服务器抽风了,等一段时间(有时是几个小时,有时是几天)即可。


最后更新于 2021 年 1 月 15 日 作者 springwood

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注