Posted in: Science

【儿时文章回忆系列】扑朔迷离的南极古地图

小时候没有电脑和网络,只能看《小学生时代》杂志过日子。我对一些科技玄幻的文章感兴趣,反复看了多次都能背下来了。遗憾的是现在虽然可以在网上找到一些资料,却很难还原文章本身了。现在能做的,只能是收集不同资料、同时发挥自己的记忆力,尽量还原原貌。

人们发现并登上南极洲大陆考察、勘探、绘制南极洲地形图,全是1820年以后的事了。但令人难以置信的是,有人在距今450年之前就已绘制出了南极地图,为我们留下了一个地理和地图研究史上的谜案。

Posted in: Biology Science

GTF与GFF3的相互转换

GTF虽然比较古老,但确实有些软件(即使是最近的,例如SQANTI)会用到。转换的方法可能有各种各样,下面给出我实践过可行的方法:

GFF3转成GTF

gffread old.gff3 -E -F -T -o new.gtf
# -F   preserve all GFF attributes (for non-exon features)
# -E   show all warnings

GTF转成GFF3

gffread old.gtf -E -F --keep-genes -o new.gff3

可能有人会问GFF3转成GTF为什么不用gt gff3_to_gtf?主要问题在于这样子会把ID编号全部丢掉(我手头上的v1.5.8),所以不用了。

Posted in: Biology Science

PharmGKB数据库中的基因下载页面

PharmGKB有一个隐藏得很深的基因下载页面,在这里可以下载获得各种excel格式的Haploid定义表、功能表、频率表等。

URL是:https://www.pharmgkb.org/page/cyp2a6RefMaterials,把其中的cyp2a6替换成自己要的基因即可。

全部的基因列表是:https://www.pharmgkb.org/page/pgxGeneRef

Posted in: Biology Science, Science

从ENA下载SRA

最近(2020年以来),Aspera(ascp)无法从NCBI下载SRA了,但是可以用ENA下载。现在以(SRR10609482)为例,官方教程在此:

版本问题

目前 Aspera(ascp)最新的是4.2.X版,但是它有个问题是不存在 .aspera/connect/etc/asperaweb_id_dsa.openssh 这个文件,所以需要找老版本。遗憾的是官网下载老版本需要注册登录账号,因此这里提供一个 URL 解析的结果,下载 3.11.2 版:

https://d3gcli72yxqn2z.cloudfront.net/connect/bin/ibm-aspera-connect-3.11.2.63-linux-g2.12-64.tar.gz

步骤

获取准确链接

访问https://www.ebi.ac.uk/ena/browser/view/SRR10609482,获取准确链接如下:

ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR106/082/SRR10609482/SRR10609482_1.fastq.gz
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR106/082/SRR10609482/SRR10609482_2.fastq.gz

可以看出中间出现了一个奇怪的三位数082

Posted in: Science

日本各主要城市与我国东部城市纬度对照表

按纬度从北到南顺序

=== 北海道 ===
稚内 45°24′ 哈尔滨
旭川 43°46′ 长春
札幌 43°03′ 延边
函馆 41°46′ 沈阳

=== 东北地方 ===
青森 40°48′ 葫芦岛
仙台 38°15′ 沧州
新潟 37°54′ 石家庄

=== 关东地方 ===
东京 35°41′ 鹤壁
横滨 35°26′ 日照

=== 中部地方 ===
名古屋 35°10′ 菏泽

=== 近畿地方 ===
京都 35°00′ 临沂
大阪 34°41′ 郑州

=== 中国地方 ===
广岛 34°23′ 商丘

=== 四国 ===
松山 33°50′ 亳州

=== 九州 ===
福冈 33°35′ 淮安
熊本 32°48′ 阜阳
鹿儿岛 31°35′ 无锡

=== 冲绳 ===
那霸 26°12′ 福州(略偏南)
宫古 24°46′ 泉州

Posted in: Biology Science, Science

一些有意思的SNP

(一)参考基因组为minor allele

很多情况下,人类参考基因组上的碱基是major allele。但也有相当多的情况下,它们是minor allele,有时甚至是rare allele。

BRCA2基因上有一个变异位点编号为rs169547,为非同义突变。全世界98%的人都是等位基因C,只有2%的人是等位基因T。

但是参考基因组上的等位基因是T(GRCh37和38都是),这纯属侥幸。

Back to Top