Posted in: Biology Science, IT, PC/macOS

用 chatGPT API 武装了一下 macOS

3月1日(日本时间则是3月2日) chatGPT API 发布,从此不用每次都傻傻地打开那个聊天窗口一问一答,而是可以把 AI 服务更加无缝地结合在自己的电脑里。当然这不是永久免费使用的,只是给了每个新注册账户(必须要非中国的手机号认证!)18美元的免费额度,看样子好像是4月1日到期,不确定后面是否还有。

Posted in: Biology Science, Python

7天用 Flask 开发完一个生物信息学数据库的体会

这不是教程,而是我的随笔✏️

以前,做普通计算时用 Perl,开发数据库网页后台却用 PHP,然后前端还要用 JavaScript,简直要把人折腾死。后来普通计算从 Perl 转到 Python,发现 Python 有个工具叫做 Flask 可以代替 PHP 作为网页后台,那就方便了,能省用一种语言。

第一个 Flask 开发的工具是 2019 年刚开始学 Python 时开发的一个 Pipeline,不涉及数据库查询,只是接收输入、后台计算,得到结果,页面只有一个,比较简单。

这次开发的是真正的数据库,多个页面,需要与 MySQL 对接,而且也有 Pipeline 的内容。一共花了 7 天时间。生物信息学数据库与传统IT不一样的在于它多为纯查询类,不允许用户进行数据的增加、删除、修改,看起来应该很简单,但由于经常涉及到后台计算,可能还会碰到多线程分配问题。下面列条目说一下体会:

Posted in: Biology Science, Life, News

收到了来自国外的快递🏣:我会被传染新冠🦠吗?

最近各地几起病例都找不到源头,于是就甩锅给境外邮件。上面一甩锅,下面就得执行,小区门口马上设立“入境邮快件接收点”和“境外快递包装📦弃置桶”,以显示认真尽责的态度。按现在的规定:境外快递的收件人必须在接收点实名登记、戴着手套🧤和护目镜🥽,当场拆封、消毒、丢弃外包装。

Posted in: Biology Science, Science

最难懂的中学语文课文之一《这个世界的音乐》

这篇文章出现在我上高一时的语文书上(人教版2003版)。原作者是托马斯·刘易斯(Lewis Thomas),来自他的著作《细胞生命的礼赞——一个生物学观察者的手记》(1974年)(The Lives of a Cell: Notes of a Biology Watcher)。翻译者是湖南科学技术出版社《第一推动丛书》。该文章的英文原名叫做:The Music of This Sphere,中文译名:《这个世界的音乐》。难点在文章的最后一段,我当时的语文老师直言:怎么看都看不懂

英文原文发表在著名的《新英格兰杂志》上(New England Journal of Medicine)。中文原文由于官方不公开,我只好从第三方随便搞一个。

下面我就把课本上的中文译文和英文原文对照起来一起展示。

Posted in: Biology Science

GTF与GFF3的相互转换

GTF虽然比较古老,但确实有些软件(即使是最近的,例如SQANTI)会用到。转换的方法可能有各种各样,下面给出我实践过可行的方法:

一、GFF3转成GTF

gffread old.gff3 -E -F -T -o new.gtf
# -F   preserve all GFF attributes (for non-exon features)
# -E   show all warnings

二、GTF转成GFF3

gffread old.gtf -E -F --keep-genes -o new.gff3

可能有人会问GFF3转成GTF为什么不用gt gff3_to_gtf?主要问题在于这样子会把ID编号全部丢掉(我手头上的v1.5.8),所以不用了。

Posted in: Biology Science

PharmGKB数据库中的基因下载页面

PharmGKB有一个隐藏得很深的基因下载页面,在这里可以下载获得各种excel格式的Haploid定义表、功能表、频率表等。

URL是:https://www.pharmgkb.org/page/cyp2a6RefMaterials,把其中的cyp2a6替换成自己要的基因即可。

全部的基因列表是:https://www.pharmgkb.org/page/pgxGeneRef

Posted in: Biology Science, Science

从ENA下载SRA

最近(2020年以来),Aspera(ascp)无法从NCBI下载SRA了,但是可以用ENA下载。现在以(SRR10609482)为例,官方教程在此:

版本问题

目前 Aspera(ascp)最新的是4.2.X版,但是它有个问题是不存在 .aspera/connect/etc/asperaweb_id_dsa.openssh 这个文件,所以需要找老版本。遗憾的是官网下载老版本需要注册登录账号,因此这里提供一个 URL 解析的结果,下载 3.11.2 版:

https://d3gcli72yxqn2z.cloudfront.net/connect/bin/ibm-aspera-connect-3.11.2.63-linux-g2.12-64.tar.gz

第一步:获取准确链接

访问https://www.ebi.ac.uk/ena/browser/view/SRR10609482,获取准确链接如下:

ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR106/082/SRR10609482/SRR10609482_1.fastq.gz
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR106/082/SRR10609482/SRR10609482_2.fastq.gz

可以看出中间出现了一个奇怪的三位数082

Back to Top