Posted in: Biology Science

利用 Trinity+IGV 将 BLAT 的结果可视化

课题组经常需要验证某个(或某些)注释的内含子是否存在,于是就需要使用转录数据去 map 基因组。转录数据目前常用的有两类,一类是高通量测序的 RNA-seq,这种 Map 比较简单,使用 tophat 处理即可得到比对结果,然后用 IGV 就可以实现可视化。输入数据是参考基因组和比对结果(tophat 输出的是 bam 文件,在导入 IGV 之前记得把两个数据都用 samtools 做一下索引,否则速度慢得有你好受的……)

另一类是 EST,它们的序列比 RNA-seq 长一些,而且长度不等。这类 Map 主要是使用 BLAT 来完成。但是 BLAT 默认输出的 psl 格式的结果极其难读,更不用提可视化了。今天在网上找到了一个方法,利用 Trinity 里面的一个实用工具居然可以调用 BLAT 并产生 bam 格式的比对结果。特此记录一下。

Posted in: Biology Science

从猴子到人

最近需要做一个课题需要涉及到与人近缘的物种,以前脑子里模模糊糊的印象有大猩猩、黑猩猩、猩猩,究竟谁排前面谁排后面仍然是一头雾水。今天正好整理了一下。

首先是到 ensembl 物种页面上找,看到长得像人(猴子)的,就记下来,一共找到 7 个,然后把这些名字输入到 NCBI 的物种分类网站上,定出大致的先后顺序。不过给出的结果把人、大猩猩、黑猩猩并列了,于是再到 TIME TREE 网站上找人与各个物种的分歧时间,结果出来了:应该先是黑猩猩,再是大猩猩。而且,其他6个物种与人都有分歧时间的数据。

附图:(那些数字就是分歧时间,单位:百万年)

Back to Top