Posted in: Biology Science

NGS检测体细胞突变数据分析几个要点

mapping

在参考基因组中可能会见到诸如 chr6_apd_hap1chr1_gl000191_random这样的序列,把它们去掉!否则bwa在做mapping时会认为这些区域的reads匹配不唯一,把mapping quality定为0,导致后续无法发现相应区域内的变异位点,造成假阴性!

CNV

不用什么特殊的软件或pipeline,直接使用samtools bedcov target.bed tumor.bam normal.bam去计算每个目标区间的覆盖度,然后除一下看看比例就行(用LOG2转换一下更形象)

SV

推荐使用COSMOS,速度比较快(5000X的大panel大约40min),无需复杂的参数,直接表格式结果,取size值高的即可(即supporting reads数目)。注意每个SV事件会列出两行。

SNP与INDEL

  1. 为了组合单倍型,GATK4 Mutect2可以加上--max-mnp-distance参数(默认是1,可以增大比如20),但这不是万能的!拿到VCF结果之后根据坐标排序仔细核对!必要时用IGV确认一下。
  2. FilterMutectCalls会添加很多过滤标签。一般采用排除法,把contamination、normal_artifact、weak_evidence、position 这些标签过滤掉即可。
  3. INDEL存在位置滑移的问题,需要确定位于cDNA 3′ 端(可以用IGV核对一下,反正IDNEL不多)
  4. –germline-resource 这个参数有时会带来一些假阴性(例如SNP正好落在里面),如果时间充裕可以去掉它再运行一次,看看有没有多出来位点

Posted in: IT, Science

图灵的“停机问题”

资料来自:科普书《复杂》和知乎网站

假设存在这么一个“停机程序”,不管它是怎么实现的,但是它能够回答“停机问题”:它接受一个“程序”和一个“输入”,然后判断这个“程序”在这个“输入”下是否能给出结果:

def is_halt(program, input) -> bool:
  # 返回 True  如果 program(input) 会返回
  # 返回 False 如果 program(input) 不返回
Posted in: Life

购房记

2019年

  • 年初:开始看房,但是感觉没有合意的(户型、朝向、周边环境、业主欠款情况),反而觉得自己现在租的这个最好,因此决定购买现在租的这个。
  • 5月9日-5月20日:与业主协商价格、付款方式、贷款银行、合同条款等,自己录入网签合同,预约银行面签时间。
  • 5月23日:和配偶、 业主一起去工商银行网点办手续:签合同、交定金、办理首期款资金监管(银行POS机刷的)、签各种贷款协议,由于是组合贷款,签字的地方比较多。
  • 5月26日:评估公司上门评估。
  • 5月27日:缴纳评估费。
  • 6月4日:公积金审核完毕(在微信小程序上查得)。
  • 6月13日: 工商银行电话审核。
  • 6月17日:工商银行通知贷款已审核通过(其实6月14日已经能在app上查询获得贷款结果)。
  • 6月20日:去不动产登记中心交件(在微信公众号上预约“国有建设用地使用权登记及房屋所有权转移登记”)、办理公证(业主香港人,需公证)
  • 6月27日:去不动产登记中心缴税、领证、办理抵押(那儿居然不让复印产权证,只能自己拍照扫描了)。银行放首期款给业主。
  • 7月3日:去把公积金取出来用了。
  • 7月7日:在工行app上查到了贷款合同,时间为7月4日,显示额度为71万。
  • 7月9日:工行贷款联系人告知商贷部分71万已放款,还款日期为下月开始每月9日。
  • 7月12日:公积金放款
Posted in: IT

一个用于定位含简并碱基的oligo的工具

能用于定位oligo(或primer)的工具很多,比如BioEdit、BLASTN都可以,但是它们不能处理简并碱基的情况,只会把简并碱基当成错配。

现在列一个能够用于定位含简并碱基的oligo的工具:usearch中的search_oligodb命令。

命令格式为:

usearch -search_oligodb [your/target/seq.fa] -db [your/probes.fa] -alnout or -blast6out [your/result] 

可用参数有:

-strand: plus or both
-maxdiffs: [int]
Back to Top