`
wanguan2000
  • 浏览: 69171 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

MAPQ should be 0 for unmapped read.

    博客分类:
  • seq
 
阅读更多

Ignoring SAM validation error due to lenient parsing:
Error parsing text SAM file. MAPQ should be 0 for unmapped read.; File chrm.sam; Line 1477
Line: HWI-ST499:5:23:21302:167400#GCCAAT    87    chrM    16518    60    55M    =    16319    -254    GGGTCATAAAGCCTAAATAGCCCACACGTTCCCCTTAAATAAGACATCACGATGG    bSbcWbccc_^b\_]da_ddcbcQcUfefcffffccdddde_eebffdddfaefd    XT:A:U    NM:i:2    XN:i:1    SM:i:37    AM:i:25    X0:i:1    X1:i:0    XM:i:2    XO:i:0    XG:i:0    MD:Z:3C50C0

 

sourceforge.net/mailarchive/forum.php?thread_name=4B957356.2000202@broadinstitute.org&forum_name=samtools-devel

 

> >>>>>>>> Exception in thread "main"
> >>>>>>>> net.sf.samtools.SAMFormatException: Error
> >>>>>>>> parsing text SAM file. MAPQ must should be 0 for unmapped  
> >>>>>>>> read.;
> >>>>>>>> File sorted.sam; Line 8910023
> >>>>>>>> Line: ./S2:747_1696_219 4 chr18 90771994 25 48M * 0 0
> >>>>>>>> AGGGTTAGGGTTAGGGTTAGGGTTAGGGTTAGGGTTAGTTTGGGGCTT
> >>>>>>>> ]]]]]]PLQ]]XW[]QA6H]]VI+3]M9FSIFG@... XT:A:U
> >>>>>>>> CM:i:1 XN:i:
> >>>>>>>> 10 X0:i:1 X1:i:0 XM:i:4 XO:i:0 XG:i:0 MD:Z:40C7
> >>>>>>>>
> >>>>>> You don't say what creature this is or how long its chr18
> >>>>>> sequence is, but
> >>>>>> this looks a lot like our favourite bwa "feature" in which
> >>>>>> spurious
> >>>>>> mappings bridging adjacent reference sequences are marked as
> >>>>>> unmapped but
> >>>>>> otherwise left intact (see the FAQ at http://bio

-
> >>>>>> bwa.sourceforge.net/ ).
> >>>>>>
> >>>>>> It would appear that bwa's leaving such non-mappings with a non-
> >>>>>> zero MAPQ
> >>>>>> and non-empty CIGAR conflicts with Picard's validity checking.
> >>>>>> (And other
> >>>>>> non-zero/empty fields are not great either, but those are the
> >>>>>> main ones
> >>>>>> that Picard currently checks.)
> >>>>>>
> >>>>>> Depending on your reference, this may or may not explain your
> >>>>>> particular
> >>>>>> problem.  Is your chr18 reference about 90772000 bases?
> >>>>>>
> >>>>>> (Also: picard typo :-))
> >>>>>>
> >>>>>> Cheers,
> >>>>>>
> >>>>>>  John
> >>>>>>


	
	
	
	
	
		<!-- 
		BODY,DIV,TABLE,THEAD,TBODY,TFOOT,TR,TH,TD,P { font-family:"DejaVu Sans Condensed"; font-size:x-small }
		 -->
	
	

HWI-ST499:5:23:21302:167400#GCCAAT 87 chrM 16518 60 55M = 16319 -254 GGGTCATAAAGCCTAAATAGCCCACACGTTCCCCTTAAATAAGACATCACGATGG bSbcWbccc_^b\_]da_ddcbcQcUfefcffffccdddde_eebffdddfaefd XT:A:U NM:i:2 XN:i:1 SM:i:37 AM:i:25 X0:i:1 X1:i:0 XM:i:2 XO:i:0 XG:i:0 MD:Z:3C50C0
HWI-ST499:5:44:16607:70588#GCCAAT 141 chrM 16476 25 100M = 16476 0 GTAGCTAAAGTGAACTGTATCCGACATCTGGTTCCTACTTCAGGGTCATAAAGCCTAAATAGCCCACACGTTCCCCTTAAATAAGACATCACGATGGATCggggggggggbffffffefbfffefgdggegbggfeefchff^ffWdcddffefegggffgfgggfgggddffefggggggggfggggegdfgadgegadXT:A:U NM:i:5 XN:i:4 SM:i:25 AM:i:0 X0:i:1 X1:i:0 XM:i:5 XO:i:0 XG:i:0 MD:Z:45C50C0G0G0G0
HWI-ST499:5:64:19795:166573#GCCAAT 151 chrM 16474 60 100M = 16387 -187 GGGTAGCTAAAGTGAACTGTATCCGACATCTGGTTCCTACTTCAGGGTCATAAAGCCTAAATAGCCCACACGTTCCCCTTAAATAAGACATCACGATGGA ddda\f_aegUdfdd]eN`eggedgggg_gageffgggdggggggggggdggggggeeeggggdgffdhedffcecggegfggegfggggggggggdggg XT:A:U NM:i:3 XN:i:2 SM:i:37 AM:i:37 X0:i:1 X1:i:0 XM:i:3 XO:i:0 XG:i:0 MD:Z:47C50C0G0
picard (http://picard.sourceforge.net/explain-flags.html) 会检查FLAG的含义如果为: read unmapped,就会报错CIGAR should have zero elements for unmapped read。MAPQ should be 0 for unmapped read 这个主要是在染色体的最后一点,BWA认为一个pair比对上了,另一个也在这个位置但是没有满足条件没有比对上 (如真好在最末尾,referance不够长了,就会产生这个错误。会给一个MAPQ值,和一个read unmapped得FLAGS。) lstFlags = [["read paired", 0x1], ["read mapped in proper pair", 0x2], ["read unmapped", 0x4], ["mate unmapped", 0x8], ["read reverse strand", 0x10], ["mate reverse strand", 0x20], ["first in pair", 0x40], ["second in pair", 0x80], ["not primary alignment", 0x100], ["read fails platform/vendor quality checks", 0x200], ["read is PCR or optical duplicate", 0x400]];
分享到:
评论

相关推荐

    mapq:Mapquest地理编码API的易于使用的包装器

    mapq 的易于使用的包装器。 确保注册。 安装 pip install mapq 设定值 使用mapq的最简单方法是在本地环境中设置MAPQUEST_API_KEY环境变量。 export MAPQUEST_API_KEY="my_api_key" 用法 有两种与mapq的API交互的...

    sam format

    5. MAPQ: 比对质量。 6. CIGAR: 对齐的压缩表示。 7. RNEXT: 下一个读段的参考序列名称。 8. PNEXT: 下一个读段的起始位置。 9. TLEN: 与参考序列的预期模板长度。 10. SEQ: 读段序列,大写字母表示与参考序列一致的...

    graphql:go中graphql的实验实现

    gographql 基于工作草案的GraphQL实现。 地位 该代码有效,但是离生产级还很远,并且不能实现整个工作草案。 探索执行者的模型,期望这会改变 ... "github.com/savaki/graphql/provider/mapq" ) func main () { mo

    TranSpotteR

    2.集群读取( cluster_reads ) MAPQ&gt; = 10的读取被视为唯一映射并聚集在一起。3.组装读取集群( construct_contigs ) 对于组装步骤,应用了采用Overlaps-Layout-Consensus(OLC)方法的自写组装功能,以将读取簇中...

    SAM BAM文件说明

    - MAPQ:映射质量得分 - CIGAR:比对信息字符串 - RNEXT:下一个片段的参考序列名称 - PNEXT:下一个片段的位置 - TLEN:插入片段长度 - SEQ:查询序列 - QUAL:每个碱基的质量得分 ##### 2.3 应用场景 SAM...

    Pipeline-SequencingQC:不同的质量控制指标来测试序列化运行

    比对质量(MAPQ)分数反映了比对的置信度,较低的MAPQ值可能表明比对的不确定性,需要考虑是否剔除。 6. **Coverage**:评估每个区域的测序深度,以确保覆盖均匀。不均一的覆盖率可能导致某些区域的分析结果偏差,...

    SAM文件的规格定义,对帮助理解物理文件有好处

    这些字段包括QNAME(读取名称)、FLAG(比对标志)、RNAME(参考序列名称)、POS(1-based比对位置)、MAPQ(映射质量)、CIGAR(操作字符串)、RNEXT(下一个片段的参考序列名称)、PNEXT(下一个片段的1-based位置...

    vcfanno:用其他VCF注释一个VCF

    对于BAM,当前支持depth( count ),“ mapq”和“ seq”。 vcfanno是用编写的,它支持用lua编写的自定义用户脚本。 它可以使用普通笔记本电脑上的9个文件,每秒对8,000个以上的变体进行注释,并具有34个注释,而...

Global site tag (gtag.js) - Google Analytics