`
wanguan2000
  • 浏览: 69118 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

sam提取unmapped seq

    博客分类:
  • seq
 
阅读更多

__author__ = 'wanguan2000'
#coding=utf-8
import os.path
import os
import sys
import re


filename = '/home/wanguan2000/pg/myNGS/result_NGS/cui3132/s31_1_s31_2.sam'
n = 0
m = 0
mn = 0
mydict ={}

with open(filename,'rU') as f:
    for line in f:
        line = line.rstrip()
        if not line:
            break
        if not line.startswith('@'):

           spline = line.split('\t')
           if 'chr21' == spline[2]:
               mn+=1
               print line

              
'''
           if not spline[2].startswith('chr'): # or spline[10] == '*':

              # print line
               n +=1
               mydict[spline[2]] = mydict.get(spline[2],0)+1
           elif '*' in spline[10]:
               m +=1
           elif '0' == spline[4]:
'''
               #mydict[spline[2]] = mydict.get(spline[2],0)+1
        #else:
            #print line

print n
print m
print mn
'''
for mykey in mydict:
    print('%s\t%d' % (mykey,mydict[mykey]))
   

def readSam(filename,filehead='@HWI-ST499'):
    n = 0
    with open(filename,'rU') as f:
        while True:
            line = f.readline
            line = line.rstrip()
            if not line:
                break
            if line.startswith(filehead):
                print line

       
'''

分享到:
评论

相关推荐

    seq-format-conversion:在序列数据格式之间转换的工作流程

    序列格式转换在序列数据格式之间转换的工作流程补习班: 此脚本应将 CRAM 转换为 SAM 到 BAM,并输出 BAM、BAM 索引和验证报告。 之所以选择这种方法,而不是直接使用 Samtools 将 CRAM 转换为 BAM,是因为由于...

    hibernate对象三状态及OneToOne&OneToMany&ManyToMany

    在Java世界中,Hibernate是一个非常流行的ORM(对象关系映射)框架,它简化了数据库操作,使得开发者可以使用面向对象的方式来处理数据。本篇将详细阐述Hibernate中的对象三状态、一对一(OneToOne)、一对多...

    ramfs文件系统源码

    ramfs 是一个内核文件系统,对于学习Linux下的文件系统是一个很好的资源,可以通过阅读源码了解文件系统,也可以参考编写自己的文件系统

    linux内核0.11(含完全注释PDF)

    Linux内核0.11是Linux操作系统历史上的一个重要里程碑,它是Linus Torvalds在1991年发布的早期版本,标志着Linux系统开始走向成熟。这个版本的内核虽然功能相对简单,但对于理解Linux内核的基本工作原理和设计思想...

    Error:No such property: GradleVersion for class: JetGradlePlugin

    情景:从项目中拿到一个客户的demo工程,或者导入一个别人的工程,编译时出现 Error:No such property: GradleVersion for class: JetGradlePlugin: 原因:这是gradle的版本太高导致的 解决办法: ...

    grape-middleware-logger:记录Grape应用程序的中间件

    应用程序的记录器 日志: 请求路径参数端点类名称和处理程序回应状态请求的持续时间例外情况来自error!错误响应error!安装将此行添加到您的应用程序的Gemfile中: gem 'grape' , '>= 0.17'gem 'grape-middleware-...

    使用Simulink配置AUTOSAR Client-Server通信

    Simulink是MathWorks公司开发的一款集成在MATLAB中的多领域仿真和基于模型的设计工具。它提供了一个可视化的环境,用于对复杂的嵌入式系统进行建模、仿真、自动代码生成,以及对嵌入式系统的性能进行验证和测试。...

    9.内核访问外设IO资源1

    2. **Kernel Space Unmapped Cached**:位于0x80000000到0x9FFFFFFF,这部分特殊在于它的映射关系是硬件直接确定的,不经过MMU。虽然同样对应物理地址0x00000000到0x20000000,但它被设计为无缓存的访问方式,可能...

    linux s3c2440LCD驱动分析

    .get_unmapped_area = get_fb_unmapped_area, #endif #if defined(CONFIG_FB_DEFERRED_IO) .fsync = fb_deferred_io_fsync, #endif }; ``` 这些函数提供了读写操作、设备映射、打开关闭等基本功能,它们由内核...

    Design_Compiler Scripts

    - **`write -fddc -hierarchy -output ${UNMAPPED_PATH}/%{TOP_MODULE}.ddc`**: 将未映射的设计写入DDC文件。 #### 4. 定义时钟 ```tcl # Step4: Define clock set CLK_NAME clk_i set CLK_PERIOD 10 set CLK_SKEW...

    file_operations结构体解析.doc

    get_unmapped_area 函数用于获取未映射的内存区域。 23. int (*check_flags) (); 该成员是一个指向 check_flags 函数的指针。check_flags 函数用于检查文件标志。 24. int (*dir_notify) (); 该成员是一个指向 ...

    基于MIPS 的BootLoader 的移植

    在此模式下,内存被划分为多个区域,包括unmapped和uncached区域,这些区域对于Bootloader的初始化过程至关重要。unmapped区域意味着直接访问物理地址,而uncached区域则表示该区域的数据不会被缓存在cache中。 ###...

    Spring Boot 使用addviewController()实现无业务逻辑跳转,,出现静态资源映射找不到的情况 。No mapping for GET xx.css

    本文将围绕标题和描述中提到的问题进行深入解析,特别是当使用`addViewController()`方法实现无业务逻辑跳转时遇到静态资源映射找不到的情况。 1. **实现无业务逻辑跳转** 在传统的Spring MVC中,我们会为每个需要...

    SSPACE for scaffolding

    The main featues are; * Inputs are simple ...* Possible contig extension of unmapped sequence reads * Easy interpretation of the final scaffolds * Visualization of the final scaffolds using GraphViz

    pafpy:一个轻量级的库,用于处理PAF(成对mApping格式)文件

    帕菲 一个轻量级的库,用于处理 (成对mApping格式)文件。 文档: : 目录 安装 皮皮 pip install pafpy conda ...conda install -c bioconda...# you should see a (unmapped) PAF record printed to the terminal

    gatk4-genome-processing-pipeline:用于处理全基因组序列数据 + 种系变异调用的工作流程。 此 Repository 已存档,请访问 ReadMe 链接以获取最新版本的工作流

    要求/期望未映射 BAM (uBAM) 格式的人类全基因组双端测序数据一个或多个读取组,每个 uBAM 文件一个,都属于单个样本 (SM) 输入 uBAM 文件还必须符合以下要求: 文件名都有相同的后缀(我们使用“.unmapped.bam”) ...

    IntelliJ-Forge-Mapping-Hints:IntelliJ IDEA插件,显示用于SRG映射开发的镶嵌提示

    CSV必须遵循以下规则: 需要标题行列: validated ( TRUE / FALSE ) class name (字符串) unmapped name (字符串) mapped name (字符串) comment (字符串,可选) 没有引号解析或转义,前四个逗号必须是定...

Global site tag (gtag.js) - Google Analytics