`
bbsunchen
  • 浏览: 231552 次
  • 性别: Icon_minigender_1
  • 来自: 天朝帝都
社区版块
存档分类
最新评论

NCBI参考序列RefSeq

阅读更多

关于RefSeq的基本信息,可以参照一下几篇文章【开启传送门~!@#¥%……&*】

http://liucheng.name/381/

http://www.biosino.org/pages/ncbi-10.htm

官方版本:http://www.ncbi.nlm.nih.gov/RefSeq/RSfaq.html

 

不过可能我现在更关注与RefSeq的格式说明,这一阶段的失败教训提醒我,数据分析的时候一定要搞清楚各个数据项的意义。

方便查阅

Accession Molecule Method @ Note 说明 
AC_123456 Genomic Mixed Alternate complete genomic molecule. This prefix is used for records that are provided to reflect an alternate assembly or annotation. Primarily used for viral, prokaryotic records.  基因组序列,主要是病毒、原核生物。
AP_123456 Protein Mixed Protein products; alternate protein record. This prefix is used for records that are provided to reflect an alternate assembly or annotation. The AP_ prefix was originally designated for bacterial proteins but this usage was changed.  蛋白序列,AP_原本只用于细菌的蛋白。
NC_123456 Genomic Mixed Complete genomic molecules including genomes, chromosomes, organelles, plasmids.  全基因组序列,包括细胞器的、质粒等
NG_123456 Genomic Mixed Incomplete genomic region; supplied to support the NCBI genome annotation pipeline. Represents either non-transcribed pseudogenes, or larger regions representing a gene cluster that is difficult to annotate via automatic methods.  不完整的基因组序列,
NM_123456
NM_123456789
mRNA Mixed Transcript products; mature messenger RNA (mRNA) transcripts.  成熟的mRNA
NP_123456
NP_123456789
Protein Mixed Protein products; primarily full-length precursor products but may include some partial proteins and mature peptide products.  全长蛋白序列。但也有可能包括非全长的蛋白或成熟的多肽序列。
NR_123456 RNA Mixed Non-coding transcripts including structural RNAs, transcribed pseudogenes, and others.  不编码的RNA,假基因或其它
NT_123456 Genomic Automated Intermediate genomic assemblies of BAC and/or Whole Genome Shotgun sequence data.  BAC法或鸟枪法得到的基因组序列
NW_123456
NW_123456789
Genomic Automated Intermediate genomic assemblies of BAC or Whole Genome Shotgun sequence data.  BAC法或鸟枪法得到的基因组序列
NZ_ABCD12345678 Genomic Automated A collection of whole genome shotgun sequence data for a project. Accessions are not tracked between releases. The first four characters following the underscore (e.g. 'ABCD') identifies a genome project.  'ABCD'代表的是具体的基因组计划
XM_123456
XM_123456789
mRNA Automated Transcript products; model mRNA provided by a genome annotation process; sequence corresponds to the genomic contig.  转录序列
XP_123456
XP_123456789
Protein Automated Protein products; model proteins provided by a genome annotation process; sequence corresponds to the genomic contig.  蛋白序列
XR_123456 RNA Automated Transcript products; model non-coding transcripts provided by a genome annotation process; sequence corresponds to the genomic contig.  不编码的转录序列,
YP_123456
YP_123456789
Protein Mixed Protein products; no corresponding transcript record provided. Primarily used for bacterial, viral, and mitochondrial records.  蛋白序列,没有对应的转录序列。用于细菌、病毒和线粒体
ZP_12345678 Protein Automated Protein products; annotated on NZ_ accessions (often via computational methods).  蛋白序列。来自对应的NZ_开头的核酸序列。
NS_123456 Genomic Automated Genomic records that represent an assembly which does not reflect the structure of a real biological molecule. The assembly may represent an unordered assembly of unplaced scaffolds, or it may represent an assembly of DNA sequences generated from a biological sample that may not represent a single organism.  比较复杂

@ Method:   
Mixed: indicates the process flow includes both automated processing and expert review for some of the records; curation analysis may be provided either by NCBI staff or collaborators.由专家手动检查过的
Automated: indicates records that are not individually reviewed; updates are released in bulk for a genome.自动注释的

For more:http://www.ncbi.nlm.nih.gov/RefSeq/key.html#accession

0
0
分享到:
评论

相关推荐

    从NCBI refseq 中下载特定物种的蛋白质数据

    RefSeq(Reference Sequence)是NCBI维护的一个高质量序列数据库,旨在提供一个稳定的参考框架,用于研究各种生物体的基因组、转录组和蛋白质组学信息。本篇文章将详细介绍如何从NCBI RefSeq中下载特定物种的蛋白质...

    如何用NCBI和uniprot数据库查找目的蛋白的氨基酸序列或目的基因的碱基序列(mRNA序列).doc

    3. 在“NCBI Reference Sequences (RefSeq)”条目中找到“mRNA and Protein(s)”,点击NM,查找mRNA碱基序列。 4. 在页面下方会列出mRNA的序列。 方法二:使用UniProt数据库 1. 进入UniProt数据库...

    教你使用NCBI-PDB数据库(“序列”相关文档)共62张.pptx

    * RefSeq 数据库:RefSeq 数据库是一个高质量的序列数据库,提供了详细的序列信息。 * UniGene 数据库:UniGene 数据库是一个基因表达数据库,提供了基因表达信息和序列信息。 * NCBI Gene 数据库:NCBI Gene 数据库...

    如何用NCBI和uniprot数据库查找目的蛋白的氨基酸序列或目的基因的碱基序列(mRNA序列).pdf

    在生物信息学领域,NCBI(National Center for Biotechnology Information)和UniProt(Universal Protein Resource)是两个重要的数据库,它们提供了丰富的蛋白质和基因序列信息。本文将详细介绍如何在这两个数据库...

    Primer-BLAST:NCBI的引物设计和特异性检验工具

    例如,当您使用NCBI的参考序列作为模板并使用RefSeq mRNA作为参考数据库时,Primer-BLAST能够设计出只针对特定剪接变异体的特异引物。 #### 四、实例分析 以人尿嘧啶DNA糖基化酶(uracil-DNA glycosylase genes, ...

    NCBI及GeneBank介绍(CHENGWEI)-XXXX0327.pptx

    Entrez 系统可以检索包括 Gene Expression Omnibus(GEO)、Gene、Genome、HomoloGene、MeSH、NCBI Taxonomy、OMIM、PubMed、PubChem、RefSeq 等多种类型的生物信息 Resources。 1.1 NCBI 主页 NCBI 的主页提供了...

    教你使用NCBI_PDB数据库.ppt

    本资源摘要信息将对 NCBI_PDB 数据库的使用进行详细的介绍,包括 DNA 测序、序列数据的存储、序列数据的文件格式、序列数据的查询等方面。 一、DNA 测序 DNA 测序是指从生物样本中获取 DNA 序列的过程。常见的 DNA...

    2022教你使用NCBI-PDB数据库精选ppt.ppt

    6. Refseq:是一个基因组序列数据库,收录了来自世界各地的基因组序列数据。 7. NCBI 的 Gene 信息数据库:是一个基因信息数据库,收录了来自世界各地的基因信息数据。 三、序列查询 序列查询是指根据特定的条件从...

    NCBI检索方法.pptx

    NCBI的数据库包含了各种生物科学数据,如基因序列、蛋白质结构、基因表达数据等,是生物学家、医学研究人员和生物信息学家的重要参考资料来源。 **一、NCBI数据库概述** NCBI数据库是一个庞大的集合,包括但不限于...

    生物信息学第三讲序列的采集、存储和查询.ppt

    Refseq数据库提供高质量、无冗余、完整的序列信息,包括DNA、RNA和蛋白质序列。NCBI的Gene信息数据库包含基因的位置、名称、结构等详细信息。对于蛋白质序列,Swissprot、TrEMBL和UniProt数据库是主要的资源,其中...

    生物信息学复习题及答案(陶士珩).doc

    生物信息学的研究方法包括序列比对、系统发育分析和结构预测等,应用工具包括BLAST、PSI-BLAST、RefSeq、PDB 数据库、GenPept、TrEMBL 等,数据库包括NCBI、GenBank、RefSeq、PDB 数据库、UniProt 等。

    database生物信息数据库.ppt

    例如,RefSeq项目是一个提供稳定参考序列的集合,涵盖了基因组、转录组和蛋白质组的数据,而Mouse Assembly则专注于小鼠的基因组组装,对于基因定位和功能研究至关重要。 NCBI的Map Viewer是一个强大的工具,允许...

    山东大学生物信息学课件03生物信息学数据库及检索策略.pptx

    NCBI数据库包括了多个数据库,包括GenBank、RefSeq、PubMed等。 NCBI数据库的集成界面是指将多个数据库集成到一起,提供一个统一的检索界面。这样可以方便用户快速检索到所需的生物信息数据。 Entrez是NCBI数据库...

    生物信息学考试版.pdf

    Refseq是美国国家生物信息技术中心(NCBI)维护的一个非冗余参考序列数据库,包含了具有生物意义的基因和蛋白质序列,为研究者提供了标准化的数据资源。 PAM方阵是氨基酸置换矩阵,它根据一组相似蛋白质的对位排列...

    生物信息学数据库简介

    GenBank中的每条记录都包含一系列标准字段,如LOCUS(序列名称)、ACCESSION(序列接受号)、DEFINITION(简要描述)、KEYWORDS(关键词)、SOURCE(来源)、ORGANISM(来源分类)、REFERENCE(参考文献)等。...

    生物信息学中的常规分析工具课件

    5. **基因注释**:注释基因功能、定位转录起始位点、确定编码区和非编码区,这些过程需要用到Ensembl、NCBI Gene、RefSeq等数据库和工具。 6. **网络生物学**:生物系统通常以复杂网络的形式表现,如蛋白质相互作用...

    UniPyRange:从Uniprot DB获取蛋白质/ DNA截短构建体的工具-开源

    非常简单的python脚本,省去了从Uniprot和NCBI ... (2)RefSeq:哺乳动物参考序列的更新。 核酸研究。 2014年1月1日; 42(1):D756-63。 (3)Cock PJ等。 生物信息学(2009)(4)Cokelaer等人,生物信息学(2013)

Global site tag (gtag.js) - Google Analytics