- 浏览: 231552 次
- 性别:
- 来自: 天朝帝都
文章分类
最新评论
-
hanmiao:
CSDN 博客地址是这個?http://blog.csdn.n ...
将博客搬至CSDN -
chenwq:
下载了,谢谢分享!
R语言学习入门 -
bbsunchen:
今天跟英姐聊天,她verbal考了151,不够啊,数学也不高。 ...
跟我一起考GRE(三) -
bbsunchen:
qinger说得对我今年只做三件事情:考好GRE,考好TOEF ...
IT行业成功必备的素质 -
bbsunchen:
还有8天就考试了,哥还在过单词啊
跟我一起考GRE(三)
关于RefSeq的基本信息,可以参照一下几篇文章【开启传送门~!@#¥%……&*】
http://www.biosino.org/pages/ncbi-10.htm
官方版本:http://www.ncbi.nlm.nih.gov/RefSeq/RSfaq.html
不过可能我现在更关注与RefSeq的格式说明,这一阶段的失败教训提醒我,数据分析的时候一定要搞清楚各个数据项的意义。
方便查阅
@ Method: For more:http://www.ncbi.nlm.nih.gov/RefSeq/key.html#accession
Accession
Molecule
Method @
Note
说明
AC_123456
Genomic
Mixed
Alternate complete genomic molecule. This prefix is used for records that are provided to reflect an alternate assembly or annotation. Primarily used for viral, prokaryotic records.
基因组序列,主要是病毒、原核生物。
AP_123456
Protein
Mixed
Protein products; alternate protein record. This prefix is used for records that are provided to reflect an alternate assembly or annotation. The AP_ prefix was originally designated for bacterial proteins but this usage was changed.
蛋白序列,AP_原本只用于细菌的蛋白。
NC_123456
Genomic
Mixed
Complete genomic molecules including genomes, chromosomes, organelles, plasmids.
全基因组序列,包括细胞器的、质粒等
NG_123456
Genomic
Mixed
Incomplete genomic region; supplied to support the NCBI genome annotation pipeline. Represents either non-transcribed pseudogenes, or larger regions representing a gene cluster that is difficult to annotate via automatic methods.
不完整的基因组序列,
NM_123456
NM_123456789mRNA
Mixed
Transcript products; mature messenger RNA (mRNA) transcripts.
成熟的mRNA
NP_123456
NP_123456789Protein
Mixed
Protein products; primarily full-length precursor products but may include some partial proteins and mature peptide products.
全长蛋白序列。但也有可能包括非全长的蛋白或成熟的多肽序列。
NR_123456
RNA
Mixed
Non-coding transcripts including structural RNAs, transcribed pseudogenes, and others.
不编码的RNA,假基因或其它
NT_123456
Genomic
Automated
Intermediate genomic assemblies of BAC and/or Whole Genome Shotgun sequence data.
BAC法或鸟枪法得到的基因组序列
NW_123456
NW_123456789Genomic
Automated
Intermediate genomic assemblies of BAC or Whole Genome Shotgun sequence data.
BAC法或鸟枪法得到的基因组序列
NZ_ABCD12345678
Genomic
Automated
A collection of whole genome shotgun sequence data for a project. Accessions are not tracked between releases. The first four characters following the underscore (e.g. 'ABCD') identifies a genome project.
'ABCD'代表的是具体的基因组计划
XM_123456
XM_123456789mRNA
Automated
Transcript products; model mRNA provided by a genome annotation process; sequence corresponds to the genomic contig.
转录序列
XP_123456
XP_123456789Protein
Automated
Protein products; model proteins provided by a genome annotation process; sequence corresponds to the genomic contig.
蛋白序列
XR_123456
RNA
Automated
Transcript products; model non-coding transcripts provided by a genome annotation process; sequence corresponds to the genomic contig.
不编码的转录序列,
YP_123456
YP_123456789Protein
Mixed
Protein products; no corresponding transcript record provided. Primarily used for bacterial, viral, and mitochondrial records.
蛋白序列,没有对应的转录序列。用于细菌、病毒和线粒体
ZP_12345678
Protein
Automated
Protein products; annotated on NZ_ accessions (often via computational methods).
蛋白序列。来自对应的NZ_开头的核酸序列。
NS_123456
Genomic
Automated
Genomic records that represent an assembly which does not reflect the structure of a real biological molecule. The assembly may represent an unordered assembly of unplaced scaffolds, or it may represent an assembly of DNA sequences generated from a biological sample that may not represent a single organism.
比较复杂
Mixed: indicates the process flow includes both automated processing and expert review for some of the records; curation analysis may be provided either by NCBI staff or collaborators.由专家手动检查过的
Automated: indicates records that are not individually reviewed; updates are released in bulk for a genome.自动注释的
发表评论
-
pan-genome analysis sample code
2012-12-25 12:50 1067This is a C++ demo for pan-geno ... -
绦虫基因组研究方法
2012-12-21 21:21 973今天跟一个同学讨论了绦虫基因组研究方法,同时我也看到一些同学在 ... -
PyDev,在Eclipse中运行python
2012-04-20 10:38 2400最近学python做高精度运算。 虽然网上有很多高精度运算的 ... -
并行计算的强大
2012-04-17 10:36 1546最近在处理一批数据,10的8次方,处理完毕大概要一个月,并且这 ... -
生物信息学工具使用的经验之谈
2012-01-16 18:08 1557荣耀归于上帝, ... -
如何保持开放的头脑
2012-01-07 15:14 1217世界向我打开一扇大门,我却选择转过身,背对这个世界。 ... -
ortholog/inparalog/coortholog
2012-01-04 16:52 1834Homologs which originat ... -
非root权限用户安装perl模块
2012-01-04 09:36 3095网上有很多说非root权限怎么安装perl模块的帖子,我觉 ... -
非root权限安装perl
2012-01-03 21:18 1662在使用Linux或是unix ... -
运行interproscan/iprscan会遇到的问题
2012-01-01 21:28 16391. 运行iprscan的时候,一般需要根据机器的能力和安装i ... -
Interproscan性能测试
2011-12-28 20:50 1632interproscan的安装和运行,很多网站都有介绍,这里主 ... -
华大的生物信息培训教材
2011-12-19 15:45 1263LOL... -
PAML中文文档/计算分子进化
2011-12-12 16:14 2786先说PAML中文文档,PA ... -
Qt程序在windows下的发布
2011-12-02 14:21 1570这个问题,其实 Qt 的 manual 中解释的已经比较 ... -
【原创】用C++(QT)写跨平台GUI详解
2011-12-02 10:53 2398你还不知道什么是Qt?... ...什么?你还不知道C++能快 ... -
数据可视化之美
2011-12-01 20:08 2299最近越来越对数据可视化感兴趣了,正因为此我学习了R,excel ... -
Perl也可以读写excel哦
2011-12-01 15:32 1689perl 里面用Spreadsheet::WriteExcel ... -
R语言学习入门
2011-12-01 15:28 2893R语言是很多统计学和数据可视化的常用工具。 R语言也是生物信 ... -
R语言绘制heatmap热图
2011-11-22 10:40 16099介绍如何使用 R 绘制 heatmap 的文章。 今天无意间 ... -
使用Vienna RNA进行RNA二级结构预测
2011-11-07 15:50 3214现在比较准确,比较流行的RNA二级结构预测软件就是Vi ...
相关推荐
RefSeq(Reference Sequence)是NCBI维护的一个高质量序列数据库,旨在提供一个稳定的参考框架,用于研究各种生物体的基因组、转录组和蛋白质组学信息。本篇文章将详细介绍如何从NCBI RefSeq中下载特定物种的蛋白质...
3. 在“NCBI Reference Sequences (RefSeq)”条目中找到“mRNA and Protein(s)”,点击NM,查找mRNA碱基序列。 4. 在页面下方会列出mRNA的序列。 方法二:使用UniProt数据库 1. 进入UniProt数据库...
* RefSeq 数据库:RefSeq 数据库是一个高质量的序列数据库,提供了详细的序列信息。 * UniGene 数据库:UniGene 数据库是一个基因表达数据库,提供了基因表达信息和序列信息。 * NCBI Gene 数据库:NCBI Gene 数据库...
在生物信息学领域,NCBI(National Center for Biotechnology Information)和UniProt(Universal Protein Resource)是两个重要的数据库,它们提供了丰富的蛋白质和基因序列信息。本文将详细介绍如何在这两个数据库...
例如,当您使用NCBI的参考序列作为模板并使用RefSeq mRNA作为参考数据库时,Primer-BLAST能够设计出只针对特定剪接变异体的特异引物。 #### 四、实例分析 以人尿嘧啶DNA糖基化酶(uracil-DNA glycosylase genes, ...
Entrez 系统可以检索包括 Gene Expression Omnibus(GEO)、Gene、Genome、HomoloGene、MeSH、NCBI Taxonomy、OMIM、PubMed、PubChem、RefSeq 等多种类型的生物信息 Resources。 1.1 NCBI 主页 NCBI 的主页提供了...
本资源摘要信息将对 NCBI_PDB 数据库的使用进行详细的介绍,包括 DNA 测序、序列数据的存储、序列数据的文件格式、序列数据的查询等方面。 一、DNA 测序 DNA 测序是指从生物样本中获取 DNA 序列的过程。常见的 DNA...
6. Refseq:是一个基因组序列数据库,收录了来自世界各地的基因组序列数据。 7. NCBI 的 Gene 信息数据库:是一个基因信息数据库,收录了来自世界各地的基因信息数据。 三、序列查询 序列查询是指根据特定的条件从...
NCBI的数据库包含了各种生物科学数据,如基因序列、蛋白质结构、基因表达数据等,是生物学家、医学研究人员和生物信息学家的重要参考资料来源。 **一、NCBI数据库概述** NCBI数据库是一个庞大的集合,包括但不限于...
Refseq数据库提供高质量、无冗余、完整的序列信息,包括DNA、RNA和蛋白质序列。NCBI的Gene信息数据库包含基因的位置、名称、结构等详细信息。对于蛋白质序列,Swissprot、TrEMBL和UniProt数据库是主要的资源,其中...
生物信息学的研究方法包括序列比对、系统发育分析和结构预测等,应用工具包括BLAST、PSI-BLAST、RefSeq、PDB 数据库、GenPept、TrEMBL 等,数据库包括NCBI、GenBank、RefSeq、PDB 数据库、UniProt 等。
例如,RefSeq项目是一个提供稳定参考序列的集合,涵盖了基因组、转录组和蛋白质组的数据,而Mouse Assembly则专注于小鼠的基因组组装,对于基因定位和功能研究至关重要。 NCBI的Map Viewer是一个强大的工具,允许...
NCBI数据库包括了多个数据库,包括GenBank、RefSeq、PubMed等。 NCBI数据库的集成界面是指将多个数据库集成到一起,提供一个统一的检索界面。这样可以方便用户快速检索到所需的生物信息数据。 Entrez是NCBI数据库...
Refseq是美国国家生物信息技术中心(NCBI)维护的一个非冗余参考序列数据库,包含了具有生物意义的基因和蛋白质序列,为研究者提供了标准化的数据资源。 PAM方阵是氨基酸置换矩阵,它根据一组相似蛋白质的对位排列...
GenBank中的每条记录都包含一系列标准字段,如LOCUS(序列名称)、ACCESSION(序列接受号)、DEFINITION(简要描述)、KEYWORDS(关键词)、SOURCE(来源)、ORGANISM(来源分类)、REFERENCE(参考文献)等。...
5. **基因注释**:注释基因功能、定位转录起始位点、确定编码区和非编码区,这些过程需要用到Ensembl、NCBI Gene、RefSeq等数据库和工具。 6. **网络生物学**:生物系统通常以复杂网络的形式表现,如蛋白质相互作用...
非常简单的python脚本,省去了从Uniprot和NCBI ... (2)RefSeq:哺乳动物参考序列的更新。 核酸研究。 2014年1月1日; 42(1):D756-63。 (3)Cock PJ等。 生物信息学(2009)(4)Cokelaer等人,生物信息学(2013)