`
bachelor007
  • 浏览: 55266 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

基础概念篇

阅读更多

1、CDS

      指编码区序列(coding sequence)。在核酸序列中能够翻译成蛋白质氨基酸序列的部分。(该段核酸序列要有起始与终止密码子)

 

SNP的概念和特点

 

单核苷酸多态性(single nucleotide polymorphism,SNP),主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。

SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换(transition)或颠换(transversion)所引起,也可由碱基的插入或缺失所致。但通常所说的SNP并不包括后两种情况。

理论上讲,SNP既可能是二等位多态性,也可能是3个或4个等位多态性,但实际上,后两者非常少见,几乎可以忽略。因此,通常所说的SNP都是二等位多态性的。这种变异可能是转换(C T,在其互补链上则为G A),也可能是颠换(C A,G T,C G,A T)。转换的发生率总是明显高于其它几种变异,具有转换型变异的SNP约占2/3,其它几种变异的发生几率相似。Wang等的研究也证明了这一点。转换的几率之所以高,可能是因为CpG二核苷酸上的胞嘧啶残基是人类基因组中最易发生突变的位点,其中大多数是甲基化的,可自发地脱去氨基而形成胸腺嘧啶。

在基因组DNA中,任何碱基均有可能发生变异,因此SNP既有可能在基因序列内,也有可能在基因以外的非编码序列上。总的来说,位于编码区内的SNP(coding SNP,cSNP)比较少,因为在外显子内,其变异率仅及周围序列的1/5.但它在遗传性疾病研究中却具有重要意义,因此cSNP的研究更受关注。

从对生物的遗传性状的影响上来看,cSNP又可分为2种:一种是同义cSNP(synonymous cSNP),即SNP所致的编码序列的改变并不影响其所翻译的蛋白质的氨基酸序列,突变碱基与未突变碱基的含义相同;另一种是非同义cSNP(non-synonymous cSNP),指碱基序列的改变可使以其为蓝本翻译的蛋白质序列发生改变,从而影响了蛋白质的功能。这种改变常是导致生物性状改变的直接原因。cSNP中约有一半为非同义cSNP。

先形成的SNP在人群中常有更高的频率,后形成的SNP所占的比率较低。各地各民族人群中特定SNP并非一定都存在,其所占比率也不尽相同,但大约有85%应是共通的。

SNP自身的特性决定了它更适合于对复杂性状与疾病的遗传解剖以及基于群体的基因识别等方面的研究:

1、 SNP数量多,分布广泛。据估计,人类基因组中每1000个核苷酸就有一个SNP,人类30亿碱基中共有300万以上的SNPs.SNP 遍布于整个人类基因组中,根据SNP在基因中的位置,可分为基因编码区SNPs(Coding-region SNPs,cSNPs)、基因周边SNPs(Perigenic SNPs,pSNPs)以及基因间SNPs(Intergenic SNPs,iSNPs)等三类。

2、 SNP适于快速、规模化筛查。组成DNA的碱基虽然有4种,但SNP一般只有两种碱基组成,所以它是一种二态的标记,即二等位基因(biallelic)。 由于SNP的二态性,非此即彼,在基因组筛选中SNPs往往只需+/-的分析,而不用分析片段的长度,这就利于发展自动化技术筛选或检测SNPs.

3、 SNP等位基因频率的容易估计。采用混和样本估算等位基因的频率是种高效快速的策略。该策略的原理是:首先选择参考样本制作标准曲线,然后将待测的混和样本与标准曲线进行比较,根据所得信号的比例确定混和样本中各种等位基因的频率。

4、 易于基因分型。SNPs 的二态性,也有利于对其进行基因分型。对SNP进行基因分型包括三方面的内容:(1)鉴别基因型所采用的化学反应,常用的技术手段包括:DNA分子杂交、引物延伸、等位基因特异的寡核苷酸连接反应、侧翼探针切割反应以及基于这些方法的变通技术;(2)完成这些化学反应所采用的模式,包括液相反应、固相支持物上进行的反应以及二者皆有的反应。(3)化学反应结束后,需要应用生物技术系统检测反应结果。

 

 EST篇

EST(Expressed Sequence Tag)表达序列标签:是指从不同组织来源的cDNA序列
EST技术直接起源于人类基因组计划。由于人类基因数量巨大,以及真核基因特有的复杂性(如内含子、外显子的区别、重复序列等),使得一次性不加选择地对基因组全长进行测序成为几乎不可能完成的工作。Venter等人在1991年提出了表达序列标签(EST)技术。

EST的原理:
EST是从一个随机选择的cDNA 克隆进行5’端和3’端单一次测序获得的短的cDNA 部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20 到7000bp 不等,平均长度为360 ±120bp 。EST 来源于一定环境下一个组织总mRNA 所构建的cDNA 文库,因此EST也能说明该组织中各基因的表达水平。

 

EST数据库并非完美无瑕,因为ESTs不能被剪切为单列序列位点识读,故精确度只能达到97%,另外,ESTS受制于表达倾向(expression bias),因为产生ESTs的cDNA是组织中丰富的mRNA以一定比例反转录而成,因此,表达水平很低的EST数据库中找到,而表达量高的基因在EST数据库中却过量存在。虽然可在起始mRNA或由它合成双链cDNA时进行富集,减小cDNA文库,但cDNA文库中仍存在大量高丰度的cDNA克隆。因此,一个理想的cDNA文库必须去除或尽量消除多科信息克隆的影响,这就涉及到cDNA文库的前加工技术;均等化(normalization),减少与丰富编码基因相关的cDNA数目;消减杂交(subtractive hybridization),应用序列标记cDNA识别并去除文库中多余的克降,这些技术的发展,使基因识别更依赖于EST技术,甚至可通过该技术获得精确的基因组DNA序列,在华盛顿大学基因组测序中心和Sanger中心的联合攻关下,C.elegans基因组10亿个碱基对的测序工作基本完成。因此ESTs是一系列基因寻找工具中不可缺少后部分,而这些工具都是基因组序列为基础的。EST技术关于基因组DNA序列的其他应用还包括对基因内含子、外是子排列的精确预测,选择性接合事件的识别,反常基因组排列结构的识别等。


ESTs中的s代表来源于同一cDNA的不同克隆群。

简单些的描述:我们可以对猪EST数据库进行筛选,获得高度同源的猪ESTs,构建EST重叠群...............

http://5ibio.com/html/DNA/genome/20080802/17723.html

 

cap3:

 

  • cap.rar (108.8 KB)
  • 下载次数: 3
分享到:
评论

相关推荐

    00-Linux内存管理之一:基本概念篇.rar

    总的来说,"00-Linux内存管理之一:基本概念篇"涵盖了Linux内存管理的基础知识,包括内存划分、地址映射、内存分配与释放、缓冲和缓存等。理解和掌握这些概念对于优化Linux系统性能和编写高效的应用程序具有重要意义...

    《数据库系统概论》基本概念篇(第5版王珊萨师煊编著).pdf

    "《数据库系统概论》基本概念篇(第5版王珊萨师煊编著)" 数据库系统概论是计算机科学与信息技术领域的重要组成部分,本书《数据库系统概论》基本概念篇(第5版王珊萨师煊编著)系统地介绍了数据库系统的基本概念、...

    網路行銷教案-壹、基本概念篇

    網路行銷教案-壹、基本概念篇

    20210723-光大证券-财政政策专题研究系列之六:国债恢复发行40年演变之基础概念篇.pdf

    20210723-光大证券-财政政策专题研究系列之六:国债恢复发行40年演变之基础概念篇.pdf

    新概念900句基础篇

    《新概念900句基础篇》是一款专为英语学习者设计的移动英语课程资源,旨在帮助用户通过听、说、练的方式扎实掌握英语基础知识。该课程以900个常用句子为核心,覆盖日常生活、工作及学习场景,是提高英语听说能力的...

    黑金教程概念篇

    《黑金教程概念篇》是针对Verilog语言的基础学习资源,旨在帮助初学者或有经验的工程师深入理解Verilog的设计概念和技术。Verilog是一种广泛应用于硬件描述语言(HDL)的编程语言,它允许设计者用类似于高级程序设计...

    新概念必背36篇

    《新概念必背36篇》:精炼学习材料与高效英语提升策略 《新概念必背36篇》是一部经过精心挑选的经典英语学习资料,它源于《新概念英语》第三册和第四册中的精华篇章,共计36篇。这份资料的编纂者基于考研英语的需求...

    python 零基础学习篇-01.大数据基本概念--课程内容介绍.mp4

    python 零基础学习篇-01.大数据基本概念--课程内容介绍.mp4

    Artix Microblaze两篇基础篇高级 篇

    1. **Microblaze概述**:解释了Microblaze的基本概念,包括其设计灵活性、硬件加速能力以及在FPGA中的应用范围。 2. **Microblaze架构**:深入解析Microblaze处理器的内部结构,包括流水线、寄存器、ALU(算术逻辑...

    PC技术内幕系列专题(七)——CPU技术内幕之基本计算概念篇.pdf

    《PC技术内幕系列专题(七)——CPU技术内幕之基本计算概念篇》深入解析了CPU这一复杂的计算核心,强调了理解和分析CPU时不应局限于物理层面和最新技术,而是要重视基本的计算概念。文章旨在为非计算机硬件专业的...

    java程序语言设计 梁勇 第十版(基础篇+进阶篇) 课后习题答案

    4. **类与对象**:面向对象编程的基本概念,类的定义、对象的创建与使用,封装、继承和多态的概念。 5. **数组**:一维数组和多维数组的声明、初始化及操作。 6. **字符串**:String类的使用,字符串操作方法,以及...

    Protege基础篇+推理篇+进阶篇

    在基础篇中,我们将深入理解Protege的核心概念和基本操作。 1. **界面介绍**:Protege提供了直观的图形用户界面,包括类视图、对象属性视图、数据属性视图等,方便用户创建和管理本体元素。 2. **创建本体**:用户...

    Altera FPGA/CPLD设计,基础篇+高级篇,第2版,高清晰版

    1. **FPGA和CPLD的基本概念**:FPGA(Field-Programmable Gate Array)和CPLD(Complex Programmable Logic Device)都是可编程逻辑器件,它们的区别在于规模、速度、灵活性和功耗等方面。基础篇将详细解释这两种...

    Linux-基础篇

    Linux系统基础篇的知识点涵盖计算机基本概念、Linux操作系统介绍、主机规划与磁盘分区、Linux系统的安装等多个方面。下面将详细介绍这些知识点。 首先,了解计算机的基本概念对于学习Linux操作系统至关重要。计算机...

    glusterfs的那些事- all.pdf

    基础概念篇主要讲解 Linux 文件系统的一些基础概念,包括 VFS 的介绍等,为后面的章节部分内容做好一些基础概念的准备。 原理篇主要讲解 GlusterFS 的核心概念,包括 gfid 和 posix 接口、线程模型等,这部分内容...

    Qt嵌入式图形开发 (基础篇 入门篇 实战篇)

    基础篇深入探讨Qt的核心架构和关键概念,使读者能够理解Qt的工作原理: 1. **Qt对象模型**:介绍QObject类和信号与槽机制,这是Qt事件驱动编程的基础。 2. **窗口和部件**:讲解QWidget及其子类,如QPushButton、...

    富士通C手册(基础篇,提高篇,精华篇)

    在基础篇中,读者将学习到C语言的基本概念和语法。这部分通常包括变量、数据类型、运算符、控制结构(如if语句、循环)、函数的定义与调用、数组和指针的基本用法。富士通C的基础篇可能还会涉及对富士通特定硬件平台...

    dsp课件,基础篇+提高篇

    在基础篇中,首先会介绍基本的信号与系统理论,包括连续信号与离散信号的区别,线性时不变系统的特性,以及傅里叶变换在信号分析中的应用。傅里叶分析是理解信号频率成分的关键工具,通过时域与频域之间的转换,能...

Global site tag (gtag.js) - Google Analytics