`
maosheng
  • 浏览: 565396 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

数据层处理和优化

阅读更多
大数据量 处理的基本思路:
一:分
1)用和不用分开,常用和不常用分开
2)对数据库存放的数据:分区,分库,分表
3)数据库集群读写分离
4)对文件存放的数据:拆文件
5)处理数据分批处理
原则:尽量使每次操作的数据的基数减少
二:缓
合理使用缓存
三:优
1)合理设计数据库结构
2)合理构建数据库索引
四:法
1)优化操作数据的算法
2)优化SQL
3)使用中间表、临时表
五:NoSQL
合理使用NoSQL


分区:
分区就是将一个表分解成多个区块进行操作和保存,
从而降低每次操作数据,提高性能。而对应用来说是透明的,
从逻辑上看是只有一个表,但在物理上这个表可能是由多个
物理分区组成的,每个分区都是一个独立的对象,可以进行独立
处理

特点:
1)进行逻辑数据分割,分割数据能够有多个不同的物理文件路径
2)可以存储更多的数据,突破系统单个文件最大限制
3)提升性能,提高每个分区的读写速度,提高分区范围查询的速度
4)可以通过删除相关分区来快速删除数据
5)通过跨多个磁盘分数数据查询,从而提高磁盘I/O的性能
6)可以备份和恢复独立的分区

分库:
分库又叫垂直切分,就是把原来存储于一个库的表拆分存储到多个库上,通常是将表按照功能模块、关系密切程度划分出来,部署到不同的库上。

分表:
分表又叫水平切分,是按照一定的业务规则或逻辑,将一个表的数据拆分成多份,分别存储在多个表结构一样的表中,这多个表可以存在一到多个库中。分表又分成垂直分表和水平分表。









分享到:
评论

相关推荐

    数据层处理和性能优化文档

    总结来说,数据库性能优化和数据层处理对于一个高效运行的系统至关重要。分区是提高数据库性能的一种有效策略,它不仅可以提升查询速度,还能增加存储容量,并且可以通过分区管理来简化数据的备份和恢复过程。分区...

    基于自适应采样算法及数据处理的过程层设备时延优化设计.pdf

    8. 大数据处理:在过程层设备时延优化设计中,大数据处理是一个关键挑战,可以通过基于自适应采样算法和数据处理的方法来解决。 9. 数据分析:数据分析是过程层设备时延优化设计中的一个关键步骤,可以通过数据分析...

    浅析数据库管理系统中大批量数据处理的优化技术.pdf

    在当前的IT领域,数据库管理系统(DBMS)是构建和维护数据存储的核心技术之一,尤其在处理大批量数据时,其性能优化显得尤为重要。本文旨在浅析在数据库管理系统中,如何有效进行大批量数据处理的优化技术。 首先,...

    海量数据处理优化

    ### 海量数据处理优化知识点详解 #### 一、数据层架构 - **网站架构发展历程**:从最初的Perl、CGI、Oracle等技术发展至Java Servlets、EJB,再到现代架构,包括底层消息队列(MQ)、企业服务总线(ESB)、数据...

    工业大数据采集处理与应用.pptx

    工业大数据平台架构的组成包括数据采集层、数据存储层、数据处理层、数据应用层等。 Hadoop是工业大数据平台架构中的一个重要组成部分。Hadoop是一个基于分布式计算的开源框架,能够对大规模数据进行处理和分析。...

    多数据库数据层

    数据层是软件架构中的一个层次,它负责处理数据库的访问和管理,包括数据的存储、检索、更新和删除等操作。数据层通常通过抽象数据库的具体实现,提供一套统一的接口或API,使得上层业务逻辑可以与具体的数据库系统...

    Spark大数据处理平台的构建及应用.pdf

    从平台架构层面来看,Spark大数据处理平台通常由数据源层、数据存储层、计算层和应用层构成。数据源层负责汇集各类数据,包括结构化与非结构化数据,并将数据传输到存储层。存储层以HDFS分布式文件系统为底层,构建...

    掩星数据处理

    掩星数据的处理包括对电离层影响的校正和数据的统计最优化分析,以提高数据的准确性和可靠性。 电离层校正是掩星数据处理中的重要步骤,因为它能够减少由电离层引起的误差。电离层中的残余误差,如由于小尺度电离层...

    面向电网的边缘算力优化与分布式数据存储处理模型研究.pdf

    边缘计算能够将数据处理任务分配给边缘侧的终端设备和边缘服务器,即所谓的边缘层计算,减少数据传输到中心服务器的需要,从而降低延时,提升数据处理的实时性。边缘层计算任务分配优化模型,可以保证在能耗最优化的...

    Spark大数据处理:技术、应用与性能优化

    Spark大数据处理:技术、应用与性能优化》根据最新技术版本,系统、全面、详细讲解Spark的各项功能使用、原理机制、技术细节、应用方法、性能优化,以及BDAS生态系统的相关技术。 作为一个基于内存计算的大数据并行...

    面向大数据处理的并行计算模型及性能优化 (1).pdf

    P-DOT模型的性能优化主要从数据层和计算层两个方面展开。在数据层,优化可能涉及数据分布策略,以减少数据移动和提高访问效率;在计算层,优化可能包括算法改进、负载均衡和并行度调整,以最大化计算资源的利用率。...

    地理信息系统平台三维数据处理及性能优化.pdf

    I3S支持的数据类型包括SceneLayer、IntegratedMeshLayer、BuildingSceneLayer以及PointCloudLayer等,这些不同类型的数据层有助于对三维场景进行详尽的构建。 此外,SLPK(SLPack)格式也是易智瑞GIS平台的一个重要...

    最好的数据访问层源码

    7. **分页和排序**:提供方便的数据分页和排序功能,优化大规模数据的处理。 8. **查询构造器**:允许动态构建SQL查询,增加灵活性。 文件名称"DotNetDALLib"暗示这是一个.NET库,可能是包含了以上功能的DLL文件,...

    数据湖+数据访问与查询优化教程

    3. **处理层**:此层负责使用大数据处理框架,例如Apache Spark或Hadoop MapReduce,对数据进行必要的处理和分析工作。 4. **分析层**:这一层提供数据查询和分析服务,常见的工具有Apache Hive和Presto,支持实时...

    数据仓库优化步骤

    9. **ETL优化**:优化提取、转换和加载(ETL)过程,减少数据处理时间。例如,通过并行化ETL任务,或者在接口层预处理数据,减少后端数据仓库的负担。 10. **备份和恢复策略**:制定合理的备份计划,确保数据的安全...

    深圳飞行数据处理系统性能优化的实践与探讨.pdf

    本文主要探讨了深圳飞行数据处理系统性能优化的实践与方法。文中首先介绍了FIPS数据库系统的组成结构,包括展示层、业务逻辑层和数据访问层,并指出了各层次对系统性能的影响。为了优化性能,文章提出了性能优化的...

    物联网基站数据回传处理系统及数据回传处理规范编制说明共6

    3. **系统架构**:物联网基站数据回传处理系统通常由前端采集层、数据传输层、数据处理层和应用服务层组成。每一层都有其特定的任务和功能,共同保证数据的有效流动。 4. **数据规范制定**:规范的编制是为了确保...

    面向大数据处理的并行计算模型及性能优化.pdf

    【性能优化】针对大数据处理,P-DOT模型提供了性能优化的思路,从数据层、运算层和任务调度层三个层面进行优化,以提升大数据处理效率。 【创业资源】虽然本文主要讨论了并行计算在大数据处理中的应用,但提及了...

Global site tag (gtag.js) - Google Analytics