`

大数据处理

阅读更多
优化大数据的处理方法:
  1.一般数据大于百万以上的sql语句里面尽量不要用子查询,in,exists等函数;而把它们转换为一条sql。用group,having,和多表连接进行处理,可以提高查询效率。
   例子:SELECT COUNT(DISTINCT ismi) goods_sum FROM goods_COMPARE
         WHERE ismiIN
             (SELECT DISTINCT ismi FROM goods_COMPARE WHERE g_ID IS NOT NULL
                   AND g_time>= '20120721' and g_time<= '20121025')
           AND ismi IN
             (SELECT DISTINCT ismi FROM goods_COMPARE WHERE eg_ID IS NOT NULL
                   AND g_time >= '20120721' and g_time <= '20121025')
           AND g_time >= '20120721' and g_time <= '20121025'
      
     SELECT COUNT(*) from (
SELECT DISTINCT ismi goods_sum  FROM goods_COMPARE WHERE  g_time        >= '20120721' and g_time <= '20121025'
      group by ismi having Max(eg_ID) IS NOT NULL and max(g_ID ) IS NOT NULL )
   2.一般日数据有百万级以上的表,查询特别慢,需要用日期分区或者其他的有规律的字段进行表分区。同时对于查询的比较频繁的字段创建索引。
   3.对于以上都不能优化查询速率的,建议用线程先要统计的全部统计出来,用一个前台查询表来查询。


4.用分区和索引也可以增加数据库查询效率。

5.现在一般用分布式集群来解决大数据,还有云计算
分享到:
评论

相关推荐

    大数据处理关键技术分析.pdf

    大数据处理关键技术分析 一、大数据的采集及预处理技术 大数据时代的到来推动了对高效数据处理方法的需求。数据采集与预处理是大数据分析的首要步骤。数据采集技术必须能够全面捕获各种数据,包括结构化数据和非...

    大数据处理技术简介.pptx

    "大数据处理技术简介" 大数据处理技术是指处理大量、高速、多样、有价值的数据的技术。这种技术的应用场景包括网络监控、电信数据管理、Web应用、传感检测等。这些应用的特点是数据量大、速度快、类型多样、价值高...

    大数据处理思维导图.png

    大数据处理思维导图.png

    数据驱动建模及科学计算―复杂系统和大数据处理方法_Kutz_扫描版带书签.pdf

    全书共分四部分(26章),前三部分详细讲解各类数学运算与分析方法,第四部分重点讲解如何应用数学方法进行动态复杂系统分析与大数据处理。其中,第一部分讨论数学、矩阵分析和概率论的主要数据计算方法及结果可视化...

    数据算法: Hadoop+Spark大数据处理技巧.pdf

    《数据算法:Hadoop+Spark大数据处理技巧》是一本深入探讨大数据处理技术的专业书籍,主要聚焦于两大主流的大数据处理框架——Hadoop和Spark。这本书不仅涵盖了基础理论,还提供了丰富的实践指导,对于想要深入了解...

    MongoDB大数据处理权威指南

    ### MongoDB大数据处理权威指南 #### MongoDB简介 MongoDB是一种非关系型数据库系统,它使用JSON风格的数据存储方式(称为BSON格式),这使得数据存储更加灵活高效。MongoDB支持动态查询、索引、聚合等多种功能,...

    基于NoSQL的大数据处理的研究

    基于NoSQL的大数据处理的研究

    Python大数据处理库PySpark实战——使用PySpark处理文本多分类问题

    【导读】我们知道,ApacheSpark在处理实时数据方面的能力非常出色,目前也在工业界广泛使用。本文通过使用SparkMachineLearningLibrary和PySpark来解决一个文本多分类问题,内容包括:数据提取、ModelPipeline、训练...

    Spark大数据处理技术PDF 高清带目录完整版 夏俊鸾黄洁程浩等

    《Spark大数据处理技术》是夏俊鸾、黄洁程、程浩等专家合著的一本深入探讨Spark在大数据处理领域的专业书籍。这本书以其高清且带有完整目录的形式,为读者提供了全面而系统的Spark学习资料。 Spark作为当前大数据...

    基于Hadoop的大数据处理关键技术综述.ppt

    定义、特点 大数据对系统的需求、大数据和云计算的关系 大数据市场分析 大数据处理的技术关键 Hadoop原理、优点 Hadoop体系架构 Hadoop核心设计:MapReduce、HDFS

    数据算法-Hadoop Spark大数据处理技巧

    数据算法-Hadoop Spark大数据处理技巧 1.

    智能电网大数据处理技术分析.pdf

    本文详细分析了智能电网大数据处理技术的现状和面临的挑战,并提出了构建智能电网大数据处理技术的几个关键要点。 首先,智能电网大数据处理技术的一个现状问题是并行数据库的挑战。在智能电网中,需要存储和处理的...

    MATLAB中的大数据处理与并行计算技术详解

    内容概要:本文详细介绍了MATLAB在大数据处理和并行计算领域的应用。主要内容包括MATLAB的基本环境设置、数值计算和矩阵操作、数据导入与预处理、数据可视化、大规模数据集管理和并行计算技术。文章还通过多个实际...

    大数据处理系统:Hadoop源代码情景分析

    资源名称:大数据处理系统:Hadoop源代码情景分析内容简介:Hadoop是目前重要的一种开源的大数据处理平台,读懂Hadoop的源代码,深入理解其各种机理,对于掌握大数据处理的技术有着显而易见的重要性。 本书从大数据...

    大数据处理与云计算.docx

    大数据处理与云计算 大数据处理与云计算是当今社会的两大重要技术,它们的应用领域和市场前景都非常广阔。本文将探讨大数据处理和云计算的概念、发展历程、优势和挑战,以及未来的发展趋势和应用前景。 一、概念和...

    民航空管大数据处理平台架构研究.pdf

    《民航空管大数据处理平台架构研究》一文,深入剖析了这一问题,并提出了一套创新的大数据处理平台架构,为相关领域的研究人员和实践者提供了宝贵的参考和指导。 文章由潘卫军、刘铠源、王润东和左青海等专家共同...

    接收与处理分离的实时大数据处理模型

    在大数据处理过程中,系统必须有非常高的数据处理效率。为了满足对大数据实时、高效、稳定处理的需求,提出了一种接收与处理分离的数据处理模型。该数据处理模型由数据接收单元、内存数据库、原始数据分发单元、数据...

    《Python大数据处理与分析(2021版)》教学大纲.docx

    《Python大数据处理与分析(2021版)》教学大纲.docx《Python大数据处理与分析(2021版)》教学大纲.docx《Python大数据处理与分析(2021版)》教学大纲.docx《Python大数据处理与分析(2021版)》教学大纲.docx《Python大...

    实时大数据处理在WOA架构中的实现.pptx

    根据提供的文件信息,我们可以深入探讨实时大数据处理在WOA架构中的实现及相关知识点。 ### 实时大数据处理在WOA架构中的实现 #### 引言 **大数据处理的重要性:** 随着信息技术的飞速发展,数据已经成为现代企业...

    大数据处理技术参考架构 (2).docx

    大数据处理技术参考架构 在当今信息化社会,大数据已成为企业和组织的核心竞争力。随着互联网、物联网、社交媒体等领域的快速发展,数据量呈现爆炸性增长,传统的数据处理方式已无法满足需求。"大数据处理技术参考...

Global site tag (gtag.js) - Google Analytics