`

大数据处理

阅读更多
优化大数据的处理方法:
  1.一般数据大于百万以上的sql语句里面尽量不要用子查询,in,exists等函数;而把它们转换为一条sql。用group,having,和多表连接进行处理,可以提高查询效率。
   例子:SELECT COUNT(DISTINCT ismi) goods_sum FROM goods_COMPARE
         WHERE ismiIN
             (SELECT DISTINCT ismi FROM goods_COMPARE WHERE g_ID IS NOT NULL
                   AND g_time>= '20120721' and g_time<= '20121025')
           AND ismi IN
             (SELECT DISTINCT ismi FROM goods_COMPARE WHERE eg_ID IS NOT NULL
                   AND g_time >= '20120721' and g_time <= '20121025')
           AND g_time >= '20120721' and g_time <= '20121025'
      
     SELECT COUNT(*) from (
SELECT DISTINCT ismi goods_sum  FROM goods_COMPARE WHERE  g_time        >= '20120721' and g_time <= '20121025'
      group by ismi having Max(eg_ID) IS NOT NULL and max(g_ID ) IS NOT NULL )
   2.一般日数据有百万级以上的表,查询特别慢,需要用日期分区或者其他的有规律的字段进行表分区。同时对于查询的比较频繁的字段创建索引。
   3.对于以上都不能优化查询速率的,建议用线程先要统计的全部统计出来,用一个前台查询表来查询。


4.用分区和索引也可以增加数据库查询效率。

5.现在一般用分布式集群来解决大数据,还有云计算
分享到:
评论

相关推荐

    大数据处理关键技术分析.pdf

    大数据处理关键技术分析 一、大数据的采集及预处理技术 大数据时代的到来推动了对高效数据处理方法的需求。数据采集与预处理是大数据分析的首要步骤。数据采集技术必须能够全面捕获各种数据,包括结构化数据和非...

    大数据处理技术简介.pptx

    "大数据处理技术简介" 大数据处理技术是指处理大量、高速、多样、有价值的数据的技术。这种技术的应用场景包括网络监控、电信数据管理、Web应用、传感检测等。这些应用的特点是数据量大、速度快、类型多样、价值高...

    大数据处理思维导图.png

    大数据处理思维导图.png

    数据驱动建模及科学计算―复杂系统和大数据处理方法_Kutz_扫描版带书签.pdf

    全书共分四部分(26章),前三部分详细讲解各类数学运算与分析方法,第四部分重点讲解如何应用数学方法进行动态复杂系统分析与大数据处理。其中,第一部分讨论数学、矩阵分析和概率论的主要数据计算方法及结果可视化...

    MongoDB大数据处理权威指南

    ### MongoDB大数据处理权威指南 #### MongoDB简介 MongoDB是一种非关系型数据库系统,它使用JSON风格的数据存储方式(称为BSON格式),这使得数据存储更加灵活高效。MongoDB支持动态查询、索引、聚合等多种功能,...

    Python大数据处理库PySpark实战——使用PySpark处理文本多分类问题

    【导读】我们知道,ApacheSpark在处理实时数据方面的能力非常出色,目前也在工业界广泛使用。本文通过使用SparkMachineLearningLibrary和PySpark来解决一个文本多分类问题,内容包括:数据提取、ModelPipeline、训练...

    Spark大数据处理技术PDF 高清带目录完整版 夏俊鸾黄洁程浩等

    《Spark大数据处理技术》是夏俊鸾、黄洁程、程浩等专家合著的一本深入探讨Spark在大数据处理领域的专业书籍。这本书以其高清且带有完整目录的形式,为读者提供了全面而系统的Spark学习资料。 Spark作为当前大数据...

    数据算法-Hadoop Spark大数据处理技巧

    数据算法-Hadoop Spark大数据处理技巧 1.

    js前端Excel大数据处理导入

    随着Web应用程序对数据处理能力的需求提升,前端工程师必须找到有效地处理大量数据的方法,而不仅仅是依赖后端服务器。本主题将深入探讨如何使用JavaScript来处理Excel文件,尤其是面对大数据量时的策略。 首先,...

    智能电网大数据处理技术分析.pdf

    本文详细分析了智能电网大数据处理技术的现状和面临的挑战,并提出了构建智能电网大数据处理技术的几个关键要点。 首先,智能电网大数据处理技术的一个现状问题是并行数据库的挑战。在智能电网中,需要存储和处理的...

    大数据处理与云计算.docx

    大数据处理与云计算 大数据处理与云计算是当今社会的两大重要技术,它们的应用领域和市场前景都非常广阔。本文将探讨大数据处理和云计算的概念、发展历程、优势和挑战,以及未来的发展趋势和应用前景。 一、概念和...

    民航空管大数据处理平台架构研究.pdf

    《民航空管大数据处理平台架构研究》一文,深入剖析了这一问题,并提出了一套创新的大数据处理平台架构,为相关领域的研究人员和实践者提供了宝贵的参考和指导。 文章由潘卫军、刘铠源、王润东和左青海等专家共同...

    接收与处理分离的实时大数据处理模型

    在大数据处理过程中,系统必须有非常高的数据处理效率。为了满足对大数据实时、高效、稳定处理的需求,提出了一种接收与处理分离的数据处理模型。该数据处理模型由数据接收单元、内存数据库、原始数据分发单元、数据...

    大数据处理平台分析.pdf

    大数据处理平台分析 一、大数据处理概述 大数据处理平台是一个用于存储、处理和分析海量数据的技术架构。它包括了硬件资源、分布式文件系统、计算模型和数据库管理系统等关键技术。随着云计算的发展,大数据处理...

    《Python大数据处理与分析(2021版)》教学大纲.docx

    《Python大数据处理与分析(2021版)》教学大纲.docx《Python大数据处理与分析(2021版)》教学大纲.docx《Python大数据处理与分析(2021版)》教学大纲.docx《Python大数据处理与分析(2021版)》教学大纲.docx《Python大...

    智能电网的大数据处理技术应用.pdf

    智能电网的大数据处理技术是电力行业信息化、数字化发展的重要技术支撑,它涉及了从数据采集、存储、分析到应用等多个环节。当前,随着信息技术的快速发展,电网行业也逐步走向智能化,大数据处理技术在智能电网中的...

    实时大数据处理在WOA架构中的实现.pptx

    根据提供的文件信息,我们可以深入探讨实时大数据处理在WOA架构中的实现及相关知识点。 ### 实时大数据处理在WOA架构中的实现 #### 引言 **大数据处理的重要性:** 随着信息技术的飞速发展,数据已经成为现代企业...

    大数据处理技术参考架构 (2).docx

    大数据处理技术参考架构 在当今信息化社会,大数据已成为企业和组织的核心竞争力。随着互联网、物联网、社交媒体等领域的快速发展,数据量呈现爆炸性增长,传统的数据处理方式已无法满足需求。"大数据处理技术参考...

    基于贝叶斯网络的复杂事件大数据处理系统测试数据生成方法研究

    伴随流式数据处理需求而产生的复杂事件处理技术,在处理具有多样性和流式特征数据方面性能表现突出,被广泛应用于复杂事件大数据处理系统中。针对复杂事件大数据处理系统测试需求,提出一种基于贝叶斯网络的复杂事件...

    基于大数据处理的ETL框架的研究与设计.pdf

    【大数据处理的ETL框架研究与设计】 大数据处理在当今的信息时代中扮演着至关重要的角色,而ETL(Extract, Transform, Load)是数据处理流程中的核心环节,它负责从不同来源抽取数据,进行清洗、转换,然后加载到...

Global site tag (gtag.js) - Google Analytics