`

大数据处理

阅读更多
优化大数据的处理方法:
  1.一般数据大于百万以上的sql语句里面尽量不要用子查询,in,exists等函数;而把它们转换为一条sql。用group,having,和多表连接进行处理,可以提高查询效率。
   例子:SELECT COUNT(DISTINCT ismi) goods_sum FROM goods_COMPARE
         WHERE ismiIN
             (SELECT DISTINCT ismi FROM goods_COMPARE WHERE g_ID IS NOT NULL
                   AND g_time>= '20120721' and g_time<= '20121025')
           AND ismi IN
             (SELECT DISTINCT ismi FROM goods_COMPARE WHERE eg_ID IS NOT NULL
                   AND g_time >= '20120721' and g_time <= '20121025')
           AND g_time >= '20120721' and g_time <= '20121025'
      
     SELECT COUNT(*) from (
SELECT DISTINCT ismi goods_sum  FROM goods_COMPARE WHERE  g_time        >= '20120721' and g_time <= '20121025'
      group by ismi having Max(eg_ID) IS NOT NULL and max(g_ID ) IS NOT NULL )
   2.一般日数据有百万级以上的表,查询特别慢,需要用日期分区或者其他的有规律的字段进行表分区。同时对于查询的比较频繁的字段创建索引。
   3.对于以上都不能优化查询速率的,建议用线程先要统计的全部统计出来,用一个前台查询表来查询。


4.用分区和索引也可以增加数据库查询效率。

5.现在一般用分布式集群来解决大数据,还有云计算
分享到:
评论

相关推荐

    数据算法Hadoop/Spark大数据处理技巧 源代码

    在大数据处理领域,Hadoop和Spark是两个至关重要的框架,它们为海量数据的存储、管理和分析提供了高效且可扩展的解决方案。本资源包含了基于这两个框架的数据算法和源代码,可以帮助我们深入理解并实践大数据处理...

    Spark大数据处理平台的构建及应用.pdf

    在当今的大数据时代,高效的海量数据处理与分析需求促使了各种数据处理平台的诞生,其中Apache Spark凭借其分布式计算优势,在大数据处理领域中占据重要地位。Spark不仅提供了快速通用的计算引擎,而且能够有效满足...

    软件服务外包大赛需求分析文档(大数据处理)

    软件服务外包大赛需求分析文档(大数据处理) 本文档是关于软件服务外包大赛需求分析项目的文档,主要涉及大数据处理领域。该项目的目的是为了帮助某公司实现数据整合和_analysis报表平台的建设,以便实现企业级的...

    大数据处理关键技术分析.pdf

    大数据处理关键技术分析 一、大数据的采集及预处理技术 大数据时代的到来推动了对高效数据处理方法的需求。数据采集与预处理是大数据分析的首要步骤。数据采集技术必须能够全面捕获各种数据,包括结构化数据和非...

    大数据处理技术简介.pptx

    "大数据处理技术简介" 大数据处理技术是指处理大量、高速、多样、有价值的数据的技术。这种技术的应用场景包括网络监控、电信数据管理、Web应用、传感检测等。这些应用的特点是数据量大、速度快、类型多样、价值高...

    基于物联网大数据处理的关键技术研究.pdf

    基于物联网大数据处理的关键技术研究 本文主要讨论了基于物联网大数据处理的关键技术研究。随着物联网技术的完善,社会经济也得到了很大的进步,物联网带来的收入就接近 3000 亿美元,相信未来物联网将会带来更加...

    移动互联网的大数据处理关键技术 (1).pdf

    移动互联网的大数据处理关键技术 移动互联网的大数据处理是指在移动网络中产生的海量数据的采集、存储、处理和分析,以获取有价值的信息和知识。随着移动互联网的发展,移动大数据时代的到来带来了前所未有的机遇和...

    Spark大数据处理技术 应用与性能优化 高清带目录 .pdf

    在给出的知识点中,"Spark大数据处理技术 应用与性能优化"是本篇文档的主题,涉及到的关键概念和技术包括: 1. Spark大数据处理技术:Spark是一种开源的分布式大数据处理框架,它提供了一个快速、通用的计算引擎,...

    基于NoSQL的大数据处理的研究

    基于NoSQL的大数据处理的研究

    Python大数据处理库PySpark实战——使用PySpark处理文本多分类问题

    【导读】我们知道,ApacheSpark在处理实时数据方面的能力非常出色,目前也在工业界广泛使用。本文通过使用SparkMachineLearningLibrary和PySpark来解决一个文本多分类问题,内容包括:数据提取、ModelPipeline、训练...

    基于Hadoop的大数据处理关键技术综述.ppt

    定义、特点 大数据对系统的需求、大数据和云计算的关系 大数据市场分析 大数据处理的技术关键 Hadoop原理、优点 Hadoop体系架构 Hadoop核心设计:MapReduce、HDFS

    大数据处理系统 Hadoop源代码情景分析

    本书沿用作者独特而广受欢迎的情景分析方法和风格,深入浅出直白易懂,可以作为大数据系统高级课程的...同时,还可以作为各行业从事软件开发和数据挖掘的工程师、研究人员以及其他对大数据处理技术感兴趣者的自学教材

    数据算法-Hadoop Spark大数据处理技巧

    数据算法-Hadoop Spark大数据处理技巧 1.

    js前端Excel大数据处理导入

    随着Web应用程序对数据处理能力的需求提升,前端工程师必须找到有效地处理大量数据的方法,而不仅仅是依赖后端服务器。本主题将深入探讨如何使用JavaScript来处理Excel文件,尤其是面对大数据量时的策略。 首先,...

    智能电网大数据处理技术分析.pdf

    本文详细分析了智能电网大数据处理技术的现状和面临的挑战,并提出了构建智能电网大数据处理技术的几个关键要点。 首先,智能电网大数据处理技术的一个现状问题是并行数据库的挑战。在智能电网中,需要存储和处理的...

    民航空管大数据处理平台架构研究.pdf

    《民航空管大数据处理平台架构研究》是一篇深入探讨民航领域大数据处理技术的文章,由潘卫军、刘铠源、王润东和左青海等人撰写。随着信息技术和航空业的快速发展,空管运行产生的业务数据呈现爆炸性增长,对数据处理...

    大数据处理综合处理服务平台的设计实现分析范文.pdf

    大数据处理综合处理服务平台的设计实现分析范文.pdf大数据处理综合处理服务平台的设计实现分析范文.pdf大数据处理综合处理服务平台的设计实现分析范文.pdf大数据处理综合处理服务平台的设计实现分析范文.pdf大数据...

    大数据处理技巧英文版pdf

    《大数据处理技巧英文版》这本书主要探讨了在大数据时代如何有效地利用Hadoop和Spark进行数据处理。这本书的核心目标是提供一套实用的算法和方法,帮助读者掌握大数据处理的关键技术。 一、Hadoop基础 Hadoop是...

    数据算法 Hadoop_Spark大数据处理技巧(网盘链接和密码) ,马哈默德·帕瑞斯安 ,P680 ,2016.10.txt

    数据算法 Hadoop_Spark大数据处理技巧(网盘链接和密码) ,马哈默德·帕瑞斯安 ,P680 ,2016.10

    大数据处理与云计算.docx

    大数据处理与云计算 大数据处理与云计算是当今社会的两大重要技术,它们的应用领域和市场前景都非常广阔。本文将探讨大数据处理和云计算的概念、发展历程、优势和挑战,以及未来的发展趋势和应用前景。 一、概念和...

Global site tag (gtag.js) - Google Analytics