海量数据查询2 - 从0开始构建世界 - ITeye博客

`

high0048

浏览: 25219 次
性别:
来自: 杭州

最近访客更多访客>>

彩鸟飞

l932

zkhiker

jiuyi223

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

海量数据查询2

阅读更多

这样一个场景：
查询条件：83 < price < 87, city = 杭州
order by time
但是只要前3条记录。

按前面的条件查出来是250万条
总记录11亿条，
但是只要前3条记录。

方案一：
要从11亿条按时间排序的记录中找出250万条符合条件的

250万条copy成（11亿/250万）份，和各个时间区段（0-3天以内，3到6天以内。。。这样）求交集

方案二：
是取时间段的前5000条，和那250万条求交集，看是否有3条满足；不满足继续找下5000条求交集

要做到的：

1.求交集算法，尽可能快，并且不改变原来排好的顺序。

2.交集算法，用辗转相除法，以小的为单位，切分大量的数据；再用余数，切分上一轮中小的数据
这种方法的好处：一可以并行，二待处理数据规模下降的很快

我们可以定这样一个大胆的目标：

查询的速度，仅与你所需要的数据量成线性关系，而和数据总量无关！

分享到：

erlang 开源项目 | 海量数据查询的解决方案

2010-09-29 11:38
浏览 1009
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

MySQL海量数据查询优化策略.: 在处理MySQL海量数据查询优化时，我们需要关注的策略包括但不限于以下几点： 1. 优化索引使用：避免全表扫描至关重要。为此，应当在查询条件（WHERE）和排序（ORDER BY）涉及的列上创建索引。索引有助于数据库管理...

海量数据查询的解决方案: 在现代信息技术领域，海量数据查询已经成为企业日常运营和数据分析中的常见挑战。随着大数据技术的不断发展，各种高效解决方案应运而生，旨在帮助我们快速、准确地处理和查询大规模数据。这篇文档将深入探讨如何应对...

海量数据查询优化: 本篇文章将深入探讨“海量数据查询优化”这一主题，包括聚集与非聚集索引的区别，以及如何利用索引来提升查询性能。首先，我们要理解什么是索引。索引是数据库管理系统中用于加速数据检索的数据结构。它类似于书籍...

百万数据查询优化海量数据查询优化: 【标题】：“百万数据查询优化海量数据查询优化” 在处理海量数据时，查询优化显得尤为重要，特别是当数据量达到百万级别甚至更高时。查询优化旨在提高数据查询的效率，减少查询时间，提升系统性能。以下是一些关键...

基于HBase的海量数据查询: 本文当是一个基于HBase的海量数据的实实时查询系统的原理分析。详细的介绍了大数据查询的原理。

SQL 海量数据查询: ### SQL Server 海量数据处理：查询、插入与删除在现代数据分析与企业级应用中，高效处理海量数据是IT专业人员必须掌握的关键技能之一。本文将深入探讨SQL Server环境下如何进行大规模数据的操作，包括查询、插入...

海量数据查询sqlserver: 在SQL Server中处理海量数据查询是一项挑战，但也是数据库管理员和开发人员必须掌握的重要技能。以下将详细讨论如何有效地进行海量数据的分页、查询和排序。首先，我们来看**海量数据分页**。在SQL Server中，常见...

企业海量数据查询优化.pdf: 因此，如何优化海量数据查询，提高数据检索的效率和准确性，已成为众多企业面临的重要课题。首先，要实现海量数据查询优化，需要从底层数据库架构着手。传统的数据库系统由于数据量的限制和索引结构的局限，往往...

sql海量数据优化，数据查询慢你要靠优化: SQL海量数据优化，数据查询慢你要靠优化 SQL海量数据优化是数据库优化的重要方面之一，快速高效的数据查询是数据库系统的生命线。然而，随着数据量的增加，查询速度将会变得越来越慢，影响系统的性能和用户体验。这...

oracle海量查询的数据优化!: oracle海量查询的数据优化! 建立“适当”的索引是实现查询优化的首要前提。

海量数据管理报告.zip: 通过分析提供的三个文档——“海量数据管理第一次上机.docx”、“海量数据管理第三次上机报告.docx”以及“海量数据管理第2次上机.docx”，我们可以揭示出一系列关于海量数据处理的关键知识点。首先，海量数据管理...

java处理海量数据的初步解决思路: 在Java编程中，处理海量数据是一项挑战，但通过合理的策略和工具可以有效地解决。这篇文章将探讨如何使用Java来处理大规模数据，主要关注于优化内存管理、分片处理、流式处理以及利用开源工具等方法。首先，理解...

海量数据库查询: #### 一、海量数据查询背景与挑战在当前的信息时代，随着数据的快速增长，如何高效地管理和查询海量数据库成为了一个重要的课题。尤其是在企业级应用环境中，面对庞大的数据量（例如百万乃至千万级别的记录），...

海量数据优化查询资料: 海量数据查询优化是数据库管理中的关键环节，尤其在当今大数据时代，面对数以百万计乃至千万计的数据记录，高效的查询性能对于提升系统性能至关重要。本文主要探讨了如何通过优化SQL语句和利用数据库特性来改善查询...

基于Oracle数据库海量数据的查询优化研究 (3).pdf: Oracle数据库在处理海量数据时，查询优化是一个至关重要的议题，因为当数据量达到一定规模时，系统的响应时间和资源消耗往往成为性能瓶颈。本文主要探讨了针对Oracle数据库进行查询优化的各种策略和技术，包括合理...

海量数据优化查询SQL: 在IT领域，尤其是在大数据时代，优化SQL查询对于处理海量数据至关重要。SQL是Structured Query Language的缩写，是用于管理和操作数据库的语言。面对动辄上百万甚至上千万条记录的数据库，传统的查询方式可能会导致...

Java海量数据分页Bean: Java海量数据分页Bean, 适用于Oracle(适当修改,适用于任何数据库).功能描述：传入到达页码（具有容错性）、每页记录数、Select查询语句，返回该页所有的记录（整页是List集合，每条记录是一个 HashMap）、总行数、总...

海量数据处理分析方法: 海量数据处理分析方法是现代信息技术领域中的关键技能，尤其对于涉及检索和数据分析的工作岗位而言，掌握这些方法显得尤为重要。随着互联网和物联网的发展，数据量呈现爆炸式增长，传统的数据处理手段已经无法应对...

Global site tag (gtag.js) - Google Analytics