`

分布式查询 presto 入门安装使用

 
阅读更多
http://my.oschina.net/chengxiaoyuan/blog/700263
为了分析海量数据,需要寻找一款分布式计算的开源项目,以前用的比较多的是hive,但是由于hive任务最终会被解析成MR任务,MR从硬盘读取数据并把中间结果写进硬盘,速度很慢,所以要寻找一款基于内存计算的开源项目,presto是Facebook开源的,基于内存的分布式计算框架。

Presto优点

1. 基于标准的ANSI SQL,有sql基础的都能快速使用

2. 安装部署简单

3. 基于内存计算,不要依赖MR,速度比hive快很多,。

详细看原文
分享到:
评论

相关推荐

    presto_jdbc

    Presto是一个开源的分布式SQL查询引擎,设计用于处理大规模的数据。它适用于交互式分析,支持多种数据源,包括Hive、Cassandra、MySQL等。Presto JDBC(Java Database Connectivity)是Presto提供的一种标准接口,...

    分享一些在工作中的大数据实战案例,包括flink、kafka、hadoop、presto等 欢迎大家关注我的公众号【大数据技术与应用实战】,一起成长 .zip

    Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询。与其他的大数据分析工具不同,Presto可以处理多种数据源的即时查询,无论数据是在Hadoop、NoSQL数据库还是关系型数据库中。Presto专为高速度和低延迟而...

    1、Druid(Imply-3.0.4)介绍及部署(centos6.10)、验证

    4. 对于SQL-on-Hadoop工具(如Impala、Drill、SparkSQL、Presto),Druid在查询速度和实时性上有优势,但可能在数据存储和复杂查询支持上存在不足。 5. 跟Kylin相比,Druid提供实时查询,但不支持JOIN操作,而Kylin...

    Minio入门宝典.pdf

    传统的大数据解决方案,比如Hadoop的HDFS,虽然在处理分布式存储问题时具有强大的能力,但它也存在一些不足,例如元数据扩展性的限制和全局锁的问题。HDFS是为大文件设计,面对海量的小文件时支持有限。HDFS的块汇报...

    大数据处理平台解决方案.pdf

    而SQL-like的查询工具如Hive和Presto,则使得分析师可以方便地对大数据进行查询和分析。 未来,随着人工智能和机器学习的发展,大数据处理平台将进一步集成这些先进技术。例如,通过预训练的模型对数据进行预测性...

Global site tag (gtag.js) - Google Analytics