玩转大数据-hadoop-hive-hbase-cassandra - shixm - ITeye博客

`

shixiaomu

浏览: 388361 次
性别:
来自: 北京

最近访客更多访客>>

haining128

choyajoy

jiedushi

lvite3mc

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

lhbthanks：楼主写的很多，也很实用，要是再增加一些描述就会更好了。
oracle 用户从一个表空间另一个表空间
wuhuajun： private int _connectionMax = 51 ...
resin jboss 最大连接数设置
shixiaomu：自己丁丁丁一下学了忘忘了再学。。主要是应用场景太少
python
shixiaomu：我自己有了方案了java+rabbitmq_server-2. ...
hadoop hive zookeeper 还不够
shixiaomu：看到这个帖子羞愧极了 ,原来我 09 年就想学 pytho ...
python

玩转大数据-hadoop-hive-hbase-cassandra

阅读更多

最近做基于关联规则的推荐系统.
log-parse-hadoop-hive-mysql-cassandra-redis-hbase
感触良多
python-linuxshell-rommbitMQ

改天好好写写.先开个头.

分享到：

ant-hive | google 集合类 -loadcache-弱引用

2012-11-02 17:47
浏览 1170
评论(0)
分类:企业架构
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

spark-1.6.0-bin-hadoop2.4.tgz: 在实际应用中，Spark可以与其他大数据工具如Hive、HBase、Cassandra等结合使用，提供更强大的数据分析功能。此外，Spark的弹性分布式数据集（Resilient Distributed Datasets, RDD）是其核心概念，它提供了一种在...

spark-2.4.3-bin-hadoop2-without-hive.tgz: - 支持了更多数据源，包括HDFS、Cassandra、HBase等，增强了对Apache Parquet和Apache ORC文件格式的支持。 - 引入了机器学习库MLlib的升级，支持更多的算法和模型优化。 - Spark SQL与DataFrame API的进一步融合...

spark-2.4.5-bin-hadoop2.7.rar: DataFrame 支持多种数据源，包括HDFS、Cassandra、HBase等，与Hadoop 2.7的兼容性使得数据读取和写入更为方便。Dataset 是DataFrame的类型安全版本，结合了RDD的高性能和DataFrame的API便利性，是面向对象编程的理想...

presto-hive-hadoop1-0.55.zip: 这意味着这个版本的连接器兼容Hadoop 1.x的生态，可能包括对Hadoop的HDFS、MapReduce和HBase等组件的支持。安装与配置： 1. **解压**：首先，你需要将"presto-hive-hadoop1-0.55.zip"解压到一个目录。 2. **编译与...

清华大学精品大数据实战课程（Hadoop、Hbase、Hive、Spark）PPT课件含习题（32页）第5章内存大数据计算框: 《清华大学精品大数据实战课程》是针对大数据处理领域的一门高级课程，主要涵盖了Hadoop、HBase、Hive以及Spark等关键技术。本章聚焦在内存大数据计算框架——Spark，旨在深入探讨Spark如何提升大数据处理的效率和...

apache-hive-2.3.7-bin.tar.gz: - **易于集成**：Hive 可以与多种数据源（如 HDFS、HBase、Cassandra）以及 ETL 工具（如 Pig、MapReduce、Spark）集成。在实际应用中，使用 Hive 的步骤通常包括： 1. **创建表**：根据数据格式和需求定义表结构...

spark-2.4.6-bin-2.6.0-cdh5.7.0.tgz: 它支持多种数据源，包括HDFS、Cassandra、HBase等，能够处理各种结构化、半结构化和非结构化数据。 Spark的弹性分布式数据集（RDD）是其核心抽象，它提供了一种容错的、只读的多分区数据集合。RDD操作可以是转换...

卢亿雷-Hadoop生态系统分析: 最后，Hadoop生态系统在数据库方面还包括了HBase、MySQL、MongoDB和Cassandra等。这些数据库系统与HBase各有优劣，适用于不同的应用场景。在数据分析和存储方面，ElasticSearch是一个基于Lucene的搜索引擎，它提供了...

超越Hadoop的大数据技术: 7. **与其他大数据系统的集成**：了解如何与Hadoop、Hive、Cassandra等其他大数据工具集成，以实现更全面的数据处理流程。 8. **性能调优**：讨论如何监控和调优Spark集群，包括资源分配、任务调度和错误排查。 ...

Hadoop开发者必备文档: - Hadoop与其他数据存储系统的交互，如HBase、Cassandra等NoSQL数据库。 3. **Hadoop开发者第三期** 第三期教程可能进一步扩展到高级主题： - YARN的详细运作机制，如何管理和调度资源。 - 新的计算框架，如...

hadoop+hbase系列配置文档: ### Hadoop与HBase系列配置知识点 #### 一、Hadoop概述 Hadoop是一个由Apache基金会维护的...随着大数据技术的发展，Hadoop和HBase的应用场景将越来越广泛，对它们的理解和掌握也将成为IT专业人员必备的技能之一。

大数据hadoop部分的介绍、环境部署、安装说明: 此外，Hadoop生态系统还包括YARN（Yet Another Resource Negotiator），作为资源管理和调度器，以及HBase、Hive、Pig等其他工具，用于结构化和非结构化数据的查询和分析。接下来，我们探讨Hadoop的环境部署。部署...

The-Ultimate-Hands-On-Hadoop:AlvinToh终极动手Hadoop学习资料库-驯服大数据！: 关于本课程Hadoop，MapReduce，HDFS，Spark，Pig，Hive，HBase，MongoDB，Cassandra，Flume-清单还在继续！超过25种技术。简要描述;简介Hadoop和“大数据”的世界可能令人生畏-数百种具有神秘名称的不同技术构成了...

完整版大数据云计算课程 Hadoop数据分析平台系列课程 Hadoop 06 Hadoop大家族共32页.pptx: 【Hadoop大数据云计算课程】是深入学习大数据处理和云计算技术的核心课程，涵盖了Hadoop生态系统中的多个关键组件。这个课程旨在让学习者能够熟练掌握Hadoop的安装、配置和管理，以及在不同系统间高效地传输数据。...

hadoop-cdh4-0.3.zip: 它设计用于处理PB级别的数据，支持多种数据源，如Hive、Hadoop、Cassandra等，并且可以在多种环境下运行，如Amazon EMR、Google Cloud Dataproc等。 3. **阴影(shaded)打包**: 在Java开发中，阴影打包是一种将第三...

Hadoop Real-World Solutions Cookbook 源代码: 《Hadoop Real-World Solutions Cookbook 源代码》是一本针对Hadoop实际应用问题解决方案的...同时，书中其他未列出的章节也可能包含关于Hadoop生态系统中其他重要组件（如HBase、Hive、Spark、YARN等）的实践案例。

大数据初次窥探---第一节.docx: 此外，还有其他相关组件，如HBase（列存储数据库）、Pig（数据流语言）、Hive（数据仓库）和Mahout（机器学习库）等，它们共同构成了大数据技术的生态系统。 Spark作为一个快速发展的生态圈，提供了比MapReduce更...

完整版大数据课件集合12-大数据导论-第十二章-Spark（共22页）.ppt: 4. 运行模式多样：Spark可以部署在独立集群、Hadoop YARN、Mesos或云环境（如Amazon EC2）上，并能接入多种数据源，如HDFS、Cassandra、HBase和Hive等。【Spark生态系统】 Spark生态系统包含了多个子项目，这些...

大数据面试题---.rar: 大数据存储系统通常包括HDFS（Hadoop Distributed File System）、NoSQL数据库（如HBase、Cassandra）和关系型数据库（如Hive）。面试官可能会询问这些系统的特性和应用场景，比如HDFS的Block机制，HBase的行键和列...

云计算 hadoop 理论测试题题解: - **答案解析**：Hive提供的查询语言称为HiveQL，它是一种类似于SQL的语言，使得熟悉SQL的用户能够轻松地查询和分析存储在Hadoop中的数据。因此，答案为C。 #### 三、Hadoop生态系统扩展 6. **Cassandra安装与...

Global site tag (gtag.js) - Google Analytics