hadoop记录 - - ITeye博客

`

itsoul

浏览: 219281 次
性别:
来自: 北京

最近访客更多访客>>

jackzhao1980

zeraw

x_root

hao85629

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

sky_lc：明白了集群和分布式的区别~~~
集群、分布式、负载均衡区别与联系
itsoul： jianxunji 写道不清楚啊，你说的水平分区指的是mysq ...
mysql垂直分区和水平分区
jianxunji：不清楚啊，你说的水平分区指的是mysql的partition还 ...
mysql垂直分区和水平分区
jy1245626：很好的概念讲解
集群、分布式、负载均衡区别与联系
zhameng：挺不错的，让我这个“小白”对云计算有了个初步的概念！
云计算那些事

hadoop记录

博客分类：

Java综合

阅读更多

一、HADOOP
./hadoop fs -mkdir book 新建一个目录；
./hadoop fs -ls 查看文件目录；
./hadoop fs -copyFromLocal 系统目录（eg:D:\\test.txt）目标文件名称（默认存放在当前用户下/user/用户/目标文件名称）；
./hadoop fs -ls file:/// 当期根目录下的文件列表；
./hadoop fs -ls hdfs://localhost:8888/user 查看分布式文件列表，端口由core-site.xml文件中fs.default.name的值决定；

二、HIVE
新建外部表：
hive> create EXTERNAL table hive_test(num int,name string)
    > ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' //指定每行字段值之间风格符
    > STORED AS TEXTFIL //以文本形式存储
    > LOCATION '/user/terran/text'; //指定HDFS路径

启动hiveserver服务：
进入bin目录，$./hive --service hiveserver ,类似的服务还有cli(命令行接口，默认)，hwi（hive的web接口），jar(与hadoopjar等价的Hive接口)，metastore(使metastore作为一个单独（远程）进程运行)，hiveserver是让hive以提供thrift服务的服务器形式运行，允许用不同语言编写的客户端进行访问。

分享到：

Maven常用插件使用说明之deploy | cygwin安装及hadoop启动

2012-12-11 22:48
浏览 1071
评论(0)
分类:企业架构
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

基于Hadoop的海量交易记录查询系统研究: 本文通过对 Hadoop 的深入分析和研究，根据交易记录查询系统的需求，设计并实现了基于 Hadoop 的海量交易记录查询系统。首先对 Hadoop 及其相关技术做了研究，着重介绍了 Hadoop 云计算框架中的 HDFS 分布式文件...

hadoop 索引相关记录: 标题中的“hadoop 索引相关记录”指的是在Hadoop MapReduce框架中与数据索引相关的技术。Hadoop是一个开源分布式计算框架，主要用于处理和存储大规模数据集。MapReduce是其核心计算模型，它将大数据处理任务分解为两...

hadoop作业记录档案: "hadoop作业记录档案"可能指的是在Hadoop生态系统中执行的各种作业（jobs）的详细日志和记录，这些记录对于理解作业的运行状态、诊断问题以及优化性能至关重要。 Hadoop的核心组件包括HDFS（Hadoop Distributed ...

大数据之路选择Hadoop还是MaxCompute？Hadoop开源与MaxCompute对比材料: - **数据访问审计**：记录所有数据访问行为，方便追踪和审计。 - **风险控制**：通过自动化工具识别潜在的安全风险。 ##### 7.3 Hadoop vs MaxCompute安全对比两者的安全机制，MaxCompute在云服务的基础上提供了...

hadoop2lib.tar.gz: 例如，Hadoop Common，它是所有Hadoop模块的基础，提供了一些通用的工具和服务，如网络通信、日志记录、配置管理等。Hadoop2lib还可能包含Hadoop MapReduce库，这是实现MapReduce任务的关键，它提供了编写和执行...

基于hadoop的电信客服数据分析+文档: 在这个基于Hadoop的电信客服数据分析项目中，我们重点探讨如何利用Hadoop生态系统来解析和分析电信行业的客户通话记录，从而获取有价值的洞察。首先，Hadoop是Apache基金会开发的一个分布式计算框架，其核心包括...

Hadoop 分析统计学生考试成绩1: * hadoop.log：日志记录文件 * database.sql：建立数据库的脚本 * input：格式化后的 Hadoop 的输入文件 * output：输出文件 * raw：存放原始数据的文件夹三、代码文件说明主要的项目代码文件包括： * src/main...

基于hadoop的web访问记录分析: 在这个项目“基于Hadoop的Web访问记录分析”中，我们将探讨如何利用Hadoop来分析Web服务器的日志文件，提取出有价值的信息。首先，我们要了解Hadoop的核心组件：HDFS（Hadoop Distributed File System）和...

Hadoop云计算2.0笔记第一课Hadoop介绍: Map 任务负责解析每条数据记录，传递给用户编写的 map()，将 map() 输出数据写入本地磁盘。Reduce 任务负责从 Map Task 上远程读取输入数据，对数据排序，将数据按照分组传递给用户编写的 reduce() 逻辑。 7. ...

Hadoop实战大数据大作业: ### Hadoop实战大数据大作业——基于Hadoop的单词统计系统 #### 一、课题简介与研究意义 **课题简介：** 本课题旨在设计一个简单的基于Hadoop平台进行的单词统计系统。该系统需要自行搭建Hadoop伪分布式架构，并...

hadoop 实战 dev_03: 标题中的知识点：Hadoop实战dev_03 内容概述：本次分享是关于Hadoop实战的第三部分，专注于Hadoop系统的应用开发实例。知识点详细说明： 1. Hadoop系统：Hadoop是一个能够存储和处理大量数据的分布式系统框架，是...

hadoop依赖包: 1. **hadoop-common**: 这个模块提供了Hadoop的基础功能，包括网络通信、配置管理、日志记录、安全性和通用工具等。 2. **hadoop-hdfs**: 它包含了HDFS的所有源代码，使得数据可以在分布式环境中进行存储和访问。...

使用hadoop实现WordCount实验报告.docx: 实验报告的目的是详细记录使用Hadoop在Windows环境下实现WordCount应用的过程，包括环境配置、WordCount程序的实现以及实验结果分析。本实验旨在理解Hadoop分布式计算的基本原理，并熟悉Hadoop集群的搭建与管理。 #...

基于hadoop的词频统计.docx: NameNode 负责管理文件系统的元数据，包括 FsImage 和 EditLog，其中 FsImage 存储文件系统的状态，EditLog 记录所有对文件系统的修改操作。Secondary NameNode 作为辅助角色，定期创建检查点，合并 EditLog 和 ...

hadoop学习记录笔记: Hadoop是由Apache基金会开发的一个开源框架，旨在处理和存储海量数据。它提供了分布式存储和处理大规模数据集的能力，成为大数据领域的基石。Hadoop的核心组件包括Hadoop分布式文件系统（HDFS）和MapReduce编程模型...

hadoop2.6.0源码和eclipse插件: 5. **Utilities**：提供了各种辅助工具，如文件系统操作、序列化、日志记录等。为了便于在Eclipse中开发和调试Hadoop项目，压缩包还提供了`hadoop-eclipse-plugin-2.6.0.jar`，这是一个Eclipse插件。安装这个插件...

配置Eclipse连接Hadoop: - "单机测试 Hadoop.txt"可能是记录此类测试过程的文档，可以参照其中的步骤来检查配置是否正确。 5. **编写和调试Hadoop应用**： - 使用Eclipse创建Java项目，导入Hadoop的相关库，如`hadoop-core.jar`和`hadoop...

什么是Hadoop.pdf: HBase中的数据以表格形式存储，每个表格包含多行记录，每行记录又由一个行键和多个列族构成。这种数据模型非常适合于处理半结构化或非结构化数据。 **3. Zookeeper** - Zookeeper是一个用于分布式系统的协调服务，...

Hadoop学习时间轴: 根据提供的信息，我们可以详细地解析出关于Hadoop学习时间轴中的关键知识点，这些知识点主要集中在Hadoop的基础架构、MapReduce工作原理以及Hive在实际应用中的优化等方面。 ### Hadoop学习时间轴概述 Hadoop是一...

Global site tag (gtag.js) - Google Analytics