- 浏览: 494638 次
- 性别:
- 来自: 广州
文章分类
- 全部博客 (502)
- Java (70)
- Linux (10)
- 数据库 (38)
- 网络 (10)
- WEB (13)
- JSP (4)
- 互联网 (71)
- JavaScript (30)
- Spring MVC (19)
- HTML (13)
- CSS (3)
- AngularJS (18)
- Redis (5)
- Bootstrap CSS (1)
- ZooKeeper (4)
- kafka (6)
- 服务器缓存 (4)
- Storm (1)
- MongoDB (9)
- Spring boot (16)
- log4j (2)
- maven (3)
- nginx (5)
- Tomcat (2)
- Eclipse (4)
- Swagger (2)
- Netty (5)
- Dubbo (1)
- Docker (7)
- Hadoop (12)
- OAuth (1)
- webSocket (4)
- 服务器性能 (7)
- Session共享 (1)
- tieye修改 (1)
- 工作 (1)
- 有用的语录 (0)
- https (2)
- common (5)
- 产品开发管理 (1)
- CDN 工作原理 (1)
- APNS、GCM (1)
- 架构图 (3)
- 功能实现分析 (1)
- JMX (1)
- 服务器相关操作命令 (1)
- img02 (0)
- 服务器环境搭建 (9)
- goodMenuBook (1)
- CEInstantPot (0)
- 有用数据 (1)
- 百度地图WEB API (2)
- 正则表达式 (1)
- 样式例子 (2)
- staticRecipePressureCooker.zip (1)
- jCanvas (1)
- 网站攻击方法原理 (1)
- 架构设计 (3)
- 物联网相关 (3)
- 研发管理 (7)
- 技术需求点 (1)
- 计划 (1)
- spring cloud (11)
- 服务器开发的一些实用工具和方法 (1)
- 每天学到的技术点 (4)
- Guava (1)
- ERP 技术注意要点 (2)
- 微信小程序 (1)
- FineRepor (1)
- 收藏夹 (1)
- temp (5)
- 服务架构 (4)
- 任职资格方案 (0)
- osno_test (1)
- jquery相关 (3)
- mybatis (4)
- ueditor (1)
- VueJS (7)
- python (10)
- Spring EL (1)
- shiro (1)
- 前端开发原理与使用 (7)
- YARN (1)
- Spark (1)
- Hbase (2)
- Pig (2)
- 机器学习 (30)
- matplotlib (1)
- OpenCV (17)
- Hystrix (1)
- 公司 (1)
- miniui (4)
- 前端功能实现 (3)
- 前端插件 (1)
- 钉钉开发 (2)
- Jenkins (1)
- elasticSearch使用 (2)
- 技术规范 (4)
- 技术实现原理 (0)
最新评论
-
大数据相关安装和测试
2019-08-05 22:32 330大数据相关安装和测试 -
迭代计算原理
2018-08-21 17:48 1248迭代计算原理 把上一步的计算结果代入这一步的运算中去。。 ... -
hive 原理与安装
2018-08-12 17:39 450hive 原理与安装 hive 是把类似SQL的语 ... -
ssh原理和使用
2018-08-10 21:10 651SSH 远程登陆原理: 使用密码登录,每次都必须输入密码 ... -
hadoop 集群运行的原理与使用
2018-08-09 16:43 845hadoop 集群运行的原理与使用 就是在每台服务器上分别 ... -
hadoop安装
2018-08-08 21:30 340//----------------------------- ... -
spark基础知识
2018-07-25 16:28 238spark基础知识 Apache Spark是一个围绕速度、 ... -
Hadoop应用基础知识
2018-07-25 15:57 460hadoop (1)Hadoop是一个开源 ... -
Hadoop 与 JStrom 的应用场景和区别
2016-11-25 14:19 443Hadoop 与 JStrom 的应用场 ... -
Hadoop MapReduce框架详解
2016-11-25 14:19 466Hadoop MapReduce框架详解 ... -
HDFS的运行原理
2016-09-10 16:16 438HDFS的运行原理 简介 HDF ...
相关推荐
### Hadoop搭建及MR编程-实验报告 #### 一、实验目的 1. **了解熟悉Linux命令**:在本实验中,参与者需掌握基本的Linux命令操作,为后续Hadoop环境的搭建奠定基础。 2. **学习Hadoop的安装与配置**:包括Hadoop...
【标题】"hadoop编写MR和运行测试共12页.pdf.zip" 提供的资料主要聚焦于Hadoop MapReduce的编程与测试。MapReduce是Hadoop框架中的核心组件,用于处理和存储大规模数据集。这份12页的文档很可能是详细讲解如何在...
本来是想直接扒一扒MapReduce的工作原理,但是觉得只是图解或者文字描述,没有Demo的运行体验总是无趣的,一遍走下来也没有什么成就感,因此还是要撸一撸代码的。 那么谈到MapReduce的工作原理,我们的Demo首选自然...
第五天 hadoop2.x中HA机制的原理和全分布式集群安装部署及维护 01-zookeeper.avi 02-zookeeper2.avi 03-NN高可用方案的要点1.avi 04-hadoop-HA机制的配置文件.avi 05-hadoop分布式集群HA模式部署.avi 06-hdfs...
07-MR程序的几种提交运行模式.avi 08-YARN的通用性意义.avi 09-yarn的job提交流程.avi 第四天 常见mr算法实现和shuffle的机制 01-复习.avi 02-hadoop中的序列化机制.avi 03-流量求和mr程序开发.avi 04-...
059 MR作业运行流程整体分析 060 MapReduce执行流程之Shuffle和排序流程以及Map端分析 061 MapReduce执行流程之Reduce端分析 062 MapReduce Shuffle过程讲解和Map Shuffle Phase讲解 063 Reduce Shuffle Phase讲解 ...
5. 实战演练:通过实际案例,学习如何在Hadoop上部署和运行大数据处理任务。 6. 数据处理与分析:学习如何利用Hadoop对不同类型的数据进行清洗、转换和分析。 7. 高级主题:可能涉及Hadoop与其他组件如HBase、Hive、...
MR(MapReduce)程序提交到客户端所在的节点,由 YarnRunner 运行。这个过程中,YarnRunner 负责将 MR 程序提交到 ResourceManager,以获取资源和执行任务。 2. ResourceManager ResourceManager 是 Yarn 的核心...
4. **Hadoop相关JAR包**:描述中提到的“hadoop相关jar包”可能包括Hadoop Common、Hadoop HDFS、Hadoop MapReduce Client等组件的JAR文件,这些是运行MapReduce作业所必需的依赖库,它们提供了Hadoop框架的API和...
《基于Hadoop的应用开发》 在当今大数据时代,Hadoop作为开源的分布式计算框架,...通过深入学习“HadoopMR-master”这样的项目,我们可以更好地理解和运用Hadoop,从而在大数据和人工智能的交叉领域实现更大的创新。
文档内容围绕Hadoop生态系统中的两个主要组件Hive和Hadoop进行展开,对它们的工作原理、性能调优策略等方面进行了深入讨论。 首先,Hive是建立在Hadoop上的一个数据仓库工具,可以将结构化的数据文件映射为一张...
安装Java环境是运行Hadoop的前提,因为Hadoop依赖Java运行。单机安装配置涉及修改配置文件,如core-site.xml和hdfs-site.xml,以便Hadoop可以正确地在本地机器上运行。伪分布式安装则模拟多节点环境,但所有组件都在...
实验者创建了输入文件,上传到HDFS(Hadoop Distributed File System),然后运行`wordcount`程序进行统计,最后查看输出结果,从而理解MapReduce的工作原理。 通过这次实验,参与者不仅掌握了Hadoop MR程序的开发...
在大数据处理领域,Hadoop MapReduce是一种广泛应用的分布式计算框架,它使得在大规模数据集上进行并行计算成为可能。...实际操作中,需要编写Java代码,理解和掌握MapReduce的编程模型,以及TF-IDF的计算原理。
详细介绍 Hadoop 家族中的 MapReduce 原理 MapReduce 是 Hadoop 家族中的核心组件之一,是一个分布式运算程序的编程框架。MapReduce 的核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式...
在大数据处理领域,Hadoop MapReduce 是一个至关重要的框架,它允许用户编写并运行分布式处理大规模数据集的应用程序。这个框架借鉴了 Google 的 MapReduce 论文,将复杂的大规模数据处理任务分解为两个主要阶段:...
这个阶段的数据处理是并行进行的,每个Map任务在独立的数据节点上运行,提高了整体处理效率。 Reduce阶段在Map阶段之后,它的目的是将Map阶段生成的中间结果进行合并和聚合。 Reduce任务会根据中间键值对的键进行...
4. **配置MapReduce Location**:创建新的Hadoop位置,设置Hadoop的安装路径为/usr/local/hadoop,并指定tmp文件夹的位置,以满足Hadoop运行时的临时文件需求。 5. **项目创建**:在Eclipse中创建Map/Reduce项目,...
通过这些文件,学习者可以系统地学习Hadoop MapReduce的运行机制,理解数据序列化的意义,掌握远程调试技巧,并对Hadoop的日志系统和本地模式有深入认识。这些知识对于构建、优化和维护Hadoop集群至关重要。
在本教程中,我们将深入探讨如何在VMware虚拟机中安装...通过这个过程,你将不仅学会如何在VMware上的CentOS7搭建Hadoop伪分布式环境,还能深入理解Hadoop的组件和工作原理,为进一步的大数据学习打下坚实的基础。