- 浏览: 2102083 次
- 性别:
- 来自: 北京
-
文章分类
- 全部博客 (366)
- hadoop (91)
- DB (2)
- vmware (0)
- python (49)
- Java (72)
- Linux (57)
- 多线程 (2)
- hive (1)
- hbase (3)
- mongodb (5)
- Hibernate (3)
- nodejs (1)
- 模式与重构 (1)
- 持续集成CI (4)
- Mysql (2)
- chorme (1)
- 软件开发 (0)
- 敏捷 (5)
- maven (3)
- windows (7)
- 测试驱动 (1)
- scala (3)
- Jetty (0)
- android (1)
- eclipse (1)
- 设计模式 (1)
- 面向对象设计 (2)
- oracle (3)
- cassandra (15)
- pig (3)
- rails (1)
- redis (4)
- ruby (1)
- storm (0)
- 实时运算 (3)
- scribe (1)
- hadoop源码 (3)
- cassandra jna (1)
- Kafka (2)
- Sublime (2)
- C++ (2)
- C (1)
- 版本控制 (1)
- 服务器 (1)
- docker (0)
- flink (1)
最新评论
-
伍大都督:
解释太到位了,感谢分享
理解Linux系统中的load average(图文版) -
rfjian123:
非常感谢,用你的方法解决了问题。
Server sent unexpected return value (403 Forbidden) in response to OPTIONS -
yuhaifei12:
今天遇到同样的问题了。设置的是每分钟执行一次。结果发现每分钟执 ...
解决Linux下crontab同一时间重复执行问题 -
BigBird2012:
想问一下,使用ExecutorService每次都要调用 sh ...
spring quartz使用多线程并发“陷阱” -
zhuqx1130:
有用,谢谢
解决Sublime Text 3中文显示乱码(tab中文方块)问题
上一次记录了如何调试NN,JT,DT,JT,这次记录为调试mapreduce函数,和前几个应用不同,mapreduce为Child进程,不能直接通过bin/hadoop文件中开启远程调试端口,具体操作如下:
1. 选定一台调试机器,修改mapred-site.xml文件,添加如下配置:
<property> <name>mapred.child.java.opts</name> <value>-agentlib:jdwp=transport=dt_socket,address=8883,server=y,suspend=y</value> </property>
2. 关闭所有的tasktracker,只保留上面配置的一台需要调试的tasktracker
3. 启动Mapreduce job
3. 右键hadoop src项目,右键“Debug As”,选择“Debug Configurations”,选择“Remote Java Application”,添加一个新的测试,输入远程host ip和监听端口,上例为8883,然后点击“Debug”按钮。此时应该连接到远程tasktracker child进程,并进入断点位置,可以单步调试了。
我的YY:在调试过程发现开启所有tasktracker,此时连接到tasktracker一下然后就断开,所以需要关闭其他tasktracker,只保留一台。
按照上面的配置,如果抛出一个连接错误异常,再连接一下就好了。
-- heipark
评论
7 楼
爱岩修
2014-04-03
zk279444107 写道
zk279444107 写道
你好,通过按你的方法配置,但是debug不了。我是用eclipse+本机伪分布式,通过cygwin模拟的环境。
监听tasktracker是没有问题的:
localhost: Listening for transport dt_socket at address: 6666
但mapred.child.java.opts的端口就是连接不上,我首先是想是不是要任务运行,端口才会开启,但任务都运行完毕了还是连接不上。
我的其他配置:
<property>
<name>mapred.job.reuse.jvm.num.tasks</name>
<value>-1</value>
</property>
<property>
<name>mapred.tasktracker.map.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.tasktracker.reduce.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.task.timeout</name>
<value>600000</value>
</property>
监听tasktracker是没有问题的:
localhost: Listening for transport dt_socket at address: 6666
但mapred.child.java.opts的端口就是连接不上,我首先是想是不是要任务运行,端口才会开启,但任务都运行完毕了还是连接不上。
我的其他配置:
<property>
<name>mapred.job.reuse.jvm.num.tasks</name>
<value>-1</value>
</property>
<property>
<name>mapred.tasktracker.map.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.tasktracker.reduce.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.task.timeout</name>
<value>600000</value>
</property>
问题已经解决,关键在于eclipse插件的配置,同时谢谢博主分享经验心得。
是怎么解决的?mapred-site.xml用的这个配置文件吗?eclipse的插件有什么配置?
6 楼
爱岩修
2014-04-03
zk279444107 写道
zk279444107 写道
你好,通过按你的方法配置,但是debug不了。我是用eclipse+本机伪分布式,通过cygwin模拟的环境。
监听tasktracker是没有问题的:
localhost: Listening for transport dt_socket at address: 6666
但mapred.child.java.opts的端口就是连接不上,我首先是想是不是要任务运行,端口才会开启,但任务都运行完毕了还是连接不上。
我的其他配置:
<property>
<name>mapred.job.reuse.jvm.num.tasks</name>
<value>-1</value>
</property>
<property>
<name>mapred.tasktracker.map.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.tasktracker.reduce.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.task.timeout</name>
<value>600000</value>
</property>
监听tasktracker是没有问题的:
localhost: Listening for transport dt_socket at address: 6666
但mapred.child.java.opts的端口就是连接不上,我首先是想是不是要任务运行,端口才会开启,但任务都运行完毕了还是连接不上。
我的其他配置:
<property>
<name>mapred.job.reuse.jvm.num.tasks</name>
<value>-1</value>
</property>
<property>
<name>mapred.tasktracker.map.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.tasktracker.reduce.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.task.timeout</name>
<value>600000</value>
</property>
是怎么解决的?mapred-site.xml用的这个配置文件吗?eclipse的插件有什么配置?
问题已经解决,关键在于eclipse插件的配置,同时谢谢博主分享经验心得。
5 楼
heipark
2013-05-08
coobery 写道
"上一次记录了如何调试NN,JT,DT,JT"
哪篇博文记录了?
哪篇博文记录了?
在这里:
http://heipark.iteye.com/blog/1393553
4 楼
coobery
2013-05-08
"上一次记录了如何调试NN,JT,DT,JT"
哪篇博文记录了?
哪篇博文记录了?
3 楼
heipark
2012-03-22
zk279444107 写道
zk279444107 写道
你好,通过按你的方法配置,但是debug不了。我是用eclipse+本机伪分布式,通过cygwin模拟的环境。
监听tasktracker是没有问题的:
localhost: Listening for transport dt_socket at address: 6666
但mapred.child.java.opts的端口就是连接不上,我首先是想是不是要任务运行,端口才会开启,但任务都运行完毕了还是连接不上。
我的其他配置:
<property>
<name>mapred.job.reuse.jvm.num.tasks</name>
<value>-1</value>
</property>
<property>
<name>mapred.tasktracker.map.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.tasktracker.reduce.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.task.timeout</name>
<value>600000</value>
</property>
监听tasktracker是没有问题的:
localhost: Listening for transport dt_socket at address: 6666
但mapred.child.java.opts的端口就是连接不上,我首先是想是不是要任务运行,端口才会开启,但任务都运行完毕了还是连接不上。
我的其他配置:
<property>
<name>mapred.job.reuse.jvm.num.tasks</name>
<value>-1</value>
</property>
<property>
<name>mapred.tasktracker.map.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.tasktracker.reduce.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.task.timeout</name>
<value>600000</value>
</property>
问题已经解决,关键在于eclipse插件的配置,同时谢谢博主分享经验心得。
恭喜!

2 楼
zk279444107
2012-03-22
zk279444107 写道
你好,通过按你的方法配置,但是debug不了。我是用eclipse+本机伪分布式,通过cygwin模拟的环境。
监听tasktracker是没有问题的:
localhost: Listening for transport dt_socket at address: 6666
但mapred.child.java.opts的端口就是连接不上,我首先是想是不是要任务运行,端口才会开启,但任务都运行完毕了还是连接不上。
我的其他配置:
<property>
<name>mapred.job.reuse.jvm.num.tasks</name>
<value>-1</value>
</property>
<property>
<name>mapred.tasktracker.map.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.tasktracker.reduce.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.task.timeout</name>
<value>600000</value>
</property>
监听tasktracker是没有问题的:
localhost: Listening for transport dt_socket at address: 6666
但mapred.child.java.opts的端口就是连接不上,我首先是想是不是要任务运行,端口才会开启,但任务都运行完毕了还是连接不上。
我的其他配置:
<property>
<name>mapred.job.reuse.jvm.num.tasks</name>
<value>-1</value>
</property>
<property>
<name>mapred.tasktracker.map.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.tasktracker.reduce.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.task.timeout</name>
<value>600000</value>
</property>
问题已经解决,关键在于eclipse插件的配置,同时谢谢博主分享经验心得。
1 楼
zk279444107
2012-03-22
你好,通过按你的方法配置,但是debug不了。我是用eclipse+本机伪分布式,通过cygwin模拟的环境。
监听tasktracker是没有问题的:
localhost: Listening for transport dt_socket at address: 6666
但mapred.child.java.opts的端口就是连接不上,我首先是想是不是要任务运行,端口才会开启,但任务都运行完毕了还是连接不上。
我的其他配置:
<property>
<name>mapred.job.reuse.jvm.num.tasks</name>
<value>-1</value>
</property>
<property>
<name>mapred.tasktracker.map.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.tasktracker.reduce.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.task.timeout</name>
<value>600000</value>
</property>
监听tasktracker是没有问题的:
localhost: Listening for transport dt_socket at address: 6666
但mapred.child.java.opts的端口就是连接不上,我首先是想是不是要任务运行,端口才会开启,但任务都运行完毕了还是连接不上。
我的其他配置:
<property>
<name>mapred.job.reuse.jvm.num.tasks</name>
<value>-1</value>
</property>
<property>
<name>mapred.tasktracker.map.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.tasktracker.reduce.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.task.timeout</name>
<value>600000</value>
</property>
发表评论
-
cloudera CDH5 vmware中cloudera manager报错"Internal error while querying the Host "
2014-07-22 10:19 2088无法获取host和service状态,解决办法: s ... -
thrift0.9.1简单教程(包含Java服务端和Java、python客户端)
2014-04-25 15:55 6443一、Thrift Java服务端和客户端 官 ... -
yum错误“Error in PREUN scriptlet in rpm package ”
2014-03-10 12:07 3996打算通过yum安装软件,发展之前有软件残骸。使用yu ... -
搭建cloudera yum私服
2014-03-05 11:08 3216一、安装Cloudera yum仓库 1. 下载仓库rpm ... -
cloudera创建私服错误一例
2014-02-24 11:41 1383执行“reposync -r cloudera-cdh4 ” ... -
Cloudera Manager的Hadoop配置文件管理
2014-02-11 10:21 11477本文基于Cloudera Manager 4.8,以下简称 ... -
修改cloudera manager管理主机名(转)
2014-02-10 14:22 7665I installed the Cloudera Mana ... -
cloudera manager tasktrakcer监控状态错误
2014-02-10 11:32 1316此文用作图片外链。cloudera网站坑爹呀! -
cloudera manager 4.8 添加设备DNS反向解析问题
2014-01-28 16:20 3786添加设备时agent会使用host命令反向解析获取clou ... -
apache kafka v0.8入门遇到问题
2014-01-23 12:20 1679官方文档:https://kafka.apache.org/ ... -
hadoop2.0(cdh4) fs client错误"java.io.IOException: No FileSystem for scheme: hdfe"
2013-12-31 12:32 10078启动dfs client时候报错:“java.io.IOE ... -
Hadoop Combiner的几个调用时间点
2013-12-20 08:37 2981Combiner是在Map端被执行,共有两个时机会被触 ... -
hadoop1.0中NameNode HA的妥协方案
2013-12-10 16:26 1538hadoop1.0没有HA,可以添加NFS做为metada ... -
hdaoop2.x (CDH4、5)下使用DFS Client(包含HA)
2013-12-09 16:42 3333一、不使用HA场景 1.1 获取FileSystem(下 ... -
Hadoop学习指南
2013-11-26 14:26 1403安装配置 CDH4(hadoop2.0) 端口 C ... -
cloudera cdh中hadoop-client包的作用
2013-11-22 22:12 4133hadoop-client是为了让开发者可以很方便的使用当前 ... -
could only be replicated to 0 nodes instead of minReplication (=1)
2013-11-18 17:02 13958一、出现这个错误,先看看DN是不是正常启动并与NN通信,使用 ... -
Hadoop Pig获取HDFS文件名
2013-11-15 08:37 3223A = LOAD 'input' using PigS ... -
cloudera CDH5正式版(与CDH4比较)
2013-11-04 22:14 2526要求JDK7以上,JDK6不被支持 基于a ... -
Pig写UDF解析XML遇到一诡异错误“ClassNotFoundException”
2013-10-16 10:11 1294UDF中使用apache digester做XML解析,代码 ...
相关推荐
配置Eclipse连接远程Hadoop集群时,需要确保集群的HDFS和MapReduce服务正常运行,并且在Eclipse中设置正确的Hadoop配置文件路径,以及集群的主机地址和端口。 在文档《Eclipse3.3_(windows7)连接远程hadoop(RedHat....
- **Hadoop核心组成介绍**:详述Hadoop的两大核心组件——HDFS和MapReduce的工作原理。 - **Hadoop集群结构**:分析Hadoop集群的架构设计,包括NameNode、DataNode的角色与职责。 - **Hadoop独立模式安装与测试**:...
- 包括Hadoop的核心组件HDFS和MapReduce。 - 以及其他相关项目如Hive、Pig等。 - **Hadoop核心组成介绍** - HDFS负责数据存储。 - MapReduce负责数据处理。 - **Hadoop生态圈结构** - 包括数据存储、数据处理、...
漫画作品与时间旅行题材
Spring Boot特点: 1、创建一个单独的Spring应用程序; 2、嵌入式Tomcat,无需部署WAR文件; 3、简化Maven配置; 4、自动配置Spring; 5、提供生产就绪功能,如指标,健康检查和外部配置; 6、绝对没有代码生成和XML的配置要求;第一章 绪 论 1 1.1背景及意义 1 1.2国内外研究概况 2 1.3 研究的内容 2 第二章 关键技术的研究 3 2.1 相关技术 3 2.2 Java技术 3 2.3 ECLIPSE 开发环境 4 2.4 Tomcat介绍 4 2.5 Spring Boot框架 5 第三章 系统分析 5 3.1 系统设计目标 6 3.2 系统可行性分析 6 3.3 系统功能分析和描述 7 3.4系统UML用例分析 8 3.4.1管理员用例 9 3.4.2用户用例 9 3.5系统流程分析 10 3.5.1添加信息流程 11 3.5.2操作流程 12 3.5.3删除信息流程 13 第四章 系统设计 14 4.1 系统体系结构 15 4.2 数据库设计原则 16 4.3 数据表 17 第五章 系统实现 18 5.1用户功能模块 18 5.2
内容概要:本文作为PyTorch的入门指南,首先介绍了PyTorch相较于TensorFlow的优势——动态计算图、自动微分和丰富API。接着讲解了环境搭建、PyTorch核心组件如张量(Tensor)、autograd模块以及神经网络的定义方式(如nn.Module),并且给出了详细的神经网络训练流程,包括前向传播、计算损失值、进行反向传播以计算梯度,最终调整权重参数。此外还简要提及了一些拓展资源以便进一步探索这个深度学习工具。 适用人群:初次接触深度学习技术的新学者和技术爱好者,有一定程序基础并希望通过PyTorch深入理解机器学习算法实现的人。 使用场景及目标:该文档有助于建立使用者对于深度学习及其具体实践有更加直观的理解,在完成本教程之后,读者应当能够在个人设备上正确部署Python环境,并依据指示独立创建自己的简易深度学习项目。 其他说明:文中所提及的所有示例均可被完整重现,同时官方提供的资料链接也可以方便有兴趣的人士对感兴趣之处继续挖掘,这不仅加深了对PyTorch本身的熟悉程度,也为未来的研究或者工程项目打下了良好的理论基础和实践经验。
古镇美食自驾游:舌尖上的历史韵味
1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。
漫画作品与神话传说融合
1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。
ADC推理软件AI程序
漫画作品与科幻元素融合
1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。
1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。
1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。
1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。
java-springboot+vue景区民宿预约系统实现源码(完整前后端+mysql+说明文档+LunW+PPT).zip
在智慧城市建设的大潮中,智慧园区作为其中的璀璨明珠,正以其独特的魅力引领着产业园区的新一轮变革。想象一下,一个集绿色、高端、智能、创新于一体的未来园区,它不仅融合了科技研发、商业居住、办公文创等多种功能,更通过深度应用信息技术,实现了从传统到智慧的华丽转身。 智慧园区通过“四化”建设——即园区运营精细化、园区体验智能化、园区服务专业化和园区设施信息化,彻底颠覆了传统园区的管理模式。在这里,基础设施的数据收集与分析让管理变得更加主动和高效,从温湿度监控到烟雾报警,从消防水箱液位监测到消防栓防盗水装置,每一处细节都彰显着智能的力量。而远程抄表、空调和变配电的智能化管控,更是在节能降耗的同时,极大地提升了园区的运维效率。更令人兴奋的是,通过智慧监控、人流统计和自动访客系统等高科技手段,园区的安全防范能力得到了质的飞跃,让每一位入驻企业和个人都能享受到“拎包入住”般的便捷与安心。 更令人瞩目的是,智慧园区还构建了集信息服务、企业服务、物业服务于一体的综合服务体系。无论是通过园区门户进行信息查询、投诉反馈,还是享受便捷的电商服务、法律咨询和融资支持,亦或是利用云ERP和云OA系统提升企业的管理水平和运营效率,智慧园区都以其全面、专业、高效的服务,为企业的发展插上了腾飞的翅膀。而这一切的背后,是大数据、云计算、人工智能等前沿技术的深度融合与应用,它们如同智慧的大脑,让园区的管理和服务变得更加聪明、更加贴心。走进智慧园区,就像踏入了一个充满无限可能的未来世界,这里不仅有科技的魅力,更有生活的温度,让人不禁对未来充满了无限的憧憬与期待。
边境自驾游异国风情深度体验