`
gcgmh
  • 浏览: 358423 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

hadoop hdfs tips

阅读更多
一、可以用网上的hdfs-webDav在windows机器上通过网上邻居防问hadoop的hdfs文件系统。步骤:
   1.下载hdfs-webdav.war,修改hdfs-webdev.war里面的WEB-INF/classes/hadoop-site.xml

修改fs.default.name属性,以确定hdfs-webdev要连接的hadoop NameNode Server,示例:

property>
   <name>fs.default.name</name>
   <value>hdfs://10.0.1.8:54310/</value>
   <description>namenode</description>
</property>


    2.替换hadoop-xxxx-core.jar版本
由于hadoop有自己的rpc远程调用实现,并且各个版本间可能不兼容(0.17.x与0.18.x之间就不兼容),所以需要将WEB-INF/lib/hadoop-xxxx-core.jar的版本与NameNode Server的版本一致.现war自带的是hadoop-0.17.2.1-core.jar的版本

    3.访问http://localhost:8080/hdfs-webdev

    4.打开“网上邻居”,添加网上邻居,在“请键入网上邻居的位置”中输入 Web 文件夹的 URL.

http://localhost:8080/hdfs-webdev

然后按照向导的提示继续下一步就可以了. 

----------------------------
通过以上设置,可以在网上邻居里查看hadfs的文件了,却不能上传,一上传就报错,
查来很久,原来是hadoop权限问题,在hadoop-site.xml里增加如下内容:
<property>
        <name>dfs.permissions</name>
        <value>false</value>
</property>

<property>
        <name>dfs.web.ugi</name>
        <value>hadoop,supergroup</value>
</property>



二、解决用webDav上传中文文件乱码问题。
    这主要由于hadoop是默认的是utf-8的格式,而windows是gbk的,所以要在转码,webDav是经过tomcat容器实现上传文件的,所以要在tomcat里将转码配制一下,即Ok了。






  

   
分享到:
评论
1 楼 imcaptor 2009-02-06  
  3.访问http://localhost:8080/hdfs-webdev

应该修改成为:
3.访问http://localhost:8080/hdfs-webdav

相关推荐

    hadoop权威指南第四版.Hadoop.The.Definitive.Guide.4th

    Hadoop是Apache基金会的一个开源项目,其核心设计包括两个主要组件:Hadoop Distributed File System (HDFS) 和 MapReduce。HDFS是一个分布式文件系统,它允许数据在多台服务器上分布存储,以实现高可用性和容错性;...

    Apache Flume Distributed Log Collection for Hadoop(PACKT,2ed,2015)

    Understand and configure the Hadoop File System (HDFS) Sink Use a morphline-backed Sink to feed data into Solr Create redundant data flows using sink groups Configure and use various sources to ...

    开发和优化高效的Hadoop & Hive 程序

    例如,根据作业的特性合理设置Map和Reduce的数量,以及对HDFS上的小文件合并与压缩,这都能够显著提升数据处理的效率。 Hive调优方面,需要根据应用场景选择合适的Hive特性,例如数据倾斜的解决方法、高级特性如...

    hadoop HA+federation

    在Hadoop 1.0中,NameNode作为HDFS的核心组件,负责存储所有元数据,这导致了单一命名空间的局限性和资源限制。为了解决这些问题,Hadoop 2.0引入了Federation和High Availability(HA)。 1. **Federation**: - ...

    Sams.Teach.Yourself.Big.Data.Analytics.with.Microsoft.HDInsight

    Getting to know Hadoop 2.0 and the innovations it provides like HDFS2 and YARN Quickly installing, configuring, and monitoring Hadoop (HDInsight) clusters in the cloud and automating cluster ...

Global site tag (gtag.js) - Google Analytics