一、可以用网上的hdfs-webDav在windows机器上通过网上邻居防问hadoop的hdfs文件系统。步骤:
1.下载hdfs-webdav.war,修改hdfs-webdev.war里面的WEB-INF/classes/hadoop-site.xml
修改fs.default.name属性,以确定hdfs-webdev要连接的hadoop NameNode Server,示例:
property>
<name>fs.default.name</name>
<value>hdfs://10.0.1.8:54310/</value>
<description>namenode</description>
</property>
2.替换hadoop-xxxx-core.jar版本
由于hadoop有自己的rpc远程调用实现,并且各个版本间可能不兼容(0.17.x与0.18.x之间就不兼容),所以需要将WEB-INF/lib/hadoop-xxxx-core.jar的版本与NameNode Server的版本一致.现war自带的是hadoop-0.17.2.1-core.jar的版本
3.访问http://localhost:8080/hdfs-webdev
4.打开“网上邻居”,添加网上邻居,在“请键入网上邻居的位置”中输入 Web 文件夹的 URL.
http://localhost:8080/hdfs-webdev
然后按照向导的提示继续下一步就可以了.
----------------------------
通过以上设置,可以在网上邻居里查看hadfs的文件了,却不能上传,一上传就报错,
查来很久,原来是hadoop权限问题,在hadoop-site.xml里增加如下内容:
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
<property>
<name>dfs.web.ugi</name>
<value>hadoop,supergroup</value>
</property>
二、解决用webDav上传中文文件乱码问题。
这主要由于hadoop是默认的是utf-8的格式,而windows是gbk的,所以要在转码,webDav是经过tomcat容器实现上传文件的,所以要在tomcat里将转码配制一下,即Ok了。
分享到:
相关推荐
Hadoop是Apache基金会的一个开源项目,其核心设计包括两个主要组件:Hadoop Distributed File System (HDFS) 和 MapReduce。HDFS是一个分布式文件系统,它允许数据在多台服务器上分布存储,以实现高可用性和容错性;...
Understand and configure the Hadoop File System (HDFS) Sink Use a morphline-backed Sink to feed data into Solr Create redundant data flows using sink groups Configure and use various sources to ...
例如,根据作业的特性合理设置Map和Reduce的数量,以及对HDFS上的小文件合并与压缩,这都能够显著提升数据处理的效率。 Hive调优方面,需要根据应用场景选择合适的Hive特性,例如数据倾斜的解决方法、高级特性如...
在Hadoop 1.0中,NameNode作为HDFS的核心组件,负责存储所有元数据,这导致了单一命名空间的局限性和资源限制。为了解决这些问题,Hadoop 2.0引入了Federation和High Availability(HA)。 1. **Federation**: - ...
Getting to know Hadoop 2.0 and the innovations it provides like HDFS2 and YARN Quickly installing, configuring, and monitoring Hadoop (HDInsight) clusters in the cloud and automating cluster ...