`
samuschen
  • 浏览: 411901 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论

hadoop

 
阅读更多

 

hadoop job解决大数据量关联时数据倾斜的一种办法

http://www.geminikwok.com/2011/04/02/hadoop-job%E8%A7%A3%E5%86%B3%E5%A4%A7%E6%95%B0%E6%8D%AE%E9%87%8F%E5%85%B3%E8%81%94%E6%97%B6%E6%95%B0%E6%8D%AE%E5%80%BE%E6%96%9C%E7%9A%84%E4%B8%80%E7%A7%8D%E5%8A%9E%E6%B3%95/

 

[转]Hadoop关于处理大量小文件的问题和解决方法

http://www.geminikwok.com/2011/06/10/%e8%bd%achadoop%e5%85%b3%e4%ba%8e%e5%a4%84%e7%90%86%e5%a4%a7%e9%87%8f%e5%b0%8f%e6%96%87%e4%bb%b6%e7%9a%84%e9%97%ae%e9%a2%98%e5%92%8c%e8%a7%a3%e5%86%b3%e6%96%b9%e6%b3%95/

分享到:
评论

相关推荐

    win环境 hadoop 3.1.1安装包

    Hadoop是一个由Apache软件基金会开发的开源框架,它允许使用简单的编程模型在分布式环境中存储和处理大数据。它主要由四个核心组件构成:Hadoop Common、HDFS(Hadoop Distributed File System)、YARN(Yet Another...

    hadoop-2.7.0.tar

    Hadoop-2.7.0.tar是一个著名的开源分布式存储与计算系统Hadoop的安装包。Hadoop是由Apache软件基金会开发的一个分布式系统基础架构,主要解决大数据问题。Hadoop的设计初衷是可靠、高效、可伸缩地存储和处理大数据集...

    hadoop-eclipse-plugin-2.6.0.jar.zip_2.6.0_hadoop_hadoop plugin

    《Hadoop Eclipse Plugin 2.6.0:高效开发与测试工具》 Hadoop作为大数据处理的核心框架,为开发者提供了强大的分布式存储和计算能力。在实际的开发过程中,为了提高效率并减少错误,Hadoop提供了Eclipse插件,即...

    hadoop2.7.3 hadoop.dll

    在windows环境下开发hadoop时,需要配置HADOOP_HOME环境变量,变量值D:\hadoop-common-2.7.3-bin-master,并在Path追加%HADOOP_HOME%\bin,有可能出现如下错误: org.apache.hadoop.io.nativeio.NativeIO$Windows....

    Hadoop下载 hadoop-2.9.2.tar.gz

    Hadoop 是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。最初由 Yahoo 的工程师 Doug Cutting 和 Mike Cafarella Hadoop 是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。最初由 Yahoo...

Global site tag (gtag.js) - Google Analytics