spark+hadoop+cenos6.5+VitualBox4.3.6整合开发(末) - 对酒当歌，人生几何 - ITeye博客

`

nannan408

浏览: 1784335 次
性别:
来自: 深圳

最近访客更多访客>>

greatwqs

c332030

hexin1985

yb2008qq

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

bilimeng：求教，ConcurrentHashMap不是线程安全的么，为啥 ...
架构师之jdk8-----------------ConcurrentHashMap快速构建本地缓存和单例模式
baiducctv5： wtaisi 写道wtaisi 写道|||||||||
spring aop中的propagation的7种配置的意思
zhangdong92：另外内存泄漏一般也不是指计算时溢出。而是指某些对象已经不再使用 ...
java基础之面试篇三---int,float,long,double取值范围，内存泄露
zhangdong92： Long.MAX_VALUE应该是(2^63)-1，而不是64 ...
java基础之面试篇三---int,float,long,double取值范围，内存泄露
nannan408： java-lxm 写道好湿好湿好湿谢谢: )。
游南巅之晚秋

spark+hadoop+cenos6.5+VitualBox4.3.6整合开发(末)

阅读更多

1.前言。
    spark0.8.1+shark0.8.1+hadoop2.2的整合，总体感觉是累。
    中间的章节由于时间问题还没整理处理，这里做些总体的评论。
2.评测。
    (1)spark跑在6台8核6G的电脑的wordcount并没有达到秒级，还是分钟级别，spark的牛吹大了。
    (2)与传统hadoop结合方面，shark是一边倒在了CDH,cloudra給了钱也不能丢完节操啊。因为shark不支持传统hadoop，我最终表示放弃走shark路线。一个从开源走到封闭，并且完全由一个变化莫测的公司去主导自己的开发的产品，注定走不长久。
     (3)spark和shark并没有发挥并行的优势，传说中的比map-reduce快90的谎言，在这里我需要揭破一下。
     (4)hadoop如果再一边倒到CDH方面的话，hadoop我也要剔除在选型范围，不是说和CDH有仇，只是请尊重开源开发者自由选型的权利。
3.结束。
     spark+shark在CDH的干扰下被扼杀了创造力。想法是好的，走的路反了。

0
顶

0
踩

分享到：

socket-udp打洞 | 扩展63位long型数字为64位正BigDecimal （ ...

2014-05-16 14:42
浏览 1601
评论(0)
分类:移动开发
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Python+Spark 2.0+Hadoop机器学习与大数据: 6. 实战案例，展示如何将Python、Spark和Hadoop整合在一起，解决实际的大数据问题，如推荐系统、预测分析等。 7. 如何通过Hadoop和Spark进行数据ETL（提取、转换、加载）操作，构建数据流水线。 8. 高级主题，如...

Python+Spark+Hadoop大数据基于用户画像电影推荐系统毕业源码 - 副本.zip: 标题中的“Python+Spark+Hadoop大数据基于用户画像电影推荐系统毕业源码”指的是一个使用Python、Apache Spark和Apache Hadoop构建的大数据处理项目，旨在实现一个基于用户画像的电影推荐系统。这个系统可能利用大...

毕业设计基于Python+Spark+Hadoop大数据开发的用户画像电影推荐系统源码+数据库: 毕业设计基于Python+Spark+Hadoop大数据开发的用户画像电影推荐系统源码+数据库，含有代码注释，新手也可看懂，个人手打98分项目，导师非常认可的高分毕业设计项目，毕业设计、期末大作业和课程设计高分必看，下载...

Python+Spark+Hadoop大数据基于用户画像电影推荐系统设计+sql数据库（高分毕设）: Python+Spark+Hadoop大数据基于用户画像电影推荐系统设计+sql数据库（高分毕设），含有代码注释，新手也可看懂，个人手打98分项目，导师非常认可的高分项目，毕业设计、期末大作业和课程设计高分必看，下载下来，...

Python+Spark+Hadoop实现的大数据基于用户画像电影推荐系统代码+数据库+使用说明（毕业设计）: Python+Spark+Hadoop实现的大数据基于用户画像电影推荐系统代码+数据库+使用说明（毕业设计），含有代码注释，新手也可看懂，个人手打98分项目，导师非常认可的高分项目，毕业设计、期末大作业和课程设计高分必看，...

Spark+hadoop+scala 完全分布式集群搭建过程及启动过程: 对于想学习 Spark 的人而言，如何构建 Spark 集群是其最大的难点之一，为了解决大家构建 Spark 集群的一切困难，Spark 集群的构建分为了五个步骤，从零起步，不需要任何前置知识，涵盖操作的每一个细节，构建完整...

《Python+Spark2.0+Hadoop机器学习与大数据实战》练习.zip: 《Python+Spark2.0+Hadoop机器学习与大数据实战》是一本深入探讨大数据处理和机器学习技术的书籍。在本书的练习部分，作者通过实际案例帮助读者掌握Python、Spark 2.0以及Hadoop的核心概念和技术。这些技术是当前大...

Python+Spark+Hadoop大数据基于用户画像电影推荐系统设计: 本系统是以Django作为基础框架，采用MTV模式，数据库使用MySQL和Redis，以从豆瓣平台爬取的电影数据作为基础数据源，主要基于用户的基本信息和使用操作记录等行为信息来开发用户标签，并使用Hadoop、Spark大数据...

毕业设计，基于Python+Spark+Hadoop大数据开发的用户画像电影推荐系统，内含Python完整源代码，数据库脚本: 毕业设计，基于Python+Spark+Hadoop大数据开发的用户画像电影推荐系统，内含Python完整源代码，数据库脚本 Python+Spark+Hadoop大数据基于用户画像电影推荐系统设计程序开发软件： Pycharm + Python3.7 + Django...

spark+hadoop+kafka+zookeeper 大数据平台搭建脚本: spark+hadoop+zookeeper 大数据平台搭建脚本，亲测通过，适用于大数据初学者在虚拟机玩

Hadoop+Spark+Hive+HBase+Oozie+Kafka+Flume+Flink+ES+Redash等详细安装部署: 在大数据领域，构建一个完整的生态系统是至关重要的，其中包括多个组件，如Hadoop、Spark、Hive、HBase、Oozie、Kafka、Flume、Flink、Elasticsearch和Redash。这些组件协同工作，提供了数据存储、处理、调度、流...

集群环境搭建-Centos+kafka+zookeeper+hadoop+Spark: 通过VirtualBox安装多台虚拟机，实现集群环境搭建。优势：一台电脑即可。应用场景：测试，学习。...内附百度网盘下载地址，有hadoop+zookeeper+spark+kafka等等·····需要的安装包和配置文件

spark+hadoop大数据处理学习笔记: spark+hadoop大数据处理学习笔记

centOS 6.10 hadoop+spark+hive+HBase集群搭建: hadoop+spark+hive Linux centos大数据集群搭建，简单易懂，从0到1搭建大数据集群

Spark+Hadoop+IDE环境搭建: 在大数据处理领域，Spark和Hadoop是两个至关重要的框架。Spark以其高效的内存计算和易用性，成为数据处理的新宠，而Hadoop作为分布式存储和计算的基础，为大数据提供了基石。本文将详细介绍如何在IDE环境下搭建Spark...

Python+Spark+Hadoop实现的大数据基于用户画像电影推荐系统+源代码+文档说明+sql文件.zip: 本系统是以Django作为基础框架，采用MTV模式，数据库使用MySQL和Redis，以从豆瓣平台爬取的电影数据作为基础数据源，主要基于用户的基本信息和使用操作记录等行为信息来开发用户标签，并使用Hadoop、Spark大数据组件...

hadoop伪分布式搭建centos6.5+hadoop2.7: 在VMware虚拟机上，安装hadoop集群，采用的是伪分布式搭建，从安装jdk到hadoop的环境配置，全套都有，依据这个文档可以在个人Vmware上搭建自己的hadoop集群，这个集群有一个主节点，两个从节点。按照这个文档搭建后...

Spark3+Clickhouse+Hadoop大数据实战课程.rar: 分享课程-Spark3+Clickhouse+Hadoop大数据实战课程。本课程采用项目驱动的方式，以Spark3和Clickhouse技术为突破口，带领学员快速入门Spark3+Clickhouse数据分析，促使学员成为一名高效且优秀的大数据分析人才。

Global site tag (gtag.js) - Google Analytics