最新文章列表

大数据开发都需要什么技术?

     大数据是对海量数据存储、计算、统计、分析等一系列处理手段,处理的数据量是TB级,甚至是PB或EB级的数据,是传统数据处理手段无法完成 ...
mo默瑶 评论(0) 有320人浏览 2018-04-03 17:17

大数据开发都需要什么技术?

     大数据是对海量数据存储、计算、统计、分析等一系列处理手段,处理的数据量是TB级,甚至是PB或EB级的数据,是传统数据处理手段无法完成 ...
mo默芯 评论(0) 有381人浏览 2018-04-03 17:10

大数据开发都需要什么技术?

     大数据是对海量数据存储、计算、统计、分析等一系列处理手段,处理的数据量是TB级,甚至是PB或EB级的数据,是传统数据处理手段无法完成的,大数据涉及分布式计算、高并发处理、高可用处理、集群、实时性计算等等,汇集的是IT最热门、最流行的IT技术,大数据是机器学习、深度学习、AI等尖端可以领域的基础架构。     大数据技术为决策提供依据,在政府、企业、科研项目等决策中扮演着重要的角色, ...
mo默羽 评论(0) 有361人浏览 2018-04-03 16:52

浅聊Spark的应用场景有哪些?

     Spark 是一种与 Hadoop 相似的开源集群计算环境,是专为大规模数据处理而设计的快速通用的计算引擎,现已形成一个高速发展应用广泛的生态 ...
mo默羽 评论(0) 有521人浏览 2018-04-03 16:48

Linux搭建Hadoop开发环境

 Linux搭建Hadoop开发环境 Hadoop环境搭建安装配置: [1].官网下载Hadoop-2.7.5安装包: hadoop-2.7.5/hadoop-2.7.5.tar.gz [2].把Hadoop-2.7.5安装包利用Xftp5工具上传到:/usr/local/hadoop [3].登录Liunx服务器,利用Xhell5进入:cd ...
马智霖 评论(0) 有483人浏览 2018-03-31 01:47

YARN

1. 什么是YARN Yet Another Resource Negotiator(另一种资源协调者),是一种新的Hadoop资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度。 2. YARN架构 ResurceManager(RM):一个纯粹的调度器,专门负责集群中可用资源的分配和管理。 Container :分配给具体应用的资源抽象表现形式, ...
xujieyang4j 评论(0) 有921人浏览 2018-03-29 12:05

海量数据处理常用方法有哪些?

  处理海量数据是大数据工程师必备技能,通过对PB级别的数据进行挖掘与分析发掘出有价值的信息,为企业或政府做出正确决策提供依据,是十分必要 ...
mo默羽 评论(0) 有580人浏览 2018-03-23 18:59

Hadoop之HDFS分布式文件系统具有哪些优点?

  随着互联网数据规模的不断增大,对文件存储系统提出了更高的要求,需要更大的容量、更好的性能以及更高安全性的文件存储系统,与传统分布式文件系统一样,HDFS分布式文件系统也是通过计算机网络与节点相连,但也有优于传统分布式文件系统的优点。   1. 支持超大文件   HDFS分布式文件系统具有很大的数据集,可以存储TB或PB级别的超大数据文件,能够提供比较高的数据传输带宽与数据访问吞吐量,相应 ...
mo默羽 评论(0) 有505人浏览 2018-03-23 18:46

Hadoop中HDFS优点有哪些?

随着互联网数据规模的不断增大,对文件存储系统提出了更高的要求,需要更大的容量、更好的性能以及更高安全性的文件存储系统,与传统分布式文 ...
lnh2017 评论(0) 有29人浏览 2018-03-23 14:12

ambari删除脚本 重新安装

#1.删除hdp.repo和hdp-util.repocd /etc/yum.repos.d/rm -rf hdp*rm -rf HDP*#rm -rf ambari*#2.删除安装包#用yum list installed | grep HDP来检查安装的ambari的包yum remove -y  sqoop.noarch  yum remove -y  lzo-devel.x86_64  yu ...
jxdiamond 评论(0) 有493人浏览 2018-03-21 14:50

hadoop lzo压缩

1.安装: (1)安装依赖: yum -y install lzo-devel zlib-devel gcc autoconf automake libtool   (2)安装maven wget http://mirrors.hust.edu.cn/apache/maven/maven-3/3.5.3/binaries/apache-maven-3.5.3-bin.tar.gz ...
功夫小当家 评论(0) 有1130人浏览 2018-03-14 15:13

学习hadoop大数据基础框架需要什么基础

什么是大数据?进入本世纪以来,尤其是2010年之后,随着互联网特别是移动互联网的发展,数据的增长呈爆炸趋势,已经很难估计全世界的电子设备中存储的数据到底有多少,描述数据系统的数据量的计量单位从MB(1MB大约等于一百万字节)、GB(1024MB)、TB(1024GB),一直向上攀升,目前,PB(等于1024TB)级的数据系统已经很常见,随着移动个人数据、社交网站、科学计算、证券交易、网站日志、传感 ...
adnb34g 评论(0) 有357人浏览 2018-03-14 14:57

hadoop需要哪些技术支持

hadoop是一个开源软件框架,可安装在一个商用机器集群中,使机器可彼此通信并协同工作,以高度分布式的方式共同存储和处理大量数据。最初,Hadoop 包含以下两个主要组件:Hadoop Distributed File System (HDFS) 和一个分布式计算引擎,该引擎支持以 MapReduce 作业的形式实现和运行程序。 Hadoop 还提供了软件基础架构,以一系列 map 和 redu ...
adnb34g 评论(0) 有397人浏览 2018-03-13 11:23

以慕课网日志分析为例-进入大数据Spark SQL的世界

以慕课网日志分析为例-进入大数据Spark SQL的世界 网盘地址:https://pan.baidu.com/s/1hxBE-6TxANmllIEUIKiBBg 密码: 9xjn 备用地址(腾讯微云):https://share.weiyun.com/9dc17475243b07ad04890fe055a28161 密码:cntj2k 第1章 初探大数据 本章将介绍为什么要学习大数据、如何 ...
普通用户名 评论(0) 有2761人浏览 2018-03-13 09:37

hadoop行业技术创新解决方案

如今有很多公司都在努力挖掘他们拥有的大量数据,包括结构化、非结构化、半结构化以及二进制数据等,来探索对数据的深入利用。 大多数公司估计他们只分析了已有数据的12%,剩余88%还没有被充分利用。大量的数据孤岛和分析能力的缺乏是造成这种局面的主要原因。另外一个难题是如何判断数据是否有价值。尤其是在大数据时代,为了避免数据丢失你必须采集并存储这些数据。一些看起来与业务无关的数据,如手机GPS数据,将来 ...
adnb34g 评论(0) 有439人浏览 2018-03-12 13:53

数据分析师、Hadoop开发工程师、算法工程师的薪水到底怎么样?

数据分析师、Hadoop开发工程师、算法工程师的薪水到底怎么样? 据最新发布的《大数据人才报告》显示,目前全国的大数据人才仅46万,未来3-5年内大数据人才的缺口将高达150万。 领英报告表明,数据分析人才的供给指数最低,仅为0.05,属于高度稀缺。数据分析人才跳槽速度也最快,平均跳槽速度为19.8个月。 根据中国商业联合会数据分析专业委员会统计,未来中国基础性数据分析人才缺口将达到1400万, ...
JAVA高级架构 评论(0) 有927人浏览 2018-03-10 17:21

离线分析系统开发(数据埋点开发)

课程学习地址:http://www.xuetuwuyou.com/course/228 课程出自学途无忧网:http://www.xuetuwuyou.com 讲师:西瓜老师 课程目录: 第1讲、需求分析 第2讲、网站演示 第3讲、技术选型的分析 第4讲、技术选型的补充 第5讲、项目整体架构 第6讲、项目的三层架构 第7讲、前端JSSDK流程 第8讲、JSSDK事件类型 第9讲、Nginx安装 ...
haoxuexi87 评论(0) 有1907人浏览 2018-02-28 15:26

38套大数据,云计算,架构,数据分析师,Hadoop,Spark,Storm,Kafka,人工智能,机器学习,深度学习,项目实战视频教程

38套大数据,云计算,架构,数据分析师,Hadoop,Spark,Storm,Kafka,人工智能,机器学习,深度学习,项目实战视频教程 视频课程包含:   38套大数据和人工智能精品高级课包含:大数据,云计算,架构,数据挖掘实战,实时推荐系统实战,电视收视率项目实战,实时流统计项目实战,离线电商分析项目实战,Spark大型项目实战用户分析,智能客户系统项目实战,
shkygy5662792 评论(0) 有2人浏览 2018-02-18 13:00

各种技术视频

spring视频回复: 1001 java视频回复: 1002 php视频回复: 1003  无 redis视频回复: 1004 vue视频回复: 1005 nginx视频回复:1006 dubbo视频回复: 1007 spring cloud视频回复: 1008 spring boot视频回复: 1009 mongodb视频回复:1010 maven视频回复:1011 mysql视频回复:1012 ...
huangjinjin520 评论(0) 有511人浏览 2018-02-09 21:39

Spark分布式环境搭建

参考链接1:https://www.cnblogs.com/purstar/p/6293605.html 参考链接2:http://blog.csdn.net/xiaoxiangzi222/article/details/52757168 一、spark集群搭建 这里介绍spark的集群安装,需要依赖于hadoop的集群 所以,首先搭建了一个hadoop集群,1个master,2个sla ...
elfasd 评论(0) 有1042人浏览 2018-02-09 14:30

最近博客热门TAG

Apache(33928) Lucene(5053) Hadoop(5049) nginx(3449) vim(3262) GCC(2954) memcached(2625) jfreechart(1688) Django(1602) Zend(1413) ActiveMQ(1398) Grails(1374) ActiveRecord(1349) OpenSource(1236) Emacs(870) Glassfish(858) lighttpd(810) rubygems(716) GAE(631) Blend(516)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics