本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
zysnba - xiangjie88
- sgqt
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wallimn
- wy_19921005
- vipbooks
- benladeng5225
- 龙儿筝
- javashop
- ranbuijj
- fantaxy025025
- zw7534313
- qepwqnp
- e_e
- 解宜然
- zysnba
- ssydxa219
- sam123456gz
- sichunli_030
- arpenker
- tanling8334
- kaizi1992
- xpenxpen
- gaojingsong
- jh108020
- wiseboyloves
- xiangjie88
- ganxueyun
- xyuma
- wangchen.ily
- lemonhandsome
- jbosscn
- mengjichen
- zxq_2017
- luxurioust
- lzyfn123
- forestqqqq
- nychen2000
- Xeden
- zhanjia
- wjianwei666
- ajinn
- hanbaohong
- 喧嚣求静
- jickcai
- kingwell.leng
- mwhgJava
- silverend
- lich0079
- lchb139128
最新文章列表
Ubuntu16.04 下 hadoop的安装与配置(伪分布式环境)
一、准备
1.1创建hadoop用户
$ sudo useradd -m hadoop -s /bin/bash #创建hadoop用户,并使用/bin/bash作为shell
$ sudo passwd hadoop #为hadoop用户设置密码,之后需要连续输入两次密码
$ sudo adduser hadoop sudo ...
自定义DBInputFormat,抽取mysql表存储在分库中
前言:
mysql a表是按照分库存储的,现在需要抽取到hdfs中
实现点:
1 自定义DBInputFormat,将表对应的分库重新创建conn连接,然后切片
2 在mapper类中自定义切片后的接收数据的接收类
3 在mapper中得到数据写出去
sqoop.properties文件如下:
driverName=com.mysql.jdbc.Dri ...
279.11G 大数据学习资料分享
上篇文章分享的是 Hadoop 学习资料,还没看见的同学,点击这里查看->大数据之 Hadoop 学习教程分享
为什么是 279.11G ?
小编本来打算分开分享的,想了下太麻烦了,还是一次性分享的比较好,所以看了下整理的大数据资料,除了电子版外,总共 279.11G,所以后面很长一段时间会不考虑分享大数据资料,需要的同学抓紧了。
总共是几份教程呢?
...
spark 集群环境搭建
需要的环境:
1.java1.8
2.hadoop-3.1.1(spark用到他的hdfs)
3.zookeeper-3.4.11(spark自动转移master用)
4.spark-2.3.1-bin-without-hadoop
三台服务器主机分别是
host-01
host-02
host-03
关键配置:
hadoop
hadoop/hadoop-3.1 ...
hadoop UnsupportedFileSystemException 问题
使用hdfs操作文件的时候遇到以下两个异常:
1.java.io.IOException: No FileSystem for scheme: hdfs
2.org.apache.hadoop.fs.UnsupportedFileSystemException: No FileSystem for scheme "file"
类似No FileSystem for ...
学习Hadoop权威指南之Hadoop运行MapReduce日志查看
修改map配置文件 mapred-site.xml
[root@bigdata yar]# vim /opt/hadoop-2.8.3/etc/hadoop/mapred-site.xml
<property>
<name>mapreduce.jobhistory.address </name>
<value>bigdat ...
学习Hadoop权威指南之MapReducer气象数据分析
气象数据集
关于MapReduce MapReduce是一种可用于数据处理的编程模型,它本质上是并行运行的,因此可以将大规模的数据分析任务分发给任何一个拥有足够多机器的数据中心。MapReduce的优势在于处理大规模数据集,这里我们先看一个数据集。我们今天的目的是:在大批量的气象数据中,获取每年每月的最高气温。
数据格式 我们使用的数据来自于权威指南提供的美国国家气候数据中心,该 ...
大数据视频教程|零基础大数据就业课程(零到大神一“部”之遥)
零基础大数据就业课程(零到大神一“部”之遥)
网盘地址:https://pan.baidu.com/s/1kFzS3h0GxN1mwwI6dAhgGw 密码: g2vd
备用地址(腾讯微云):https://share.weiyun.com/52QfmKi 密码:njwgdd
课程分2大模块,14个课程,65章,共计856课时!
一、Java模块课程
课程一、【大数据必知必会】- Java负基础 ...
Hadoop2.7.3单机伪分布
1. 官网:http://hadoop.apache.org/
2. 下载版本hadoop 2.7.3(http://hadoop.apache.org/releases.html)
3. 预准备环境:
a. Centos7
b. Java8
4. 创建目录 software :mkdir /software
5. 上传hadoop到software
6. tar -xvf had ...
基于Hadoop离线大数据分析平台项目实战
基于Hadoop离线大数据分析平台项目实战
网盘地址:https://pan.baidu.com/s/13vOi8WphetCiRtHhOCUdGg 密码: kt99
备用地址(腾讯微云):https://share.weiyun.com/5wdYJSk 密码:jjmx9p
课程简介:
某购物电商网站数据分析平台,分为收集数据、数据分析和数据展示三大层面。其中数据分析主要依据大数据Hadoop生态 ...
Hadoop几个常见类的作用
1、自定义bean中的CopmareTo()
public class KeyPair implements WritableComparable<KeyPair> {
private int year;
private int hot;
@Override
/**
* 定义CopmareTo()是在溢出和merge时用来来排序的
*/
public int compa ...