最新文章列表

Hadoop vs. Spark: The New Age of Big Data

Hadoop vs. Spark: The New Age of Big Data Posted February 5, 2016 By Ken Hess In the question of Hadoop vs. Spark, the most accurate view is that designers intended Hadoop and Spark to work together ...
Lixh1986 评论(0) 有526人浏览 2016-09-20 11:17

oracle 大数量删除

ORACLE采用的是不完全B+树,就是在删除时不进行再平衡。就是说,大量修改和删除后,性能会下降,有时会错,必须经常修理索引。目前采用完全b+树的数据库只有INFORMIX。他们都担心删除时平衡会影响效率。实际上完全多虑了,INFORMIX按索引删除,比其他数据库快得多。   在经过大数据删除后,执行select pk from table where pk < 1亿之类的语句后,即使没 ...
lyp2002924 评论(0) 有750人浏览 2015-09-15 17:51

hadoop 大数据笔记

  1、问题1   localhost: starting namenode, logging to /usr/local/hadoop/logs/hadoop-hadoop-na menode-ubuntu-1.ou ...
zhb8015 评论(0) 有557人浏览 2015-06-19 17:48

Spark学习笔记

以下是读Learning Spark Lightning-Fast Big Data Analysis时做的翻译或笔记 持续更新...(先开个头,以后有没有时间再说...) 1.数据分析工具Spark介绍 2.下载Spark并尝试使用 7.在集群中运行Spark (用sbt打包Spark应用)    使用机器环境:    操作系统:Windows7     scala:2.11.4     ...
天朗java 评论(0) 有1331人浏览 2015-04-02 14:08

大数据【big data 4v】

大数据技术(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中[2] 大数据指不用随机分析法(
老糊涂 评论(0) 有1219人浏览 2014-11-23 18:02

Sqoop安装过程详解

Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。   Sqoop官方版本:http://apache.dataguru.cn/sqoop/1.4.2/ Sqoop CDH版本:http://archive ...
zhb8015 评论(0) 有902人浏览 2014-05-19 11:02

Sqoop--Hadoop和关系型数据库中的数据相互转移的工具

Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。 Sqoop官方版本:http://apache.dataguru.cn/sqoop/1.4.2/ Sqoop CDH版本:http://archive.cl ...
zhb8015 评论(0) 有1570人浏览 2014-05-19 10:42

一起研究haoop(二):Java代码操作HDFS

在此就不详细介绍HDFS是啥东西了,你只要问问google大神或度娘就一清二楚了。 在此我主要用java代码实现对HDFS的增、删、查操作。   由于本工程是用Maven管理的,则pom文件如下: <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org ...
芝加哥09 评论(0) 有2318人浏览 2014-03-26 23:01

最短路径Mapreduce实现

  ¢A map task receives lKey: node n lValue: D (distance from start); points-to (list of nodes reachable from n) ¢p \in  points-to: emit (p, D+1) ¢The reduce task gathers possible distances ...
luweimstr 评论(0) 有2476人浏览 2013-01-17 15:10

Pentaho 资料

1.Pentaho Big Data BI Knowledage @ http://wiki.pentaho.com/display/BAD/How+To%27s Hadoop Loading Data into a Hadoop Cluster — How to load data into HDFS (Hadoop's Distributed File System), Hive a ...
jason204 评论(1) 有2156人浏览 2013-01-16 11:19

大数据行业应用趋势

大数据的来源及使用 当前,数据如洪流般涌入全球经济的各个领域,全世界每天产生多达2.5PB的数据——数据积累的速度如此之快,以至于目前全世界90 ...
Seraph115 评论(0) 有1814人浏览 2012-06-25 07:04

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics