cassandra:The.Definitive.Guide

博客分类：

nosql

Cassandra

cassandra的书籍，可以看看。

2011-03-02 13:15
浏览 901
评论(0)
分类:编程语言

海量数据处理相关资料

博客分类：

hadoop

逖靖寒的世界：http://gpcuster.cnblogs.com/

2011-03-01 18:16
浏览 896
评论(0)
分类:非技术

shell数组

博客分类：

linux

PHP C C++C#Bash

Bash中还可以使用数组变量,其赋值有两种:(1) name = (value1 ... valuen) 此时下标从0开始(2) name[index] = value数组下标的范围没有任何限制,同时也不必使用连续的分量. $ A=(a b c def)==================================================$ echo ${A[@]} ...

2011-02-10 18:06
浏览 897
评论(0)
分类:操作系统

linux crontab命令详解

博客分类：

linux

Linux lighttpd Apache C C++

本文介绍了linux下cron（任务计划）的常用使用方法。 linux crontab 的格式基本格式 :*　　*　　*　　*　　*　　command分　时　日　月　周　命令第1列表示分钟1～59 每分钟用*或者 */1表示第2列表示小时1～23（0表示0点）第3列表示日期1～31第4列表示月份1～12第5列标识号星期0～6（0表示星期天）第6列要运行的命令crontab文件的一些例子：30 21 * * * /usr/local/etc/rc.d/lighttpd restart上面的例子表示每晚的21:30重启apache。45 4 1,10,22 * * /usr/local/etc/r ...

2011-01-21 11:29
浏览 837
评论(0)
分类:操作系统

shell下读文件方式

博客分类：

linux

翻译别人的东西: 第一种： cat $FILENAME | while read LINEdo echo "$LINE" :done第二种： while read LINEdo echo "$LINE" :done < $FILENAME第三种： while line LINEdo echo $LINE :done < $FILENAME第四种： cat $FILENAME | while LINE=`line`do echo ...

2011-01-21 10:51
浏览 1027
评论(0)
分类:操作系统

shell 交集、并集、差集

博客分类：

linux

2011-01-20 14:57
浏览 2518
评论(0)
分类:操作系统

hiveQL 优化

博客分类：

hive

Mapreduce hive

1.当hive执行join内存溢出时，可以修改hive的配置文件hive-site.xml，增大内存，如下： mapred.child.java.opts -Xmx 1024m 2.hive默认建表时的路径也可以在hive-site.xml里配置，如下: hive.metastore.warehouse.dir value >/user/hive/warehouse description >location of default database for the warehouse 3.执行join操作的时候，尽量把小表放前面，大表放前面可能会因为内存溢出而出错 4.对 ...

2011-01-13 20:52
浏览 1860
评论(0)
分类:编程语言

hive深入资料

博客分类：

hive

Hadoop Apache

hive wiki： http://wiki.apache.org/hadoop/Hive/LanguageManual hive 优化： http://www.chinacloud.cn/show.aspx?id=3277&cid=12 http://wiki.apache.org/hadoop/Hive/HiveClient3 http://www.fuzhijie.me/?tag=hive http://www.tech126.com/category/hadoop-2/page/2/

2011-01-13 20:01
浏览 1083
评论(0)
分类:编程语言

hive 相关

博客分类：

hive

MySQL Hadoop SQL JDBC Java

Hive使用MySQL存放元数据可以参考一下这篇文章 http://www.mazsoft.com/blog/post/2010/02/01/Setting-up-HadoopHive-to-use-MySQL-as-metastore.aspx 别忘了下载 MySQL 的JDBC驱动，推荐下载 mysql-connector-java-5.1.11.tar.gz Hive 与 JDBC 导入hive\lib下的所有jar包到IDE的classpath里面，还有hadoop中的 hadoop-0.20.2-core.jar包，即可运行下列代码： package c ...

2011-01-10 17:36
浏览 1158
评论(0)
分类:编程语言

Hadoop中常出现的错误以及解决方法

博客分类：

hadoop

Hadoop JVM Security SSH

1：Shuffle Error: Exceeded MAX_FAILED_UNIQUE_FETCHES; bailing-out Answer：程序里面需要打开多个文件，进行分析，系统一般默认数量是1024，（用ulimit -a可以看到）对于正常使用是够了，但是对于程序来讲，就太少了。修改办法：修改2个文件。 /etc/security/limits.conf vi /etc/security/limits.conf 加上： * soft nofile 102400 * hard nofile 409600 $cd /etc/pam.d/ $sudo vi login 添加 sessio ...

2011-01-10 16:25
浏览 953
评论(0)
分类:编程语言

基于Hive的日志数据统计实战

博客分类：

hive

数据结构 Hadoop XML 正则表达式 Apache

一、Hive简介Hive 是一个基于 hadoop 的开源数据仓库工具，用于存储和处理海量结构化数据。它把海量数据存储于 hadoop 文件系统，而不是数据库，但提供了一套类数据库的数据存储和处理机制，并采用 HQL （类 SQL ）语言对这些数据进行自动化管理和处理。我们可以把 hive 中海量结构化数据看成一个个的表，而实际上这些数据是分布式存储在 HDFS 中的。 Hive 经过对语句进行解析和转换，最终生成一系列基于 hadoop 的 map/reduce 任务，通过执行这些任务完成数据处理。Hive 诞生于 facebook 的日志分析需求，面对海量的结构化数据， hive ...

2011-01-10 11:47
浏览 1677
评论(0)
分类:编程语言

HBase的安装、配置、管理与编程

博客分类：

nosql

配置管理 HBase 编程 Hadoop SuSE

环境准备需要环境：PC-1 Suse Linux 9 10.192.1.1PC-2 Suse Linux 9 10.192.1.2PC-3 Suse Linux 9 10.192.1.3PC-4 Suse Linux 9 10.192.1.4其中，PC-1做namenode节点，PC-2、PC-3和PC-4做datanode节点。并且已经安装成功Hadoop-0.20.1及以上版本。安装包准备需要安装包：zookeeper-3.2.1.tar.gz（stable版本）hbase-0.20.1.tar.gz（stable版本）安装步骤安装和配置ZooKeeperHBase从0.20.0开始 ...

2011-01-10 11:39
浏览 1216
评论(0)
分类:编程语言

Hbase配置和开发中的几个注意事项

博客分类：

nosql

HBase Eclipse Hadoop XML

在配置Hadoop和Hbase的过程中，虽然官方网站上有很多丰富的文档，但是常常仍然会有一些细枝末节的问题，成为阻碍项目配置成功以及后续开发的绊脚石。下面就记录几个Hbase配置以及开发过程中需要注意的事项： (1)修改节点主机名的问题在配置文件中使用机器主机名（如WAMDM1）作为通讯方式的时候，需要修改2个文件：/etc/hosts 以及 /etc/hostname (2)修改Classpath的文件如果要修改Java默认Classpath，可以修改如下文件：/etc/environment ，修改完以后，需要重启生效 (3)配置Hbase开发项目时，如何导入Hbase的配置文件 hb ...

2011-01-10 11:23
浏览 1177
评论(0)
分类:编程语言

SSH资料

SSH Blog HTML

http://blog.sina.com.cn/s/blog_3c6ecea90100cn3s.html

2010-12-30 12:50
浏览 889
评论(0)
分类:企业架构

Linux内核及驱动编程-揭开Linux Proc文件系统的神秘面纱

博客分类：

linux

Linux 编程数据结构虚拟机 .net

【摘要】本文介绍了Linux proc文件系统的一些细节。首先介绍了proc文件系统的基本概念/存储位置/读取时机/加载方式，接着介绍了如何利用proc文件系统读取系统/内核中的各种信息以及进程相关的各种信息，分析了各个文件的作用 ...

2010-10-12 10:43
浏览 4393
评论(0)
分类:操作系统

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

cassandra:The.Definitive.Guide

海量数据处理相关资料

shell数组

linux crontab命令详解

shell下读文件方式

shell 交集、并集、差集

hiveQL 优化

hive深入资料

hive 相关

Hadoop中常出现的错误以及解决方法

基于Hive的日志数据统计实战

HBase的安装、配置、管理与编程

Hbase配置和开发中的几个注意事项

SSH资料

Linux内核及驱动编程-揭开Linux Proc文件系统的神秘面纱

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>