- 浏览: 1782 次
- 性别:
- 来自: 北京
最新评论
文章列表
public static void GetSingleUrl(String content)
{
String strPattern = "<img(?:.*)src=(\"{1}|\'{1})([^\\[^>]+[gif|jpg|jpeg|bmp|bmp]*)(\"{1}|\'{1})(?:.*)/>";
Pattern p=Pattern.compile(strPattern);
Matcher m=p.matcher(content);
int j=0;
...
hadoop学习顺序
第一 先会配置安装一个HD 10分钟
第二 会用HDFS的API
第三 会用已有MR 写一个Job 一个Job除了有提交方法外 其他都是Configuration决定的
第四 会重写多数的类达到你的功能 RecordWriter/Reader FileInput/OutPutFormat MapReduce 搞懂他们的启动顺序 以及实现抽象类和接口的必要方法 和它们的作用
第五 重新配置安装HD 这次你需要做HA 多集群一大堆的东西
第六 搞懂Configuration XML里至少80%条目的意义
第七 学基本的Pig Hive并且查看他们的源码怎么调用MR的
第八 看M ...