处理hadoop发送的文件到后台并解析存储到数据库策略

knight_black_bob

浏览: 872689 次
性别:
来自: 北京

最近访客更多访客>>

bian1024

lli

cqh520llr

hxgdragon

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

java

文件解析存储数据库 hadoop

处理hadoop发送的文件到后台并解析存储到数据库策略

主要实现：首先 hadoop mapreduce 处理好的文件，一个个放到指定的文件目录下，然后通过在Linux 下通过定时任务打包发到 web 服务器的指定目录下，然后web 服务器会通过定时任务去解析它，然后，存储导数据库。

1.上篇介绍了文件的解压，通过解压后文件会形成多个文件。

如图，解压后，我们会发现有很多文件，然后我们该去对每个文件读取内容并存到数据库中。

2. map 为所有文件解析类

dataMap 所有数据类所有文件的数据都存储到datamap 中了

for (File subfile : subFiles){
	AbstractFileParser ifp = map.get(subfile.getName());
	if (ifp != null) {
		try {
			ifp = ifp.getClass().newInstance();
			ifp.init(subfile, (StatMap) dataMap.get(subfile.getName()));
			jobList.add(ifp);
			ifp.start();
		} catch (Exception e) { e.printStackTrace(); }
	}
}
for (Thread ifp : jobList)
{
	try {
		ifp.join();
	} catch (InterruptedException e) { e.printStackTrace(); }
}

AbstractFileParser 类

BufferedReader bufferedReader = null;
try
{
	bufferedReader = new BufferedReader(new FileReader(this.file));
	String s = null;
	while ((s = bufferedReader.readLine()) != null)
	{
		if (isDebug || logger.isDebugEnabled())
			logger.debug(s);
		String[] ss = s.split(",");
		StatBase o = parseLine(ss);
		if (o != null)
		{
			StatBase b = null;
			synchronized (map)
			{
				b = map.get(o.getPrivateKey());
				if (b == null)
				{
					map.put(o.getPrivateKey(), o);
				}
				else
				{
					update(o, b);
				}
			}
		}
	}
}
catch (Exception e)
{
	logger.error("", e);
}
finally
{
	if (bufferedReader != null)
		try
		{
			bufferedReader.close();
		}
		catch (IOException e)
		{
		}
}

保存到 datamap 中的数据要进行数据库保存

捐助开发者

在兴趣的驱动下,写一个免费的东西，有欣喜，也还有汗水，希望你喜欢我的作品，同时也能支持一下。当然，有钱捧个钱场（右上角的爱心标志，支持支付宝和PayPal捐助），没钱捧个人场，谢谢各位。

谢谢您的赞助，我会做的更好！

0
顶

0
踩

分享到：

netty 实例入门 | 文件解压，文件/目录更名，文件/目录删除 ...

2015-05-01 17:35
浏览 1248
评论(0)
分类:企业架构
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

处理hadoop发送的文件到后台并解析存储到数据库策略

捐助开发者

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

处理hadoop发送的文件到后台并解析存储到数据库策略

捐助开发者

评论

发表评论

相关推荐

java maen jdk1.7 打包不存在类，rt 中存在 问题解决

nexus 3.0 配置

linux 日志kafka 写mongodb

手写 基础 数据库连接池

特定用户部署 tomcat

最小栈 三种实现（面试...）

java 代码混淆 proguard exception

手写 reactor( netty reactor 模型)

NoSuchMethodError: javax.servlet.ServletContext.getVirtualServerName()Ljava/lang

手写 dubbo

okhttp 使用 post

ReentrantLock,Condition

join

Collections,Synchronized

Semaphore

ExecutorService

CyclicBarrier

Callable 与 Future

遍历 jdk1.7 jdk1.8 异同点

手写 tomcat (nio)

最近访客更多访客>>

java maen jdk1.7 打包不存在类，rt 中存在问题解决

手写基础数据库连接池

最小栈三种实现（面试...）