storm高并发PV统计 -

javafu

浏览: 58255 次
性别:
来自: 北京

最近访客更多访客>>

zyi74

w11h22j33

vliu

siemens800

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

storm高并发PV统计

博客分类：

Strom

一、PV统计思考
方案需要考虑分析多线程下，注意线程安全问题。
线程安全：多线程处理的结果和单线程一致

如下是否可行？
不可行方案：
定义static long pv， Synchronized 控制累计操作。Synchronized 和 Lock在单个JVM下有效，但在多JVM下无效。

可行方案两个方案：
1、shuffleGrouping下，pv * Executer并发数
2、bolt1进行多并发局部汇总，bolt2单线程进行全局汇总

二、实现
注意：多线程下每一个bolt中的execute方法都会执行多次，类似一个while循环。

1、bolt1进行多并发(局部)汇总处理类

public class PVBolt1 implements IRichBolt{

	/**
	 * bolt1进行多并发(局部)汇总
	 */
	OutputCollector collector = null;
	private static final long serialVersionUID = 1L;
	public void prepare(Map stormConf, TopologyContext context, OutputCollector collector) {
		this.collector = collector;
	}
	
	
	String logString;
	String session_id;
	long pv = 0;
	public void execute(Tuple input) {
		logString = input.getString(0);
		session_id = logString.split("\t")[1];
		if(session_id !=null){
			pv ++;
		}
		
		 collector.emit(new Values(Thread.currentThread().getId(),pv));
		 System.err.println("threadId = "+ Thread.currentThread().getId()+"; pv="+pv);
	}

	public void cleanup() {
		// TODO Auto-generated method stub
		
	}

	public void declareOutputFields(OutputFieldsDeclarer declarer) {
		declarer.declare(new Fields("threadId", "count"));
		
	}

	public Map<String, Object> getComponentConfiguration() {
		// TODO Auto-generated method stub
		return null;
	}

}

2、bolt2单线程进行全局汇总处理类

public class PVBolt2 implements IRichBolt{

	/**
	 * bolt2单线程进行全局汇总
	 */
	private static final long serialVersionUID = 1L;
	public void prepare(Map stormConf, TopologyContext context, OutputCollector collector) {
		// TODO Auto-generated method stub
		
	}
	
	Map<Long,Long>counts = new HashMap<Long,Long>();
	
	public void execute(Tuple input) {
		Long thread_id = input.getLong(0);
		Long pv = input.getLong(1);
		counts.put(thread_id,pv);
		System.err.println("  threadId="+thread_id+"-------------pv="+pv);
		long word_sum = 0;
		//获取总数，遍历counts 的values，进行sum
		Iterator<Long> i = counts.values().iterator() ;
		while(i.hasNext())
		{
			word_sum += i.next();
		}
		System.err.println("PVBolt2-------------pv="+word_sum+"\r");
	}

	public void cleanup() {
		// TODO Auto-generated method stub
		
	}

	public void declareOutputFields(OutputFieldsDeclarer declarer) {
		// TODO Auto-generated method stub
		
	}

	public Map<String, Object> getComponentConfiguration() {
		// TODO Auto-generated method stub
		return null;
	}

}

3、topology运行main类

public class Main {

	public static void main(String[] args) {

		TopologyBuilder builder = new TopologyBuilder();

		builder.setSpout("spout", new MySpout(), 1);
		
		builder.setBolt("bolt1", new PVBolt1(),4).shuffleGrouping("spout");
		builder.setBolt("bolt2", new PVBolt2(),1).shuffleGrouping("bolt1");
		
		Map conf = new HashMap();
		conf.put(Config.TOPOLOGY_WORKERS, 4);

		if (args.length > 0) {
			try {
					StormSubmitter.submitTopology(args[0], conf, builder.createTopology());
			} catch (AlreadyAliveException e) {
				e.printStackTrace();
			} catch (InvalidTopologyException e) {
				e.printStackTrace();
			}catch (AuthorizationException e) {
				e.printStackTrace();
			}
		}else {
			LocalCluster localCluster = new LocalCluster();
			localCluster.submitTopology("mytopology", conf, builder.createTopology());
		}
		
	}

}

-------------------------------其它辅助类---------------------------

4、数据读取spout处理类


public class MySpout implements IRichSpout{

	/**
	 * 数据读取spout处理类
	 */
	private static final long serialVersionUID = 1L;

	FileInputStream fis;
	InputStreamReader isr;
	BufferedReader br;			

	SpoutOutputCollector collector = null;
	
	
	String str = null;

	
	public void nextTuple() {
		try {
			while ((str = this.br.readLine()) != null) {
				// 过滤动作
				
				collector.emit(new Values(str));
				
//				Thread.sleep(3000);
				//to do 
			}
		} catch (Exception e) {
			// TODO: handle exception
		}
		
		
	}

	
	public void open(Map conf, TopologyContext context,
			SpoutOutputCollector collector) {
		try {
			this.collector = collector;
			this.fis = new FileInputStream("track.log");
			this.isr = new InputStreamReader(fis, "UTF-8");
			this.br = new BufferedReader(isr);
		} catch (Exception e) {
			e.printStackTrace();
		}
		
		// 打开文件
		
	}

	
	public void declareOutputFields(OutputFieldsDeclarer declarer) {
		// 发射数据格式,与bolt接收数据一致
		declarer.declare(new Fields("log"));
	}

	
	public Map<String, Object> getComponentConfiguration() {
		// 与ope方法中的map对应
		return null;
	}
	

	public void ack(Object msgId) {
		// TODO Auto-generated method stub
		
	}

	
	public void activate() {
		// TODO Auto-generated method stub
		
	}

	
	public void close() {
		// TODO Auto-generated method stub
		
	}

	
	public void deactivate() {
		// TODO Auto-generated method stub
		
	}

	
	public void fail(Object msgId) {
		// TODO Auto-generated method stub
		
	}

}

5、pom文件引用前几篇文章

6、处理结果

引用

threadId=156-------------pv=44
PVBolt2-------------pv=44

threadId=156-------------pv=45
PVBolt2-------------pv=45

threadId=156-------------pv=46
PVBolt2-------------pv=46

threadId=156-------------pv=47
PVBolt2-------------pv=47

threadId=152-------------pv=1
PVBolt2-------------pv=48

threadId=215-------------pv=1
PVBolt2-------------pv=49

9234 [Thread-62-bolt1-executor[5 5]]
threadId = 227; pv=1
threadId=227-------------pv=1
PVBolt2-------------pv=50

分享到：

storm高并发PV统计，利用zookeeper锁输出 ... | Storm高并发运用WordSum

2017-04-16 17:54
浏览 709
评论(0)
分类:企业架构
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Storm流计算项目：1号店电商实时数据分析系统-37.项目3-非跳出UV-项目整体运行.pptx: 项目的实施过程中，需要注意的问题包括如何高效地进行数据聚合，如何确保在高并发下的数据一致性，以及如何优化HTTP长连接以保证实时数据推送的稳定性和效率。通过这种方式，1号店电商实时数据分析系统能够提供对非...

李剑彪：安全即服务: 数据批处理平台包含不同类型的Job，例如基础类Url处理、统计分布类PV/UV计算、安全分析类漏洞分析等。流数据处理平台需要具备横向扩展、负载均衡、错误恢复、任务迁移、集中控制和引擎异构等特点。 4. 安全服务协作...

轴类零件加工工艺设计.zip: 轴类零件加工工艺设计.zip

《基于YOLOv8的冷链车车门未关严预警系统》（包含源码、可视化界面、完整数据集、部署教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip: 资源内项目源码是来自个人的毕业设计，代码都测试ok，包含源码、数据集、可视化页面和部署说明，可产生核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源，毕设答辩评审绝对信服的保底85分以上，放心下载使用，拿来就能用。包含源码、数据集、可视化页面和部署说明一站式服务，拿来就能用的绝对好资源！！！项目备注 1、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习，也适合小白学习进阶，当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行，也可在此代码基础上进行修改，以实现其他功能，也可用于毕设、课设、作业等。下载后请首先打开README.txt文件，仅供学习参考, 切勿用于商业用途。

seaborn基本绘图人力资源数据集: seaborn基本绘图人力资源数据集

移动机器人(sw三维）.rar: 移动机器人(sw三维）

自制html网页源代码查看器: 自制html网页源代码查看器

3吨叉车的液压系统设计().zip: 3吨叉车的液压系统设计().zip

1_实验三扰码、卷积编码及交织.ppt: 1_实验三扰码、卷积编码及交织.ppt

北京交通大学软件学院自命题科目考试大纲.pdf: 北京交通大学软件学院自命题科目考试大纲.pdf

雅鲁藏布江流域 shp矢量数据 (范围＋DEM).zip: 雅鲁藏布江流域 shp矢量数据 (范围＋DEM).zip

基于RUST的数据结构代码示例，栈、队列、图等: 基于RUST的数据结构代码示例，栈、队列、图等

NIFD：2024Q1房地产金融报告.pdf: NIFD：2024Q1房地产金融报告

工具变量-上市公司核心名称数据集合.xlsx: 详细介绍及样例数据：https://blog.csdn.net/li514006030/article/details/146916652

【工业机器视觉定位软件Vision-Detect】基于C#的WPF与Halcon开发的工业机器视觉定位软件（整套源码），开箱即用: 【工业机器视觉定位软件Vision-Detect】基于C#的WPF与Halcon开发的工业机器视觉定位软件（整套源码），开箱即用有用户登录，图片加载，模板创建，通讯工具，抓边抓圆，良率统计，LOG日志，异常管理，九点标定和流程加载保存等模块，功能不是很完善，适合初学者参考学习。资源介绍请查阅：https://blog.csdn.net/m0_37302966/article/details/146912206 更多视觉框架资源：https://blog.csdn.net/m0_37302966/article/details/146583453

【Java技术领域】Java虚拟机（JVM）面试题详解：涵盖内存模型、垃圾回收、类加载及调优技术（51道含答案）: 内容概要：本文档详细介绍了Java虚拟机（JVM）的相关知识点，涵盖Java内存模型、垃圾回收机制及算法、垃圾收集器、内存分配策略、虚拟机类加载机制和JVM调优等内容。首先阐述了Java代码的编译和运行过程，以及JVM的基本组成部分及其运行流程。接着深入探讨了JVM的各个运行时数据区，如程序计数器、Java虚拟机栈、本地方法栈、Java堆、方法区等的作用和特点。随后，文档详细解析了垃圾回收机制，包括GC的概念、工作原理、优点和缺点，并介绍了几种常见的垃圾回收算法。此外，文档还讲解了JVM的分代收集策略，新生代和老年代的区别，以及不同垃圾收集器的工作方式。最后，文档介绍了类加载机制、JVM调优的方法和工具，以及常用的JVM调优参数。适合人群：具备一定Java编程基础的研发人员，尤其是希望深入了解JVM内部机制、优化程序性能的技术人员。使用场景及目标：①帮助开发人员理解Java代码的编译和执行过程；②掌握JVM内存管理机制，包括内存分配、垃圾回收等；③熟悉类加载机制，了解类加载器的工作原理；④学会使用JVM调优工具，掌握常用调优参数，提升应用程序性能。其他说明：本文档内容详尽，适合用作面试准备材料和技术学习资料，有助于提高开发人员对JVM的理解和应用能力。

基于Android的美食推荐 APP LW PPT.zip: Android项目原生java语言课程设计，包含LW+ppt

戴德梁行&中国房地产协会：2021亚洲房地产投资信托基金研究报告.pdf: 戴德梁行&中国房地产协会：2021亚洲房地产投资信托基金研究报告

基于androidX的跑步软件开发.zip: Android项目原生java语言课程设计，包含LW+ppt

Thinkphp6.0+vue个人虚拟物品发卡网站源码支持码支付对接扫码自动发货源码一共包含两个部分thinkphp6.0后端文件，以及vue前端文件.zip: Thinkphp6.0+vue个人虚拟物品发卡网站源码支持码支付对接扫码自动发货源码一共包含两个部分thinkphp6.0后端文件，以及vue前端文件.zip

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

storm高并发PV统计

评论

发表评论

相关推荐

ITridentSpout、FirstN(取Top N)实现、 流合并和join

Trident实战之计算网站PV

Trident API和概念

Trident入门

分布式远程调用drpc实例

不透明分区事务IOpaquePartitionedTransactional实例

分区事务IPartitionedTransactionalSpout实例

普通事务ITransactionalSpout实例之按天统计数据

普通事务ITransactionalSpout实例

Storm事务API

Storm批处理事务原理详解

集群统一启动和停止shell脚本开发

storm高并发UV统计

storm高并发PV统计，利用zookeeper锁输出汇总值

Storm高并发运用WordSum

storm分组策略介绍

Storm高并发介绍

Storm 字符统计Demo

Storm 本地模式

Storm启动配置

最近访客更多访客>>

ITridentSpout、FirstN(取Top N)实现、流合并和join