`
85977328
  • 浏览: 1899498 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

日志架构(五)WWW的日志采集和展望

 
阅读更多
确定的方案
统一由前端发送日志到日志中心服务器
确定后端传递到前端的参数格式,参数名要求和日志规范中严格一致;
发送请求的时候,可以设置cookie参数和head参数
发送格式举例:http://analytics.xxxx.com/__utm.gif?a=11&b=222&c=333
公共参数需要写在JS组件中,例如版本信息,时间戳等
参数,统一要有前缀(utm,方便与GA之间的兼容),统一使用简写
开发一个公共的HTML隐藏域,风转参数request.setAttribute有统一的前缀,由日志架构提供统一的组件
1次的页面请求,后端的多次forward只向前传递一条日志,按照一次用户行为计算
WWW/WAP的日志头是可以共用的
公共参数选取几个定义试用:版本,时间戳

遗留问题
安全问题,如何防范其他人的攻击(一定程度上的改进,多一些判断)
前端和后端方案,仍需深入对比;

    本系统采取后端生产日志数据,前端统一发送http跨域请求的形式进行设计。这样的优点非常明显,如下表(此表仅分析WWW的日志架构):


其他搜索引擎公司行为分析
关键词:奥运会
均为一次请求
其中百度,必应,雅虎,谷歌类似,是一次写入日志
搜狗,即刻均是多次写日志

下面是具体数据

谷歌
www.google.com
http://www.google.com.hk/search?hl=zh-CN&newwindow=1&safe=strict&q=%E5%A5%A5%E8%BF%90%E4%BC%9A&oq=%E5%A5%A5%E8%BF%90%E4%BC%9A&aq=f&aqi=&aql=&gs_l=serp.12...0.0.0.145950.0.0.0.0.0.0.0.0..0.0...0.0..0.1It9Nj6T3tM&bav=on.2,or.r_gc.r_pw.&fp=3c40fc4e2ccc0cd3&biw=1280&bih=427&tch=5&ech=1&psi=7fEqUKeYDMeViAeewoDoCw.1344991726606.5

http://www.google.com.hk/csi?v=3&s=web&action=&ei=jfIqUNHKCai9iAfvgoDgDA&e=17259,24472,37102,39523,39976,40094,4000036,4000054,4000108,4000110,4000115,4000126,4000179,4000242,4000276&cr=n&imp=0&pfa=n.1,ttfc.157,ttlc.0,cbt.193&pfm=n.1,ttfc.157,ttlc.0,cbt.193&imn=11&rt=prt.268,pprt.269,ol.269,jsrt.99,iml.269

百度
www.baidu.com
http://sclick.baidu.com/w.gif?q=%B0%C2%D4%CB%BB%E1&fm=se&T=1344945147&y=EF5E5EDF&rsv_pt=&rsv_ua=Mozilla/5.0%20(Windows;%20U;%20Windows%20NT%206.1;%20zh-CN;%20rv~1.9.2.28)%20Gecko/20120306%20Firefox/3.6.28&rsv_sid=1289_1328_1267_1229_1186_1279_1179_1286_1319_1295_1332&cid=0&qid=fa23fe3d15408a2d&t=1344945150348&path=http://www.baidu.com/s?wd=%B0%C2%D4%CB%BB%E1&rsv_bp=0&rsv_spt=3&inputT=14437

人民搜索(即刻)
www.jike.com
http://logs.jike.com/se.gif?t=0&bt=firefox&sid=b9b09f0f6d5df0e83271e5ecb2b12df9&u=http%3A%2F%2Fwww.jike.com%2Fso%3Fq%3D%25E5%25A5%25A5%25E8%25BF%2590%25E4%25BC%259A&r=http%3A%2F%2Fwww.jike.com%2F&bv=3.6.28&ot=Windows7&dp=1280*800&bid=e9604084fcc9b9bb329868b8af5385a4&pre_bid=62fb22a4789cffc9b52cd235e788e0a2&qs=&req_bid=-4229112065218892549&temp=1344945378984&uargs=q%3D%25E5%25A5%25A5%25E8%25BF%2590%25E4%25BC%259A

http://logs.jike.com/c.gif?t=0&u=http%3A%2F%2Fwww.jike.com%2Fso%3Fq%3D%25E5%25A5%25A5%25E8%25BF%2590%25E4%25BC%259A&clu=null&qs=load&bid=15a901acb23bbd45aeff43a82e68f2a5&pre_bid=e9604084fcc9b9bb329868b8af5385a4&co=0&temp=1344945380499&uargs=q%3D%25E5%25A5%25A5%25E8%25BF%2590%25E4%25BC%259A


http://logs.jike.com/c.gif?t=0&u=http%3A%2F%2Fwww.jike.com%2Fso%3Fq%3D%25E5%25A5%25A5%25E8%25BF%2590%25E4%25BC%259A&clu=null&qs=load&bid=76c7930b1a3b0b737c5c5a2f773b4d22&pre_bid=e9604084fcc9b9bb329868b8af5385a4&co=1&temp=1344945380692&uargs=q%3D%25E5%25A5%25A5%25E8%25BF%2590%25E4%25BC%259A

搜狗
www.sogou.com
http://pb.sogou.com/pv.gif?uigs_productid=webapp&type=tmon&uuid=36119e02-bed8-417d-96ab-f3cb5726396a&loc=CN1100&abtestid=0&query=%25B0%25C2%25D4%25CB%25BB%25E1&eg=1&cost=29&idc=djt&h_s=1344946163460&h_e=1344946163563&b_e=1344946164697&a_e=1344946164754&w_l=1344946165179&u_c=1344946163337

http://pb.sogou.com/pv.gif?uigs_productid=webapp&uigs_t=1344946165658&type=quan_show_monitor&uigs_pbtag=A&uigs_cookie=SUID%2Csct&abtestid=0&query=%25B0%25C2%25D4%25CB%25BB%25E1&rn=9474959&stype=0&htn=9&qcn=0&hbn=0&uuid=36119e02-bed8-417d-96ab-f3cb5726396a&vr=20104003_0-20104602_1-20009904_2-10000103_3-null_4-30000501_5-null_6-30001005_7-null_8-null_9&sm=d1_0-d1_1-d1_2-d1_3-a1c2d0_4-a6d0_5-a2c1d0_6-a5c3b8d0_7-a3b1d0_8-a4b4d0_9&msrc=sm&loc=CN1100&adn=0&adltbn=0&adltan=0&qflag=0&warnLevel=127&eg=1&cost=29&bl=-1_127_0_0&scrnwi=1280&scrnhi=800&pid=sogou&rw=&idc=djt&jhly=top&inttab=61_0-33_1-43_2-37_3-41_4-40_5-28_6-39_7-62_8-&intcat=web&jhshuxing=0&jhhint=1&legalad=1&uigs_uuid=1344946164702404&uigs_refer=http%3A%2F%2Fwww.sogou.com%2F&pos=3&qtype=shop_sv_fail&uigs_st=907&qv=&subtype=unknown&qtl=null_0-null_1-null_2-null_3

http://pb.sogou.com/pv.gif?uigs_productid=web&uigs_t=1344946164702468&uigs_cookie=SUID%3D287BCF7C62890E0A00000000ADB4474D%26sct%3D1&uigs_uuid=1344946164702404&uigs_pbtag=A&abtestid=0&query=%25B0%25C2%25D4%25CB%25BB%25E1&rn=9474959&stype=0&htn=9&qcn=0&hbn=0&uuid=36119e02-bed8-417d-96ab-f3cb5726396a&vr=20104003_0-20104602_1-20009904_2-10000103_3-null_4-30000501_5-null_6-30001005_7-null_8-null_9&sm=d1_0-d1_1-d1_2-d1_3-a1c2d0_4-a6d0_5-a2c1d0_6-a5c3b8d0_7-a3b1d0_8-a4b4d0_9&msrc=sm&loc=CN1100&adn=0&adltbn=0&adltan=0&qflag=0&qtype=0&warnLevel=127&eg=1&cost=29&bl=-1_127_0_0&scrnwi=1280&scrnhi=800&pid=sogou&rw=&idc=djt&jhly=top&inttab=61_0-33_1-43_2-37_3-41_4-40_5-28_6-39_7-62_8-&intcat=web&jhshuxing=0&jhhint=1&legalad=1&uigs_version=v1.1&uigs_refer=http%3A%2F%2Fwww.sogou.com%2F

http://pv.sogou.com/pv.gif?uuid=36119e02-bed8-417d-96ab-f3cb5726396a?t=1344946164700980?r?=http://www.sogou.com/


必应(bing)
cn.bing.com
http://cn.bing.com/fd/ls/l?IG=e1ba4d42b6124c63a0a05e7dc5a46c8e&Type=Event.CPT&DATA={%22pp%22:{%22S%22:%22L%22,%22PC%22:588,%22FC%22:595,%22BC%22:596,%22BS%22:694,%22H%22:717,%22FE%22:-1,%22LE%22:-1,%22C1%22:-1,%22C2%22:-1,%22BP%22:2030,%22KP%22:661,%22CT%22:2071,%22IL%22:27}}&P=SERP&DA=Bj1

雅虎
www.yahoo.cn
http://click.s.aliyun.com/0.gif?v=100102&c=e0bf379b2d5c44ef3eaf148687d261e4&pt=web&ip=124.192.129.4&q=%E5%A5%A5%E8%BF%90%E4%BC%9A&pg=1&qt=1344946496&hid=b7439ab980054b16b6973d6bd38cd498&ads=google&l=2&id=20123&oq=%E5%A5%A5%E8%BF%90%E4%BC%9A&bs=&from=searchbox&sc=olympic:1,news:2&vr=1&t=1344946498949

展望
JAR包不重启升级
日志中心UI
日志中心备份机制
  • 大小: 79 KB
1
1
分享到:
评论

相关推荐

    日志分析系统.pdf

    - **日志采集**:支持多种日志格式,如Apache、Nginx等,采用定时任务或事件驱动方式自动收集日志。 - **数据传输**:利用FTP/SFTP、SSH等协议实现安全高效的数据传输。 - **日志解析**:通过正则表达式等技术解析非...

    B站日志系统的演进之路.pdf

    日志采集使用了三种方式: - Logagent:适用于自研类应用,支持按照日志规范输出日志; - Logstash:基于Elasticsearch官方组件,功能强大,但资源消耗高,性能较低; - Filebeat:适用于网络上报日志的方式或直接...

    电信采集系统 毕业论文

    1. 数据采集模块:负责从各种网络设备和接口获取实时数据,可能涉及协议解析、数据过滤和转换。 2. 存储模块:考虑到电信数据的海量性,通常会选择分布式数据库或大数据存储解决方案,如Hadoop HDFS或NoSQL数据库。 ...

    藏经阁-一个硅谷独角兽公司监控系统的七年衍变.pdf

    监控系统架构分为多个层次,每个层次都有其特定的功能,如数据采集、数据存储、数据查询和报警等。 监控系统技术栈 Pinterest公司的监控系统技术栈主要包括Graphite、Ganglia、openTSDB、Kafka等。这些技术栈都是...

    电信设备-一种基于用户计算机终端的桌面信息采集系统及采集方法.zip

    2. **技术原理**:详细解释信息采集的技术手段,可能包括屏幕截图、系统日志抓取、网络流量监控等方面,以及如何保证数据的安全性和隐私保护。 3. **系统设计**:描述系统的各个模块,如数据采集模块、数据传输模块...

    站在商品平台上的互联网金融架构实践

    ### 互联网金融架构实践 #### 一、互联网金融概述 互联网金融是指利用互联网技术实现资金通融、支付和信息中介等功能的一种新型金融服务模式。它基于现有的金融理论与实践,通过技术创新来解决传统金融领域的痛点...

    基于串口的DNC信息采集系统的研究

    1. **系统架构设计**:系统主要包括数据采集模块、数据处理模块、用户交互模块等几个部分。 2. **功能模块设计**: - **NC传输**:实现NC程序的上传与下载。 - **在线加工**:支持在线编辑与执行加工程序。 - **...

    大数据应用分发平台架构方案.ppt

    在技术层面,包括日志采集、广告服务、搜索服务、推荐服务、风控服务等,通过SDK、消息推送平台、运营平台、分析平台等多个层面实现个性化应用的精准推送。 此外,数据生态闭环和质量体系也是重要环节。数据链路的...

    互联网大数据采集与处理的重点技术.docx

    ##### 1.2 系统日志采集 系统日志记录了软件运行过程中产生的所有活动记录,包括用户行为、网络流量变化等。大型互联网公司通常会使用专门的工具(如Hadoop的Chukwa、Cloudera的Flume、Facebook的Scribe等)来高效地...

    面向SQL注入和XSS攻击的Web入侵检测系统的研究与实现 (1).pdf

    本文提出了一种面向SQL注入和XSS攻击的Web入侵检测方法,主要包括三个模块:Web日志采集模块、数据管理模块和入侵检测模块。Web日志采集模块负责将Web日志采集到数据库中,并对日志的数据进行预处理和清洗。数据管理...

    硕士论文(毕业设计)

    - **日志收集层**:采用Logstash等工具实现实时数据的采集和预处理。 - **数据存储层**:利用Elasticsearch进行日志数据的存储和索引,便于后续的快速检索。 - **数据分析层**:借助Spark Streaming等流式计算框架,...

    大数据处理技术的现状与展望.pdf

    数据统计和分析则是利用分布式数据库和计算集群对采集的数据进行分析和汇总;数据挖掘则是通过算法从海量数据中提取有价值的信息。 大数据技术的发展现状可以从以下几个方面进行分析: 1. 数据采集技术:随着...

    食品行业数字化转型数据架构及典型案例.pptx

    根据业务需要,明确需要采集的数据范围,包括但不限于生产数据、销售数据、供应链数据等,并确定合适的数据采集方式(如传感器采集、系统日志采集等)。此外,还需要根据数据类型、数据量、访问频率等因素,制定合适...

    藏经阁-Pinterest的监控系统.pdf

    日志搜索系统采用了自研的架构,实现了高效的日志索引和存储。它支持每秒大量的数据采集和查询请求,同时强制要求每个服务输出结构化的日志,以方便后续分析。日志记录包含丰富的上下文信息,如服务标识、项目归属等...

    基于hadoop的旅游大数据平台的设计与实现 答辩PPT.ppt

    - **日志实时采集**:采用FireSpark等工具实现日志的实时收集,确保数据的时效性。 - **数仓旅游域分层建设**:根据不同的业务需求,对数据进行合理的分层,如原始数据层、明细数据层、汇总数据层等。 3. **异构...

    理想汽车基于 Flink 的实时数据仓库 0-1 初步建设-Flink Forward Asia 2021.pdf

    4. 实时数据仓库的数据处理流程:理想汽车的实时数据仓库处理流程包括了数据埋点、日志采集、内部系统数据采集等环节。数据从各个源采集后,会通过实时数据生产平台进行SQL化处理,进而实现实时数据的存储和分析。 ...

    统一数据平台的实践及思考.pptx

    统一数据平台的实践及思考 在大数据时代,企业面临着海量数据的挑战,如何...* 平台架构和数据接入是统一数据平台的核心组件 * 通过统一数据平台,我们可以实现数据的统一管理和分析,提高企业的竞争力和创新能力。

    IDS分析及其在Linux下的实现.doc

    最后,第五章总结了IDS在网络安全中的重要性,并对未来的发展进行了展望,强调了持续改进和适应不断变化的威胁环境的必要性。 附录部分提供了常见攻击手段的分析和WARCHER源程序,供读者进一步了解攻击行为和IDS的...

    统一数据平台的实践及思考.pdf

    平台架构包括五个层次:源数据层、采集层、处理层、计算层和访问层。这一架构旨在实现数据的统一接入、存储、校验、格式转换、实时与离线分析、数据治理和权限控制,以提升数据分析的时效性,保障数据安全,并降低...

Global site tag (gtag.js) - Google Analytics