- 浏览: 2663063 次
- 来自: 杭州
文章分类
- 全部博客 (1188)
- webwork (4)
- 网摘 (18)
- java (103)
- hibernate (1)
- Linux (85)
- 职业发展 (1)
- activeMQ (2)
- netty (14)
- svn (1)
- webx3 (12)
- mysql (81)
- css (1)
- HTML (6)
- apache (3)
- 测试 (2)
- javascript (1)
- 储存 (1)
- jvm (5)
- code (13)
- 多线程 (12)
- Spring (18)
- webxs (2)
- python (119)
- duitang (0)
- mongo (3)
- nosql (4)
- tomcat (4)
- memcached (20)
- 算法 (28)
- django (28)
- shell (1)
- 工作总结 (5)
- solr (42)
- beansdb (6)
- nginx (3)
- 性能 (30)
- 数据推荐 (1)
- maven (8)
- tonado (1)
- uwsgi (5)
- hessian (4)
- ibatis (3)
- Security (2)
- HTPP (1)
- gevent (6)
- 读书笔记 (1)
- Maxent (2)
- mogo (0)
- thread (3)
- 架构 (5)
- NIO (5)
- 正则 (1)
- lucene (5)
- feed (4)
- redis (17)
- TCP (6)
- test (0)
- python,code (1)
- PIL (3)
- guava (2)
- jython (4)
- httpclient (2)
- cache (3)
- signal (1)
- dubbo (7)
- HTTP (4)
- json (3)
- java socket (1)
- io (2)
- socket (22)
- hash (2)
- Cassandra (1)
- 分布式文件系统 (5)
- Dynamo (2)
- gc (8)
- scp (1)
- rsync (1)
- mecached (0)
- mongoDB (29)
- Thrift (1)
- scribe (2)
- 服务化 (3)
- 问题 (83)
- mat (1)
- classloader (2)
- javaBean (1)
- 文档集合 (27)
- 消息队列 (3)
- nginx,文档集合 (1)
- dboss (12)
- libevent (1)
- 读书 (0)
- 数学 (3)
- 流程 (0)
- HBase (34)
- 自动化测试 (1)
- ubuntu (2)
- 并发 (1)
- sping (1)
- 图形 (1)
- freemarker (1)
- jdbc (3)
- dbcp (0)
- sharding (1)
- 性能测试 (1)
- 设计模式 (2)
- unicode (1)
- OceanBase (3)
- jmagick (1)
- gunicorn (1)
- url (1)
- form (1)
- 安全 (2)
- nlp (8)
- libmemcached (1)
- 规则引擎 (1)
- awk (2)
- 服务器 (1)
- snmpd (1)
- btrace (1)
- 代码 (1)
- cygwin (1)
- mahout (3)
- 电子书 (1)
- 机器学习 (5)
- 数据挖掘 (1)
- nltk (6)
- pool (1)
- log4j (2)
- 总结 (11)
- c++ (1)
- java源代码 (1)
- ocr (1)
- 基础算法 (3)
- SA (1)
- 笔记 (1)
- ml (4)
- zokeeper (0)
- jms (1)
- zookeeper (5)
- zkclient (1)
- hadoop (13)
- mq (2)
- git (9)
- 问题,io (1)
- storm (11)
- zk (1)
- 性能优化 (2)
- example (1)
- tmux (1)
- 环境 (2)
- kyro (1)
- 日志系统 (3)
- hdfs (2)
- python_socket (2)
- date (2)
- elasticsearch (1)
- jetty (1)
- 树 (1)
- 汽车 (1)
- mdrill (1)
- 车 (1)
- 日志 (1)
- web (1)
- 编译原理 (1)
- 信息检索 (1)
- 性能,linux (1)
- spam (1)
- 序列化 (1)
- fabric (2)
- guice (1)
- disruptor (1)
- executor (1)
- logback (2)
- 开源 (1)
- 设计 (1)
- 监控 (3)
- english (1)
- 问题记录 (1)
- Bitmap (1)
- 云计算 (1)
- 问题排查 (1)
- highchat (1)
- mac (3)
- docker (1)
- jdk (1)
- 表达式 (1)
- 网络 (1)
- 时间管理 (1)
- 时间序列 (1)
- OLAP (1)
- Big Table (0)
- sql (1)
- kafka (1)
- md5 (1)
- springboot (1)
- spring security (1)
- Spring Boot (3)
- mybatis (1)
- java8 (1)
- 分布式事务 (1)
- 限流 (1)
- Shadowsocks (0)
- 2018 (1)
- 服务治理 (1)
- 设计原则 (1)
- log (0)
- perftools (1)
最新评论
-
siphlina:
课程——基于Python数据分析与机器学习案例实战教程分享网盘 ...
Python机器学习库 -
san_yun:
leibnitz 写道hi,我想知道,无论在92还是94版本, ...
hbase的行锁与多版本并发控制(MVCC) -
leibnitz:
hi,我想知道,无论在92还是94版本,更新时(如Puts)都 ...
hbase的行锁与多版本并发控制(MVCC) -
107x:
不错,谢谢!
Latent Semantic Analysis(LSA/ LSI)算法简介 -
107x:
不错,谢谢!
Python机器学习库
做性能测试的时候都希望能模拟用户的行为,ningx记录了用户的行为,比如nginx一般会记录如下:
222.210.49.198 - 209sdj3lufa7sf32 -c2b3lp - [14/Sep/2012:22:59:02 +0800]"GET /search/?page=33&kw=%E6%B5%B7%E8%B4%BC&type=feed&_type= HTTP/1.1" 200 14466 "http://www.duitang.com/search/?kw=%E6%B5%B7%E8%B4%BC&type=feed" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.84 Safari/535.11 LBBROWSER"
写了一个简单的python脚本从nginx读取URL来做性能测试:
# -*- coding: utf-8 -*- import re import urllib2 import json import threading import Queue import os host="http://7199.t.duitang.com" thread_count = 1 running = True def check(uri): try: url = "%s%s"%(host,uri) content = urllib2.urlopen(url=url,timeout=2) #print '%s %s'%(content.code,uri) #print content.info() #print content.msg #print content.readlines() #json.loads(content.readlines()) #print 'ok' except Exception,e: #print e print '%s %s'%(e,uri) #out = StringIO() #print_exc(file=out) #logger.info("check %s fail %s"%(server,out.getvalue())) class Executor(threading.Thread): def __init__(self,queue): threading.Thread.__init__(self) self.queue = queue def run(self): while running: url = self.queue.get() print queue.qsize() check(url) self.queue.task_done() def analysis(readline,queue): r = re.compile("\d+") mc_url = re.compile("GET /[a-zA-Z/0-9_?=&]*") result = {} for read in readline: ip=url=http_code=http_time = None match = mc_url.search(read) if match: url = str(match.group())[4:].strip() queue.put(url) def clean(a,b): print 'exit' running=False exit(1) from signal import signal,SIGTERM,SIGINT,SIGQUIT signal(SIGTERM,clean) signal(SIGINT,clean) signal(SIGQUIT,clean) if __name__ == "__main__": queue = Queue.Queue() for i in range(thread_count): t = Executor(queue) t.setDaemon(True) t.start() f = open("by_category","r") analysis(f.readlines(),queue) print "total %s" %queue.qsize() queue.join() print 'exit' running = False
发表评论
-
RingBufferTester
2015-05-17 11:26 710package mytest; import java ... -
python读取图片exif信息
2014-11-06 10:53 2406f = open("/home/admin/tlo ... -
Python程序的执行原理
2014-04-14 15:44 17331. 过程概述 Python先把代码(.py文件)编译成字 ... -
clean code--两种不同代码写法。
2014-02-20 15:32 732clean code--两种不同代码写法。 ... -
CRC32 quick code
2014-02-19 11:25 505CRC32 使用的example code // CRC ... -
solr query code
2014-02-14 10:36 643http://10.246.45.41:51276/sol ... -
solr code quick start
2014-02-07 10:19 927客户端项目依赖: <project xmlns=& ... -
查看网络的脚本
2014-01-22 14:52 643贴一段code net.sh #!/bin/ba ... -
hbase example code
2014-01-16 16:58 1060本地连接hbase: Configuration con ... -
python和linux命令交互方式总结
2014-01-09 10:11 1786python和linux命令交互有两种方式: 1. 直接 ... -
hdfs例子之读写MapFile
2014-01-03 10:16 2158package mytest; import jav ... -
如何创建一个短链服务
2013-12-26 16:23 0参考: http://stackoverflow.com ... -
hbase API code
2013-12-26 16:11 0package mytest; import jav ... -
几种file copy的性能对比
2013-12-16 10:45 1685测试了几种file copy的性能: package m ... -
python 解析命令参数(argument)组件argparse
2013-12-11 17:35 1410参考: http://youngsterxyf.githu ... -
pyhon命令行工具optparse
2013-11-10 16:27 1045使用python optparse 可以创建命令行工具,下面 ... -
Python在豆瓣的应用
2013-10-21 10:46 1199Python在豆瓣的应用,hongqiangning分享 ... -
用python爬虫抓站的一些技巧总结
2013-10-10 14:12 1685学用python也有3个多月了,用得最多的还是各类爬虫 ... -
python小技巧
2013-10-10 11:50 7481. 声明长度256的数组 a=[0]*256 ... -
使用tesseract-ocr破解网站验证码
2013-10-09 10:25 1215原文:使用tesseract-ocr破解网站验证码 ...
相关推荐
总结来说,GoAccess 是一款强大的Nginx日志分析工具,可以帮助运维人员快速了解网站的访问情况,定位问题,优化用户体验。通过其直观的报告和实时的监控,GoAccess 成为了Web服务器管理者的得力助手。对于那些需要...
总的来说,"nginx网站访问日志可视化"项目展示了如何利用Python的处理能力、数据库的存储优势,以及pyecharts的可视化特性,从Nginx日志中挖掘有价值的信息,并以直观的方式呈现出来。这不仅对于系统运维人员监控和...
此外,Hive的SerDe(序列化/反序列化)库需要与日志格式匹配,比如使用`org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe`来处理常见的Nginx日志格式。 在Hive中创建表结构,以匹配Nginx日志字段: ```sql ...
【Nginx日志切割详解】 在Web服务器的日常运维中,日志管理是一项至关重要的任务。Nginx作为一款高性能的HTTP和反向代理服务器,其日志记录功能可以帮助我们监控服务器状态、分析访问流量、排查问题等。然而,随着...
### 使用Awstats分析Nginx日志 #### Awstats简介 Awstats是一款开源的Web日志分析工具,基于Perl语言开发。它能够提供全面且直观的网站访问统计数据,包括但不限于访问次数、唯一访客数量、访问时间分布、操作系统...
总的来说,这个项目结合了大数据处理技术、实时流处理技术以及Web应用开发,提供了一套完整的解决方案,用于从nginx日志中提取价值信息并以直观方式展示,对于学习和提升大数据分析、Web开发以及监控运维能力具有很...
**Nginx日志文件切割**是Web服务器管理中的一个重要环节,主要目的是为了定期归档、管理和优化存储空间。在高访问量的网站环境中,Nginx的日志文件可能会迅速增长,如果不进行适当的切割,可能会导致硬盘空间耗尽,...
### Nginx 高性能 WEB 服务器系列知识点详解 #### 1. Nginx 入门简介 **Nginx** 是一款广受欢迎的高性能 HTTP 和反向代理服务器,同时也可作为 IMAP/POP3/SMTP 代理服务器。它以其出色的稳定性、丰富的功能集、...
Nginx日志是记录Web服务器活动的重要工具,其中包含了访问者的信息、请求的URL、响应状态码等关键数据。Python的强大之处在于它提供了丰富的库和工具,使得解析和分析这些日志变得简单易行。 首先,了解Nginx日志...
利用python脚本分析nginx日志内容,默认统计ip、访问url、状态,可以通过修改脚本统计分析其他字段。 一、脚本运行方式 python count_log.py -f med.xxxx.com.access.log 二、脚本内容 #!/usr/bin/python # -*- ...
本项目结合了Flink的强大功能与机器学习技术,特别是深度学习,来实现对Nginx日志的监控,旨在检测异常访问IP,并将这些信息发送到业务系统,以提升网络安全和性能。 首先,我们需要理解Flink如何处理Nginx日志。...
在详细介绍Nginx取代Apache作为高性能Web服务器之前,先来阐述一下这两个Web服务器软件的基础知识以及它们之间的主要区别。Apache是目前使用最广泛的Web服务器软件之一,它是一个开源项目,从1995年就开始活跃在Web...
- `logs`存储Nginx的日志文件,这对于调试和监控服务器状态至关重要。 - `temp`目录用于临时文件,Nginx可能会在这里存储工作文件。 7. **实际操作步骤**: - 配置Nginx:根据海康威视摄像头的RTSP URL修改Nginx...
通过对Nginx日志的持续分析,管理员可以发现性能瓶颈,优化服务器配置,提升用户体验。例如,如果发现某个页面访问量大,可能需要考虑缓存策略;如果发现异常访问来源,可能需要加强安全防护。 6. **安全与隐私** ...
1. **读取日志**:从指定的 Nginx 日志文件中读取数据,通常这些文件是文本格式。 2. **解析日志**:使用正则表达式或其他解析策略,将每条日志拆分成单独的字段。 3. **数据处理**:根据需要进行统计计算,例如计算...
NGINX到Prometheus日志文件导出器 不断读取NGINX日志文件(或任何类似日志文件)并将度量导出到帮助程序工具。内容配置文件高级功能命名空间作为标签自定义标签直通日志来源动态重新贴标签文件球JSON log_format ...
10. **logs**:日志文件夹,Nginx的访问日志和错误日志通常保存在这里,这对于监控服务器状态和调试问题至关重要。 在实际使用中,了解Nginx的配置结构和指令是非常重要的。例如,`server`块用于定义虚拟主机,`...