- 浏览: 2664539 次
- 来自: 杭州
文章分类
- 全部博客 (1188)
- webwork (4)
- 网摘 (18)
- java (103)
- hibernate (1)
- Linux (85)
- 职业发展 (1)
- activeMQ (2)
- netty (14)
- svn (1)
- webx3 (12)
- mysql (81)
- css (1)
- HTML (6)
- apache (3)
- 测试 (2)
- javascript (1)
- 储存 (1)
- jvm (5)
- code (13)
- 多线程 (12)
- Spring (18)
- webxs (2)
- python (119)
- duitang (0)
- mongo (3)
- nosql (4)
- tomcat (4)
- memcached (20)
- 算法 (28)
- django (28)
- shell (1)
- 工作总结 (5)
- solr (42)
- beansdb (6)
- nginx (3)
- 性能 (30)
- 数据推荐 (1)
- maven (8)
- tonado (1)
- uwsgi (5)
- hessian (4)
- ibatis (3)
- Security (2)
- HTPP (1)
- gevent (6)
- 读书笔记 (1)
- Maxent (2)
- mogo (0)
- thread (3)
- 架构 (5)
- NIO (5)
- 正则 (1)
- lucene (5)
- feed (4)
- redis (17)
- TCP (6)
- test (0)
- python,code (1)
- PIL (3)
- guava (2)
- jython (4)
- httpclient (2)
- cache (3)
- signal (1)
- dubbo (7)
- HTTP (4)
- json (3)
- java socket (1)
- io (2)
- socket (22)
- hash (2)
- Cassandra (1)
- 分布式文件系统 (5)
- Dynamo (2)
- gc (8)
- scp (1)
- rsync (1)
- mecached (0)
- mongoDB (29)
- Thrift (1)
- scribe (2)
- 服务化 (3)
- 问题 (83)
- mat (1)
- classloader (2)
- javaBean (1)
- 文档集合 (27)
- 消息队列 (3)
- nginx,文档集合 (1)
- dboss (12)
- libevent (1)
- 读书 (0)
- 数学 (3)
- 流程 (0)
- HBase (34)
- 自动化测试 (1)
- ubuntu (2)
- 并发 (1)
- sping (1)
- 图形 (1)
- freemarker (1)
- jdbc (3)
- dbcp (0)
- sharding (1)
- 性能测试 (1)
- 设计模式 (2)
- unicode (1)
- OceanBase (3)
- jmagick (1)
- gunicorn (1)
- url (1)
- form (1)
- 安全 (2)
- nlp (8)
- libmemcached (1)
- 规则引擎 (1)
- awk (2)
- 服务器 (1)
- snmpd (1)
- btrace (1)
- 代码 (1)
- cygwin (1)
- mahout (3)
- 电子书 (1)
- 机器学习 (5)
- 数据挖掘 (1)
- nltk (6)
- pool (1)
- log4j (2)
- 总结 (11)
- c++ (1)
- java源代码 (1)
- ocr (1)
- 基础算法 (3)
- SA (1)
- 笔记 (1)
- ml (4)
- zokeeper (0)
- jms (1)
- zookeeper (5)
- zkclient (1)
- hadoop (13)
- mq (2)
- git (9)
- 问题,io (1)
- storm (11)
- zk (1)
- 性能优化 (2)
- example (1)
- tmux (1)
- 环境 (2)
- kyro (1)
- 日志系统 (3)
- hdfs (2)
- python_socket (2)
- date (2)
- elasticsearch (1)
- jetty (1)
- 树 (1)
- 汽车 (1)
- mdrill (1)
- 车 (1)
- 日志 (1)
- web (1)
- 编译原理 (1)
- 信息检索 (1)
- 性能,linux (1)
- spam (1)
- 序列化 (1)
- fabric (2)
- guice (1)
- disruptor (1)
- executor (1)
- logback (2)
- 开源 (1)
- 设计 (1)
- 监控 (3)
- english (1)
- 问题记录 (1)
- Bitmap (1)
- 云计算 (1)
- 问题排查 (1)
- highchat (1)
- mac (3)
- docker (1)
- jdk (1)
- 表达式 (1)
- 网络 (1)
- 时间管理 (1)
- 时间序列 (1)
- OLAP (1)
- Big Table (0)
- sql (1)
- kafka (1)
- md5 (1)
- springboot (1)
- spring security (1)
- Spring Boot (3)
- mybatis (1)
- java8 (1)
- 分布式事务 (1)
- 限流 (1)
- Shadowsocks (0)
- 2018 (1)
- 服务治理 (1)
- 设计原则 (1)
- log (0)
- perftools (1)
最新评论
-
siphlina:
课程——基于Python数据分析与机器学习案例实战教程分享网盘 ...
Python机器学习库 -
san_yun:
leibnitz 写道hi,我想知道,无论在92还是94版本, ...
hbase的行锁与多版本并发控制(MVCC) -
leibnitz:
hi,我想知道,无论在92还是94版本,更新时(如Puts)都 ...
hbase的行锁与多版本并发控制(MVCC) -
107x:
不错,谢谢!
Latent Semantic Analysis(LSA/ LSI)算法简介 -
107x:
不错,谢谢!
Python机器学习库
参考:http://www.cnblogs.com/chenzehe/archive/2010/08/30/1812995.html
http://www.cnblogs.com/txw1958/archive/2012/03/12/2392067.html
通过urlparse提供了强大的url解析能力:
http://www.cnblogs.com/txw1958/archive/2012/03/12/2392067.html
通过urlparse提供了强大的url解析能力:
>>> url="http://localhost/test.py?a=hello&b=world " >>> result=urlparse.urlparse(url) >>> result ParseResult(scheme='http', netloc='localhost', path='/test.py', params='', query='a=hello&b=world ', fragment='') >>> urlparse.parse_qs(result.query,True) {'a': ['hello'], 'b': ['world ']} >>> params=urlparse.parse_qs(result.query,True) >>> params {'a': ['hello'], 'b': ['world ']} >>> params['a'],params['b'] (['hello'], ['world '])
urlparse result = urlparse.urlparse("http://item.taobao.com/item.htm?id=14952833371") >>> result.path '/item.htm' >>> result.query 'id=14952833371' >>> result.hostname 'item.taobao.com' >>> params = urlparse.parse_qs(result.query) >>> dict: {u'id': [u'14952833371']}
import urllib2 import urllib #request = urllib2.Request(url="http://0.0.0.0:8080/",headers={"FUCK":"fuck"}) #content = urllib2.urlopen(request) values ={'name' : 'test short talk','via':'xxxx'} form_data = urllib.urlencode(values) content = urllib2.urlopen("http://0.0.0.0:8080/", data=form_data, timeout=3) print content.readline() content.close()
import urllib2 import urllib import httplib import string from struct import unpack from struct import pack type, uri = urllib.splittype("http://0.0.0.0:8080/hello") print type+"\t"+uri host, uri = urllib.splithost(uri) print host+"\t"+uri h = httplib.HTTP(host) h.putrequest("POST", uri) h.putheader("Host", host) h.putheader("User-Agent","hessianlib.py") h.endheaders() values ={'name' : 'test short talk','via':'xxxx'} form_data = urllib.urlencode(values) out = [] write = write = out.append method = "hello" #write("c\x01\x00m"); write(pack(">H", len(method))); write(method) result = string.join(out, "") print "result:"+result h.send(result)
result = urlparse.urlparse(buyable_links['taobao']) params=urlparse.parse_qs(result.query, True)
发表评论
-
python读取图片exif信息
2014-11-06 10:53 2407f = open("/home/admin/tlo ... -
Python程序的执行原理
2014-04-14 15:44 17331. 过程概述 Python先把代码(.py文件)编译成字 ... -
如何创建一个短链服务
2013-12-26 16:23 0参考: http://stackoverflow.com ... -
python 解析命令参数(argument)组件argparse
2013-12-11 17:35 1411参考: http://youngsterxyf.githu ... -
pyhon命令行工具optparse
2013-11-10 16:27 1048使用python optparse 可以创建命令行工具,下面 ... -
Python在豆瓣的应用
2013-10-21 10:46 1207Python在豆瓣的应用,hongqiangning分享 ... -
用python爬虫抓站的一些技巧总结
2013-10-10 14:12 1686学用python也有3个多月了,用得最多的还是各类爬虫 ... -
python小技巧
2013-10-10 11:50 7511. 声明长度256的数组 a=[0]*256 ... -
使用tesseract-ocr破解网站验证码
2013-10-09 10:25 1216原文:使用tesseract-ocr破解网站验证码 ... -
和豆瓣CMGS交流
2013-06-20 17:36 5856蒋云鹏: 在?CMGS: 在蒋 ... -
python乱码问题('ascii' codec can't encode character u'\u4e2d' in position 0)
2013-05-20 19:03 4260>>> k = u'中' >> ... -
python shell 交互模式
2013-04-28 22:17 1647python 通过code模块可以很容易的进入交互模式: ... -
jython和gunicorn性能测试对比
2013-04-13 13:03 1315helloworld,笔记本上: gunicorn ... -
python的mysql客户端-MySQLdb
2013-04-04 10:13 1176平时的主要编程语言是Java,开发时也主要用Mysql,经常 ... -
Python几种并发实现方案的性能比较
2013-03-18 21:14 2970原文:http://www.elias.cn/P ... -
python汉字和Unicode码(utf-8)之间的转换(Pack/Unpack)
2013-03-18 21:13 1654保证你要转换的字符串编码为UTF8,如果不是,请iconv ... -
python反序列化的坑
2013-01-06 18:06 1285今天遇到python一个坑,调用memcached的get_m ... -
sqlalchemy connection pool.py 源代码
2012-12-29 22:58 2259把 sqlalchemy pool源代码copy下来,有空看看 ... -
SQLAlchemy简单介绍
2012-12-28 22:41 0文档参考:http://docs.sqlalchemy.org ... -
pymysql简单使用
2012-12-28 12:38 2125import pymysql conn = pymysq ...
相关推荐
python-twitter-api #!/ usr / bin / python2.4##版权所有2007 Python-Twitter开发人员##根据Apache... #请参阅许可证,以了解许可证下特定的语言管理权限和限制。 '''提供与Twitter API的Python接口的库'''
下面是一个使用`urllib2`的例子,展示了如何下载大文件并显示进度: ```python import urllib2 import os from urlparse import urlsplit def down_file(url): file_name = urlsplit(url).path.split('/')[-1] u...
urllib模块、urlparse模块、ftplib模块、httplib模块等为实现各种网络协议提供了便利。 国际化方面,locale模块用于实现本地化,unicodedata模块提供了对Unicode字符的支持。multimedia相关模块部分介绍了多媒体...
- urllib、urlparse和cookie模块用于处理URL和cookie。 - ftplib、httplib、poplib和imaplib模块提供了对标准网络协议的客户端支持。 - smtplib、telnetlib和nntplib模块提供了发送邮件和进行其他网络通信的功能。 -...
urllib模块提供了统一的接口来处理多种网络资源,urlparse模块用于解析URL;ftplib模块、httplib模块等提供了各种网络协议的客户端支持。 在国际化方面,locale模块提供了语言环境相关的功能支持,允许程序支持多...
urllib、urlparse模块用于处理URL,其他的如ftplib、httplib等提供了特定网络服务的高级接口。 国际化方面,locale模块提供了与特定地域设置相关的服务。unicodedata模块用于处理Unicode字符。多媒体相关模块如...
socket模块为网络通信提供了底层接口,select模块用于异步事件通知,asyncore和asynchat模块用于异步网络通信,urllib、urlparse、cookie、robotparser、ftplib、gopherlib、httplib、poplib、imaplib、smtplib、...
- urllib模块和urlparse模块:提供了访问URL的功能。 - ftplib模块、httplib模块等:提供了各种网络协议客户端的实现。 8. 国际化:包括: - locale模块:用于获取和设置本地化环境。 - unicodedata模块:提供...
- urllib、urlparse和robotparser模块:用于处理URL、解析URL。 - ftplib、gopherlib和httplib模块:提供对FTP、Gopher和HTTP服务器的接口。 - poplib、imaplib和smtplib模块:提供对邮件服务器的接口。 - telnetlib...
robotparser模块用于解析robots.txt文件,ftplib、gopherlib、httplib、poplib、imaplib、smtplib、telnetlib和nntplib模块则分别提供了与各种网络协议交互的功能。 国际化方面,locale模块提供了C语言库的locale...
网络协议部分是Python标准库的一个大块,包含了socket、select、asyncore、asynchat等基础网络编程模块,以及urllib、urlparse、cookie、robotparser、ftplib、gopherlib、httplib、poplib、imaplib、smtplib、...
7.7. urlparse 模块 7.8. cookie 模块 7.9. robotparser 模块 7.10. ftplib 模块 7.11. gopherlib 模块 7.12. httplib 模块 7.13. poplib 模块 7.14. imaplib 模块 7.15. smtplib 模块 7.16. telnetlib ...
popen2模块提供了执行外部命令并读取其标准输出和标准错误的功能,现已废弃,推荐使用`subprocess`模块。 **3.8 signal模块** signal模块提供了信号处理的功能,如`signal.signal()`用于设置信号处理函数。 #### ...
- **7.6 urllib 模块**:提供了从URL读取数据的功能。 - **7.7 urlparse 模块**:提供了解析URL的功能。 - **7.8 cookie 模块**:用于处理HTTP Cookie。 - **7.9 robotparser 模块**:用于解析robots.txt文件。 - **...
- **`urlparse`模块**:提供了URL解析的功能。 - **`robotparser`模块**:提供了机器人排除协议(robots.txt)的解析。 - **`ftplib`模块**:提供了FTP协议的支持。 - **`gopherlib`模块**:提供了GOPHER协议的支持...