正则表达式的一些常用元字符和语法: http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html
正则表达式匹配html问题,经常会出现正则写对了,但匹配就是不成功,用notepad++查看html代码。
原因是:查看的html代码中,各html标签间可能有换行符,tab符等不可见字符,所以要在各html间增加【\s*】来匹配,同时python的使用中也要打开re.S 来 dot match all(包括换行)
for each in re.findall(person,page,re.S): print each
对于utf-8编码的网页,用urllib2下载网页时,正确处理中文的方法是:decode('utf-8)
page = urllib2.urlopen(url).read().decode('utf-8')
中文写到文件的方法:(在windows下,文件默认是ansii编码)
file = open(r'e:\\Chow\\result.txt','w') ... print >>file,each.encode('gbk'),'\n'
或者用codecs模块,以utf-8打开文件:
file = codecs.open(r'e:\\Chow\\result.txt','w','utf-8') ... print >>file,each,'\n'
1.写文件中文问题
在windows写中文txt文件时,遇到问题:
UnicodeDecodeError: 'ascii' codec can't decode byte 0xd1 in position 0: ordinal not in range(128)
解决:
import codecs file = codecs.open('filepath', 'w', 'utf-8') str = '中文输入' file.write(str.decode('gbk')) fiile.close()
或者:
在python的安装目录下的Lib目录,找到site.py,修改def setencoding()方法 def setencoding(): ..... .... if 0: # Enable to support locale aware default string encodings. 把那个if 0改为if 1:
.py文件的第一行加入:
#-*- encoding:UTF-8 -*-
相关推荐
使用python记录按键信息,简单版本的监控
Python学习记录 自从上个月更新博客,已经很久...目前看完了董国付版的python可以这样学,整体体验不错,各方面都兼顾到了,层层递进,不会给初学者以不适感,还有一些python常用的库,经典程序样例,值得初学者学习。
Python调用阿里云SDK接口实现域名解析记录更新与修改是一个重要的任务,特别是在自动化运维和动态DNS配置中。本文将深入探讨这一主题,介绍如何利用Python和阿里云SDK来完成相关操作,以及涉及到的相关技术。 首先...
这个“从Python处理MARC记录_Python_mIRC Script_下载.zip”压缩包文件,显然包含了关于使用Python解析和操作MARC记录的相关资源,特别是与mIRC脚本相结合的实践。 首先,我们需要了解什么是MARC记录。MARC记录是由...
Python的Loguru库是为了解决传统Python日志模块(如`logging`)在使用时可能存在的一些复杂性和不便性而设计的。它提供了一个简洁、直观的API,使得日志记录变得极其简单,同时不失灵活性和功能强大。下面将详细介绍...
"Python学习记录.zip"这个文件很可能是某位学习者在掌握Python编程过程中积累的笔记、代码示例或项目成果的集合。这个压缩包可能包含了一系列的文件,比如教程文档、练习代码、解决问题的笔记,甚至可能有一些已完成...
"Python学习资源"和"python学习记录网新python学习之路"的标题和描述暗示了这是一份关于Python编程的学习资料集合,可能是教程、笔记或者代码示例。"python-master"这个压缩包子文件的文件名可能代表这是一个包含...
在Python编程中,日志记录是一项至关重要的任务,它帮助开发者跟踪程序运行的状态,调试错误,以及在生产环境中监控应用程序。`console-logging`是指在命令行界面(CLI)中显示的日志信息,通常用于简单易用的开发...
python-elasticsearch-logger, 标准 python 日志记录框架的python Elasticsearch处理程序 CMRESHandler.py python Elasticsearch日志处理程序这个库提供了一个与标准日志库兼容的Elasticsearch日志附加组件。...
在IT领域,编程语言Python因其简洁明了的语法和丰富的库支持而被广泛应用于各种项目,包括系统监控、数据处理以及我们今天要讨论的主题——键盘记录。标题"python键盘记录.rar"表明这是一个使用Python编写的键盘记录...
总之,通过Python调用PowerShell,我们可以轻松地获取和分析Windows系统的RDP连接历史记录,这对于系统管理员来说是一个非常实用的工具,可以帮助他们更好地理解和管理他们的网络环境。在实际应用中,还可以根据需要...
微信聊天记录提取与分析系统 - 基于Python开发,包含247个文件,如PY、PNG、SVG、HTML、MD、JSON、YML、PYD、JPG和TXT等。该系统可提取微信聊天记录,并将其导出为HTML、Word、CSV文档进行永久保存,同时提供聊天...
Python百行代码实现抽奖系统 Python百行代码实现点赞系统 python百行制作查询工具 python百行制作登录系统 Python操作Excel自动化开发 Python法拍网数据 Python合成女神图片 Python获取NBA数据 Python获取...
记录键盘事件,截屏保存图片,并定时打包发送到指定的邮箱,功能可以更加完善,但已满足我个人需要,所以没有继续做了 KeyL:工程主入口文件,里面包含了下面两个文件,在py2exe打包时只需要针对这一个文件打包就行...
在python开发的时候,有些时候我们需要将日志信息存储下来用以程序的排查。那么就需要定义一个写日志的函数。而且这个函数最好能够满足在控制台打印出来的同时,将信息存储到本地文件中。 该方法有以下功能: 1. ...
钉钉API考勤打卡记录获取并存入数据库(python),免去人数限制
浪潮优派Python实习学习记录 本资源摘要信息主要记录了Python语言的基础知识,包括Python的起源、优缺点、版本选择、安装测试环境、第一个Python程序、开发工具、开发环境、包管理工具、变量和常量定义等。 知识点...
Python项目事件记录系统 内部项目较多,但管理较为混乱。各个干系人之间也不了解其余项目干系人对项目的推进情况。 功能设计 有人员管理,能够新增人员 能够修改人员 有权限管理,控制谁能新增项目,谁能管理项目,...
python学习记录的一天
在了解了一些python特点和应用方向后,我们接下来就需要学习python的基础知识 在python中,我们通过标识符对变量、常量、函数、类等对象命名,而标识符是需要遵守一些命名规范的。 1、标识符的第一个字符必须是...