`
tailorcai
  • 浏览: 93306 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论

python 正则表达式匹配中文utf8

阅读更多
>>> import re
>>> x = u'中国'.encode('utf8')
>>> s = x.__repr__()
>>> s
"'\\xc3\\x96\\xc3\\x90\\xc2\\xb9\\xc3\\xba'"
>>> pattern = '.*%s.*' % s[1:-1]
>>> pattern
'.*\\xc3\\x96\\xc3\\x90\\xc2\\xb9\\xc3\\xba.*'
>>> r = re.match(pattern,u'我是中国人'.encode('utf8'))
>>> r
<_sre.SRE_Match object at 0x012A52C0>
>>> dir(r)
['__copy__', '__deepcopy__', 'end', 'expand', 'group', 'groupdict', 'groups', 'span', 'start']
>>> r.group()
'\xc3\x8e\xc3\x92\xc3\x8a\xc3\x87\xc3\x96\xc3\x90\xc2\xb9\xc3\xba\xc3\x88\xc3\x8b'
>>> 


我很懒,看代码吧
分享到:
评论

相关推荐

    Python实现正则表达式匹配任意的邮箱方法

    正则表达式是一种用于匹配字符串中字符组合的模式,它是一个强大的文本处理工具,在编程语言中常用于文本搜索、替换等操作。...希望这篇文章关于Python实现正则表达式匹配任意邮箱的方法能给大家带来帮助。

    Python正则表达式匹配日期与时间的方法

    下面给大家介绍下Python正则表达式匹配日期与时间 #!/usr/bin/env python # -*- coding: utf-8 -*- __author__ = 'Randy' import re from datetime import datetime test_date = '他的生日是2016-12-12 14:34,是个...

    Python使用中文正则表达式匹配指定中文字符串的方法示例

    标题所涉及的知识点为:Python使用中文正则表达式匹配指定中文字符串的方法示例。在该主题下,我们首先要理解什么是正则表达式及其在Python中的应用。正则表达式是一套规则和符号模式,用于文本的查找、匹配和替换...

    Python正则表达式匹配HTML页面编码

    、星号*等在Python正则表达式中具有特殊含义,它们分别表示字符集合、零个或一个字符、零个或多个字符。此外,由于OCR识别的误差,建议在使用时对代码进行适当修正与格式化,以确保代码的正确性和可运行性。 正则...

    基于Python正则表达式的彩票信息爬取.pdf

    ### 基于Python正则表达式的彩票信息爬取 #### 一、引言 随着互联网的快速发展,网络上蕴含着海量有价值的信息资源,而彩票信息作为一种特定类型的数据,在线可获得的彩票历史数据和实时数据对彩票研究者、数据...

    python课件-第4章 字符串与正则表达式.ppt

    Python 3.x默认使用UTF-8编码,对所有字符一视同仁,无论是数字、字母还是汉字,每个字符都视为一个单位。例如,Python中的`len()`函数计算的是字符串中的字符数,而不是字节数。在Python中,可以使用中文作为变量名...

    Python匹配中文的正则表达式

    ### Python匹配中文的正则表达式详解 #### 正则表达式基础 正则表达式是一种强大的文本处理工具,能够帮助我们高效地进行字符串搜索、替换等操作。它由一系列特殊字符组成,用来定义字符串模式。在Python中,正则...

    正则表达式计数代码行数

    正则表达式是一种强大的文本处理工具,用于匹配、查找、替换和分析字符串模式。在编程领域,它被广泛应用于各种任务,包括数据提取、验证输入、格式化输出以及本例中的代码行计数。本教程将详细介绍如何使用正则...

    浅谈python下含中文字符串正则表达式的编码问题

    例如,如果命令行终端使用的是GBK编码格式,那么在使用Python进行正则表达式匹配时,Python解释器读取的中文字符串实际上是GBK编码的Unicode对象。因此,为了使正则表达式能够正确匹配中文,必须将Unicode对象编码为...

    Python 正则表达式爬虫使用案例解析

    以上内容涵盖了使用Python正则表达式爬虫时涉及的各个方面,包括正则表达式的编写与应用、Python爬虫的基本概念、页面编码处理以及urllib2库的使用等。通过案例解析的方式,文章详细介绍了爬虫获取和筛选网页数据的...

    python3.x提取中文的正则表达式示例代码

    Python中的正则表达式可以通过编写特定的Unicode范围来匹配中文字符。 在提供的文件中,首先给出了一个示例代码,展示如何从一个文本文件中提取所有的中文字符。这里使用了Python的内置模块re来实现正则表达式的...

    正则表达式匹配单个字符操作示例

    正则表达式匹配单个字符操作示例 正则表达式在很多中语言中都是通用的,我这里总结的式python中如何使用正则表达式。 在python中需要通过正则表达式对字符进行匹配的时候,就需要使用到re模块。 1、在python中 ...

    非常好用的正则表达式调试工具

    正则表达式(Regular Expression,简称regex)是用于匹配字符串的一种模式,广泛应用于文本处理、数据验证、数据提取等IT领域。它通过一种简洁的语法来定义一系列字符或字符串模式,帮助开发者快速有效地搜索、替换...

    Python 正则表达式 re.match/re.search/re.sub的使用解析

    From Python正则表达式 re.match(pattern, string, flags=0) 尝试从字符串起始位置匹配一个模式;如果不是起始位置匹配成功,则 re.match() 返回none. 匹配成功,re.match() 返回一个匹配的对象,否则返回None. ...

    python基础教程:基于Python正则表达式提取搜索结果中的站点地址

    Python正则表达式是Python语言中用于处理字符串的强大工具,尤其在数据提取和文本处理方面。在本教程中,我们将探讨如何使用Python正则表达式从Google搜索结果中提取站点地址。 首先,我们需要理解问题的核心:从...

    正则表达式测试软件_RegexBuddy

    6. **跨平台兼容性**:虽然我们只提到RegexBuddy.exe,这通常意味着Windows版本,但该软件也考虑到了不同编程语言和平台的正则表达式语法差异,如Java、.NET、Perl、Python等,确保你的正则表达式能在目标环境中正常...

    小巧好用的正则表达式测试工具

    正则表达式(Regular Expression),简称regex,是用于匹配字符串的一种模式。在IT行业中,它是一种强大的文本处理工具,广泛应用于数据验证、搜索、替换等多个领域。正则表达式测试工具则是开发者和爱好者用来测试和...

Global site tag (gtag.js) - Google Analytics