`
cuixuxucui
  • 浏览: 350804 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Python中正则表达式对中文的匹配问题

 
阅读更多

http://blog.csdn.net/freedomqx/article/details/6237654

今天在用Python匹配中文的时候出了问题,要么匹配不到,要么乱码,搜索了一下,成功完成,写了一小段测试代码如下:

 

 

[python] view plain copy
 
  1. import re  
  2. source = "s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3"  
  3. temp = source.decode('utf8')  
  4. xx=u"([/u4e00-/u9fa5]+)"  
  5. pattern = re.compile(xx)  
  6. results =  pattern.findall(temp)  
  7. for result in results :  
  8.   print result  

 

 

其中source为非unicode编码,要先将其转为unicode编码的temp

然后写正则表达式xx,其中u的前缀表示正则表达式也要为unicode编码,因为正则表达式要和被匹配的文本使用同样编码

unicode中中文的编码为/u4e00-/u9fa5

调用匹配后直接便可打印出正确文字,此时返回的结果也为unicode编码

分享到:
评论

相关推荐

    第11.20节 Python 中正则表达式的扩展功能:后视断言、后视取反.rar

    Python中的正则表达式是处理文本模式匹配的强大工具,它提供了丰富的语法来匹配各种复杂的字符串模式。在Python的标准库`re`模块中,除了基本的匹配功能,还包含了一些高级特性,如后视断言(Lookahead)和后视取反...

    python中正则表达式与模式匹配

     在之前找工作过程中,面试时经常被问到会不会python,懂不懂正则表达式。心里想:软件的东西和芯片设计有什么关系?咱也不知道因为啥用这个,咱也不敢问啊!在网上搜索到了一篇关于脚本在ASIC领域中应用的文章...

    第11.21节 Python 中正则表达式的其他扩展功能.rar

    本节将详细探讨Python正则表达式的其他扩展功能,帮助开发者深入理解并有效利用这些特性来解决实际问题。 1. **re模块的高级用法** - `re.compile()`: 这个函数用于编译正则表达式,返回一个Pattern对象,可以提高...

    第11.19节 Python 中正则表达式的扩展功能:前视断言和前视取反.rar

    总的来说,前视断言和前视取反是Python正则表达式中的高级特性,它们使得我们在处理文本时能够更精确地控制匹配行为,避免了单纯使用基本匹配可能导致的误匹配问题。正确理解和运用这些特性,可以使我们的代码在处理...

    python中正则表达式 re.findall 用法

    Python 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。...本文主要给大家介绍python中正则表达式 re.findall 用法,具体内容如下所示; 在python中,

    Python正则表达式全解析:从基础到高级应用

    本文将详细介绍 Python 中正则表达式的使用,包括基本语法、匹配模式、高级搜索技巧以及实际应用示例。 正则表达式是 Python 中处理字符串的强大工具。通过本文的介绍,读者可以了解正则表达式的基本概念、Python 中...

    Python中正则表达式的用法实例汇总

    Python中正则表达式的匹配操作涉及对正则表达式对象的创建和使用。首先,可以使用re.search方法查找subject中是否存在一个或多个与regex匹配的子串,如果找到匹配项,返回一个匹配对象,否则返回None。可以由此对象...

    Python中正则表达式的用法总结

    正则表达式在文本处理方面具有极大的灵活性和实用性,掌握了Python中正则表达式的用法,对于进行字符串搜索、验证、转换等操作都将变得非常高效。这篇文章对Python中的正则表达式用法做了全面的总结,并给出了实用的...

    Python使用中文正则表达式匹配指定中文字符串的方法示例

    标题所涉及的知识点为:Python使用中文正则表达式匹配指定中文字符串的方法示例。在该主题下,我们首先要理解什么是正则表达式及其在Python中的应用。正则表达式是一套规则和符号模式,用于文本的查找、匹配和替换...

    python中正则表达式的使用方法

    Python中的正则表达式是一个强大的文本处理工具,用于匹配、查找、替换等操作。在Python中,正则表达式的操作主要通过内置的`re`模块来实现。以下是一些关键的正则表达式概念和在Python中的使用方法: 1. **匹配...

    [Python]网络爬虫(七):Python中的正则表达式教程.pdf

    1. Python中正则表达式的介绍 Python中的正则表达式是通过标准库`re`来实现的。它可以用于搜索、匹配和替换文本中的字符串模式。在Python中,正则表达式是一种灵活、强大的工具,被广泛应用于字符串处理,尤其是在...

    Python中正则表达式的详细教程

    正则表达式是用来匹配字符串非常强大的工具,在其他编程语言中同样有正则表达式的概念,Python同样不例外,利用了正则表达式,我们想要从返回的页面内容提取出我们想要的内容就易如反掌了。  正则表达式的大致匹配...

    Python中正则表达式的巧妙使用一文包你必掌握正则

    对于需要匹配的字符串来说,同样把发现规律作为第一步,本文主要使用正则表达式完成字符串的查询匹配、替换匹配和分割匹配。 常用的正则符号 在进入字符串的匹配之前,先来了解一下都有哪些常用的正则符号,见下表...

Global site tag (gtag.js) - Google Analytics