`
agile_boy
  • 浏览: 556733 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Python的字符串编码

阅读更多
  中文,真是中国人的痛啊(在编程方面),在Python的世界了,也是如此。
  这里简单记录一下这两天的"痛“,以免忘记(好像是人的天性),同时如果有类似的,也可以作为参考。
   简单说一下,目前对python的串的了解。str和unicode是完全不一样的东西,从名字就可以看出,呵呵,不过他们都是从basestring而来,所有有相同的一些行为,如果要判断是string的话,应该使用isinstance(obj,basestring).
   一般来说str是跟环境有很大关系的,比如你的操作系统编码,终端/命令行所支持的编码等等。出现”UnicodeEncodeError: 'ascii' codec can't encode characters in position" 这样的异常,多数是跟str相关的。unicode在这方面,表现很好。
   str和unicode的转换,也是老掉牙的encode/decode。
  • str->unicode is decode
  • unicode->str is encode

   我碰到的问题是,收到一个带有utf8编码的unicode,但是我现在需要将其unicode的内容原封不动的转成str,这样我就可以在str使用utf8的编码操作了。非常简单的操作,.encode('iso-8859-1')就可以了。
分享到:
评论
2 楼 agile_boy 2011-03-31  
dragonlin06 写道
str和unicode的转换
str->unicode  unicode('sss')
unicode->str  str(u'sss')

也对。
1 楼 dragonlin06 2011-03-31  
str和unicode的转换
str->unicode  unicode('sss')
unicode->str  str(u'sss')

相关推荐

    C语言字符串转换为Python字符串的方法

    如果你并不确定编码方式或者数据是二进制的,你最好将字符串编码成字节。 在构造一个对象的时候,Python通常会复制你提供的字符串数据。如果有必要的话,你需要在后面去释放C字符串。同时,为了让程序更加健壮,你...

    python字符串编码识别模块chardet简单应用

    ### Python字符串编码识别模块Chardet简单应用 在日常编程工作中,我们经常遇到需要处理不同编码格式的文本文件。为了确保程序能正确解读这些文件的内容,我们首先需要确定其编码方式。Python提供了一个非常强大的...

    Python 字符串深度总结_Python 字符串深度总结

    本文将对Python字符串进行深入探讨,涵盖其基本概念、操作方法以及高级特性。 一、字符串定义与创建 在Python中,字符串是由单引号或双引号括起来的字符序列。例如: ```python str1 = 'Hello, World!' str2 = ...

    Python2与Python3关于字符串编码处理的差别总结

    Python2和Python3在处理字符串编码方面存在显著差异,这些差异主要源于对Unicode编码的不同处理方式。Unicode是一种通用的字符编码标准,旨在涵盖世界上几乎所有的字符。了解这些差异对于编写跨平台、兼容不同语言的...

    python字符串, 列表, 字典, 集合方法说明

    5. encode(encoding='utf-8', errors='strict'):以指定的编码方式将字符串编码成字节序列。 6. endswith(suffix[, start[, end]]):检查字符串是否以指定的后缀结束,返回布尔值。 7. expandtabs([tabsize=8]):...

    Python字符串学习

    Python字符串是编程中常用的数据类型,它用于存储一系列字符。字符串是不可变的,意味着一旦创建,就不能修改其中的单个字符。以下是一些关于Python字符串的重要知识点: 1. **字符串注释**:在Python中,可以使用...

    Python字符串相关操作的整理

    `encode()`方法用于将字符串编码为字节序列,`decode()`则用于将字节序列解码回字符串。两者都需要指定编码格式,如UTF-8,GBK等,以确保正确处理各种字符。 最后,值得注意的是,**Python字符串是不可变的**,这...

    模块7Python字符串与正则表达式.pptx

    字符串编码是指将字符串转换为数字的过程,因为计算机只能处理数字。常见的字符串编码有 ASCII 码、GB2312 编码、Unicode 编码和 UTF-8 编码等。 * ASCII 码:美国标准信息交换码,仅对 10 个数字、26 个英文字母的...

    Python字符串压缩库Fivebit.zip

    Fivebit 是一个 Python 3 的短文本字符串压缩库,可将短的字符串压缩成 5 bit 编码,小写的 ASCII 可以压缩 37.5%。同时提供了一个字典用于最常用的英文单词(3个字母或者更长)。标点、数字和正常符号每个占用 10 ...

    完整版 零基础学Python课件05 第5章 字符串及表达式.ppt

    Python字符串及表达式详解 Python中的字符串是一种基本的数据类型,用于存储文本信息。在Python中,字符串可以使用单引号、双引号或三引号来表示。字符串可以进行各种操作,如字符串连接、字符串分割、字符串检索、...

    Python 字符串的使用.docx

    本实验旨在深入理解Python字符串的编码格式、基本操作、格式化、正则表达式以及如何利用字符串解决实际问题,如加密、字符检查、密码生成和字符过滤。 1. 凯撒加密是一种简单的替换加密技术,通过将字母表上的每个...

    Python字符串的encode与decode研究.pdf

    Python 中的字符串编码问题是非常常见的,很多开发者在处理字符串时会遇到乱码问题。这个问题的根源是 Python 字符串的内部表示是 Unicode 编码,而在编码转换时需要以 Unicode 作为中间编码。因此,了解 encode 和...

    python3字符串

    ### Python3字符串详解 #### 一、字符串简介 在Python3中,字符串是最常用的数据类型之一,用于存储一系列字符。字符串可以通过单引号('')或双引号("")创建。例如: ```python var1 = 'HelloWorld!' var2 = ...

    python判断字符串编码的简单实现方法(使用chardet)

    本文实例讲述了python判断字符串编码的方法。分享给大家供大家参考,具体如下: 安装chardet模块 chardet文件夹放在/usr/lib/python2.4/site-packages目录下 [root@sha-sso-data01 chardet]# python Python 2.4.3 ...

    python正则表达式匹配不包含某几个字符的字符串方法

    本文将分享如何使用Python正则表达式来匹配不包含特定字符集的字符串。 首先,我们来看一个基本的正则表达式匹配例子。假设我们要从一个字符串中找出所有以“https?”开头,后面跟着“://”,然后再以“.jpg”、“....

    python实现字符串加密成纯数字

    本文实例为大家分享了python实现字符串加密成纯数字的具体代码,供大家参考,具体内容如下 说明:  该加密算法仅仅是做一个简单的加密,安全性就不谈了,哈哈.  算法流程: 1.字符串以utf8编码成字节数组 2.把每一个...

    判断字符串编码是utf-8还是gb23121

    判断字符串编码是utf-8还是gb2312 判断字符串编码是utf-8还是gb2312是PHP编程中一个常见的问题,本文将通过对字符的ASCII码值进行判断,从而来判断字符串的编码是utf-8还是gb2312。 PHP中判断字符串编码的方法有很...

    python中的real函数-RealPython基础教程:Python字符串用法详解.pdf

    在Python中,字符串是不可变的数据类型,它们是由一个或多个字符组成的序列。字符串处理是编程中的基础,因为几乎每个应用程序都需要对文本进行操作。Python提供了丰富的功能来处理字符串,包括运算符、函数和类方法...

    精品课件 Python从入门到精通 第7章 字符串(共17页).ppt

    1. **字符串编码与解码**: - `encode()`方法用于将字符串转化为特定编码的字节序列,例如UTF-8。例如:`str.encode('utf-8')`。 - `decode()`方法用于将字节序列解码回字符串。例如:`bytes.decode('utf-8')`。 ...

Global site tag (gtag.js) - Google Analytics