- 浏览: 193621 次
文章分类
最新评论
今天学习Python时,遇到一个问题,Python Non-ASCII character '\xb0'
原因:字符编码问题
解决:首行加入# -*- coding: utf-8 -*-
codec:定义文本到二进制的字符转换
ASCII
UTF-8: 1个字节表示ASCII 完全相同 1-4个字节处理其他字符
(单独值处理UTF-8时,会出现不能以定长字节读取字符)
UTF-16: 固定格式的2字节 分为大端形式和小端形式,不向后兼容ASCII-8
看个例子:写入时用UTF-16编码,读取不用UTF-16解码会出错
''' An example of Unicode strings using utf-8 ''' CODEC = 'utf-16' out = u'hello world\n' open('1.txt','w').write(out.encode(CODEC)) readin = open('1.txt','r').read() print readin, print readin.decode(CODEC),
总结:
1.程序中出现字符串时一定要加个前缀 u.
2.不要用 str()函数,用 unicode()代替.
3.不要用过时的 string 模块,如果传给它的是非 ASCII 字符,会把一切搞砸
4.不到必须时不要在你的程序里面编解码 Unicod 字符.只在你要写入文件或数据库或者网络时才需要
发表评论
-
python smtp 发邮件代码
2012-10-18 16:37 864#!/usr/bin/env python # -*- ... -
[Python]文件的创建与追加
2012-10-11 11:12 1044一、用Python创建一个新文件,内容是从0到9的整数, 每个 ... -
python import模块方法
2012-10-08 11:00 1059python包含子目录中的模块方法比较简单,关键是能够在sys ... -
pythoncomplete.vim
2012-09-28 10:34 891where is vim vim7.3中自带里自动补全 ... -
python 易混地带
2012-09-25 12:59 1085每门编程语言都有易混 ... -
Python 内置对象及模块
2012-09-25 12:58 3234Python作为一种高效的脚本语言,内置了很多实用的函数,同时 ... -
python 特点
2012-09-25 12:56 12061、Python以模块文件的方式组织代码。 Python每个模 ... -
命名类、属性和方法
2012-09-10 16:50 796类名通常由大写字母打头。这是标准惯例,可以帮助你识别类, ... -
import 语句的模块顺序
2012-09-10 16:08 1581我们推荐所有的模块在 Python 模块的开头部分导入。 ... -
python 文件操作
2012-09-07 11:07 1067python中对文件、文件夹(文件操作函数)的操作需要 ... -
Python 函数参数
2012-09-05 11:25 6241. 函数参数 2. 函数引用 3. * Tuple 非关 ... -
Python 标准文件
2012-09-01 23:05 1043Python中, 只要程序一执行, 便可以访问三个标准文件:标 ... -
Python 二分查找
2012-08-29 00:00 855def bsearch(l = [], a = 0 ,b ... -
Python 浅拷贝 深拷贝
2012-08-09 21:25 871深拷贝:a -> b copy(a) ... -
Python 字符串 Template
2012-08-05 16:43 723from string import Template ... -
Python 更新模型
2012-08-05 11:10 846更新模型,顾名思义就是对象在创建成功后,其值是否能够更新 p ... -
待解决问题
2012-08-04 20:25 7281. Python的循环引用 2. >>> ... -
Python __name__
2012-08-04 20:09 759看python程序是经常会碰到 if __name__ == ... -
Python Learning
2012-08-04 18:27 7541. # -*- coding: utf-8 -*- 推 ...
相关推荐
### Python中的Unicode字符详解 #### 一、引言 在当今全球化的软件开发环境中,支持多种语言成为了一项基本需求。Python作为一种高级编程语言,在处理国际化文本方面具有强大的能力,尤其是在处理Unicode字符方面...
在Python编程语言中,Unicode是一种用于表示文本的标准,它包含了世界上几乎所有的字符集。在处理网络爬虫数据或从JSON、XML等格式解析文本时,我们可能会遇到Unicode字符串。本篇将详细介绍如何在Python3中将...
在准备计算机二级Python考试的过程中,理解并掌握Unicode字符是非常关键的一部分。Unicode是一种国际标准,它定义了一种统一的方式来表示世界上几乎所有的文字系统,包括汉字、拉丁字母、希腊字母等。在Python中,...
在处理Python3的unicode编码转换为中文时,我们经常遇到的问题是,当我们尝试将包含unicode字符的字符串打印或者写入文件时,Python解释器有时并不会如我们所预期地将其转换为中文显示。这种现象尤其在从网络爬虫...
问题: 将u’\u810f\u4e71’转换为’\u810f\u4e71′ 方法: s_unicode = u'\u810f\u4e71' ... 您可能感兴趣的文章:python文字和unicode/ascll相互转换函数及简单加密解密实现代码python2 中 uni
转杰森| ZJSON 全力打造最好用的json格式化工具,欢迎一起来玩! 访问地址 网站: : ... GitHub: : ...支持python unicode集合的解析; 支持保存,删除和呈现格式化的历史; 支持格式化后的json以文件的形式下
这些编码通常用于表示Unicode字符,而在Python环境中,为了处理这些数据,我们需要将这些编码转换为Python的Unicode字符串。 知识点的详细阐述如下: 1. Unicode编码及其重要性: Unicode是一个国际标准,用于...
在抓取网页内容时,我们经常会遇到Unicode编码的问题,因为网页的编码方式多种多样,而Python默认处理字符串时使用的是Unicode编码。因此,如何将获取到的Unicode码正确转换为中文信息,是Python爬虫开发者必须掌握...
或者在Python3中,可以直接在字符串前添加`u`表示这是一个Unicode字符串,例如: ```python print(u"小明") ``` 2. Python2中的字符串有两种类型:str和unicode。str是字节串,遵循ASCII编码,而unicode是Unicode...
### Python 实现 Unicode 转中文及转换默认编码的方法 #### 概述 在实际开发过程中,特别是处理网络爬虫时,经常会遇到 Unicode 编码的字符串需要转换为中文的情况。此外,在 Python 2.x 版本中,由于默认编码为 ...
Python 基础知识笔试题目涵盖了 Python 语言的多个方面,包括基础语法、数据类型、函数、模块、字符串处理、 Unicode 编码、协程等。下面是对每个题目的知识点总结: 1. 非法表示式: Python 中,赋值语句只能在同...
根据提供的文档内容,本文将详细解释如何在Python中判断Unicode字符是否属于汉字、数字、英文字符或其他字符,并介绍如何进行全角与半角字符之间的转换。此外,还将提供一段示例代码来展示这些功能的实际应用。 ###...
Python 3中的编码方式与Python 2有着较大区别,特别是它对Unicode的原生支持。Unicode是一个为了计算机方便处理世界上各种语言文字而设计的编码标准,而UTF-8是目前广泛使用的字符编码方式,它是一种变长的编码方式...
- Python中所有的字符串都是Unicode字符串。 - 使用 `encode()` 和 `decode()` 方法可以在Unicode字符串和字节串之间进行转换,例如 `Unicodebytes_out=hello_out.encode(utf-8)`。 5. Python输入输出操作: - ...
一篇关于STR和UNICODE的好文章 整理下python编码相关的内容 注意: 以下讨论为Python2.x版本, Py3k的待尝试 开始 用python处理中文时,读取文件或消息,http参数等等 一运行,发现乱码(字符串处理,读写文件,print) ...
Unicode 排序算法和 pyuca 也支持收缩和扩展。收缩是多个字母被视为一个单元的地方。在西班牙语中,ch被视为介于cand之间的字母,d 因此,例如,开头的单词ch应该排在所有其他以 开头的单词之后c。扩展是单个字母被...
### Python3中的Unicode与Bytes详解 #### 一、引言 Python3 在处理字符串时引入了两种主要的数据类型:`str` 和 `bytes`。其中 `str` 类型默认使用 Unicode 编码,这标志着 Python3 相比于 Python2 在字符串处理上...