`
sdmzhu3
  • 浏览: 30855 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

python UnicodeEncodeError: 'ascii' codec can't encode characters 解决方法

阅读更多
python UnicodeEncodeError: 'ascii' codec can't encode characters  详解
新建一个test.py

#coding:utf-8

s='nihao中国'.decode('utf-8')
print type(s)
print s

执行错误:
Traceback (most recent call last):
<type 'unicode'>
  File "/home/sdm/work/code/datadeal/tran_client/test_encode.py", line 5, in <module>
    print s
UnicodeEncodeError: 'ascii' codec can't encode characters in position 5-6: ordinal not in range(128)
-------------
修改如下
#coding:utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')

s='nihao中国'.decode('utf-8')
print type(s)
print s
---------一切正常-------
<type 'unicode'>
nihao中国
-------------------------
修改如下
#coding:utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')

s='nihao中国'.decode('utf-8')
print type(s)

fn='/tmp/test.txt'
f=open(fn,'w')
f.write(s)
f.close()
print open(fn).read()


--------------
不报错
<type 'unicode'>
nihao中国
---------------------------------------
修改如下
#coding:utf-8
import sys
reload(sys)
#sys.setdefaultencoding('utf-8')

s='nihao中国'.decode('utf-8')
print type(s)

fn='/tmp/test.txt'
f=open(fn,'w')
f.write(s)
f.close()
print open(fn).read()


---------
报错
<type 'unicode'>
Traceback (most recent call last):
  File "test_encode.py", line 11, in <module>
    f.write(s)
UnicodeEncodeError: 'ascii' codec can't encode characters in position 5-6: ordinal not in range(128)

-------------------------
说明 sys.setdefaultencoding
修改了默认的 unicode.encode 编码 行为
sys 为何reload 才有 sys.setdefaultencoding
-------
#coding:utf-8
import sys
#reload(sys)
sys.setdefaultencoding('utf-8')
-----------------
Traceback (most recent call last):
  File "test_encode.py", line 4, in <module>
    sys.setdefaultencoding('utf-8')
AttributeError: 'module' object has no attribute 'setdefaultencoding'
--------------------
grep -r -i 'setdefaultencoding' /usr/lib/python2.6
会看到
/usr/lib/python2.6/site.py:        sys.setdefaultencoding(encoding) # Needs Python Unicode build !
/usr/lib/python2.6/site.py:    # Remove sys.setdefaultencoding() so that users cannot change the
/usr/lib/python2.6/site.py:    if hasattr(sys, "setdefaultencoding"):
/usr/lib/python2.6/site.py:        del sys.setdefaultencoding

------------
site.py 里面
def main():
    global ENABLE_USER_SITE

    abs__file__()
    known_paths = removeduppaths()
    if ENABLE_USER_SITE is None:
        ENABLE_USER_SITE = check_enableusersite()
    known_paths = addusersitepackages(known_paths)
    known_paths = addsitepackages(known_paths)
    if sys.platform == 'os2emx':
        setBEGINLIBPATH()
    setquit()
    setcopyright()
    sethelper()
    aliasmbcs()
    setencoding()
    execsitecustomize()
    if ENABLE_USER_SITE:
        execusercustomize()
    # Remove sys.setdefaultencoding() so that users cannot change the
    # encoding after initialization.  The test for presence is needed when
    # this module is run as a script, because this code is executed twice.
    if hasattr(sys, "setdefaultencoding"):
        del sys.setdefaultencoding


main()
这个地方把del sys.setdefaultencoding 防止用户在改变defaultencoding  不知道为什么
----------------------------------------
site 这个模块是自动加载的
验证下
python  -c "import sys;print 'site' in sys.modules"
True
------------------
这个报错的
#coding:utf-8
import sys
s='nihao中国'.decode('utf-8')
print type(s)

fn='/tmp/test.txt'
f=open(fn,'w')
f.write(s)
f.close()
print open(fn).read()

-------
控制台直接运行 有时候不报错
#coding:utf-8
import sys
s='nihao中国'.decode('utf-8')
print type(s)
print s

但是 nohup 运行确报错:
nohup python test_encode.py
tail nohup.out
<type 'unicode'>
Traceback (most recent call last):
  File "test_encode.py", line 5, in <module>
    print s
UnicodeEncodeError: 'ascii' codec can't encode characters in position 5-6: ordinal not in range(128)

nohup 和 控制台运行 对python来说 标准输出是不一样的
-----------
在使用twisted.python.log 的时候和nohup 类似
代码前面加
import  twisted.python.log as  log
log.startLogging(sys.stdout)
之后 print unicode 仍然报错
#coding:utf-8
import sys
reload(sys)
#sys.setdefaultencoding('utf-8')

import  twisted.python.log as  log
log.startLogging(sys.stdout)

s='nihao中国'.decode('utf-8')
print type(s)
print s

2010-06-18 14:53:19+0800 [-] Log opened.
2010-06-18 14:53:19+0800 [-] <type 'unicode'>
2010-06-18 14:53:19+0800 [-] <unicode instance at 3074179752 with str error Traceback (most recent call last):
       
          File "/usr/lib/python2.6/dist-packages/twisted/python/reflect.py", line 560, in safe_str
            return str(o)
       
        UnicodeEncodeError: 'ascii' codec can't encode characters in position 5-6: ordinal not in range(128)
        >

----
结论:
开文件开头加上 就比较安全了
import sys
reload(sys)
sys.setdefaultencoding('utf-8')

----------



分享到:
评论
2 楼 woshiug 2011-01-18  
果然是高手 本来以为是转成字符串就能解决
1 楼 wayhome 2010-06-28  
标准的做法是建一个sitecustomize.py的文件,里面写入这两句:

import sys
sys.setdefaultencoding('utf-8')

相关推荐

    解决python写入带有中文的字符到文件错误的问题

    UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 0-1: ordinal not in range(128) —————————- 经过网上搜索出错原因得到结果: python中如果使用系统默认的open方法打开的文件...

    Python 爬虫之超链接 url中含有中文出错及解决办法

    UnicodeEncodeError: 'ascii' codec can't encode characters 这个错误是由于超链接中含有中文引起的,超链接默认是用ascii编码的,所以不能直接出现中文,若要出现中文, 解决方法如下: import urllib from ...

    解决uWSGI的编码问题详解

    UnicodeEncodeError: ‘ascii' codec can't encode characters in position 24-25: ordinal not in range(128) 有趣的是,直接在 Python 环境下运行的时候,没有这样的错误。使用 uwsgi uwsgi.in

    PyScripter

    python 集成开发编码软件 1、先执行Python2.7.3.msi安装,安装...UnicodeEncodeError: 'ascii' codec can't encode characters in position 1-2: ordinal not in range(128) Pysripter的解析器输出中文乱码解决方案:

    python2.78+pyscripter2.53 附乱码解决方案

    python2.78 32位 pyscripter2.53 32位 附带Pyscripter报错的解决方法: 第一次打开就出错:UnicodeEncodeError: 'ascii' codec can't encode characters in position 1-2

    Python字符串的encode与decode研究心得乱码问题解决方法

    为什么会报错“UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 0-1: ordinal not in range(128)”?本文就来研究一下这个问题。 字符串在Python内部的表示是unicode编码,因此,在做...

    解决python3 网络请求路径包含中文的问题

    UnicodeEncodeError: 'ascii' codec can't encode characters in position 10-11: ordinal not in range(128) 解决如下: import urllib.parse reqStr = '你好' encodeStr = urllib.parse.quote(reqStr) print...

    解决python3 urllib 链接中有中文的问题

    在描述中提到的错误信息 "UnicodeEncodeError: 'ascii' codec can't encode characters in position 69-78: ordinal not in range(128)" 就是典型的表现。 为了解决这个问题,我们需要对URL中的中文字符进行编码...

    pyspark+问题总结

    在使用PySpark处理包含中文字符的数据集时,调用`DataFrame.show()`方法可能会出现“UnicodeEncodeError: ‘ascii‘ codec can’t encode characters in position”这样的错误。 **解决方案**: 为了解决上述问题...

Global site tag (gtag.js) - Google Analytics