`

python中文乱码问题汇总

阅读更多
将python2中汉字会出现乱码的事一次性说清楚。
为了让初学者,不再为python2中汉字出现乱码的事烦恼!

请看迪艾姆公司python培训上课老师黄哥细细道来:
1、写的代码模块需要指定编码
如果代码没有指定coding,python就默认所有的字符为ASCII码,
ASCII码只支持256个字符,ASCII码不支持中文,所以就报错。
所以要在代码前写上#coding:utf-8或#coding:gbk
但通用写上#coding:utf-8

2、python2内部所有编码统一为unicode
unicode可以处理世界上所有语言的字符。
utf-8为unicode的一种实现形式,所以需要在代码前写上#coding:utf-8

3、编码转换
牢记python2内部编码为unicode.
其它的编码decode()为unicode,再编码encode()为你指定的编码,就不会出现乱码。

4、网页采集时
代码指定#coding:utf-8
如果网页的编码为gbk
需要这样处理:
html = html.decode('gbk').encode('utf-8')

5、代码前也可以写#coding:gbk,但也要保证你的代码文件的保存格式为gbk.这个在windos下会出现这样的问题。

6、字典等key或值的汉字问题
#coding:utf-8
dict1 ={1:'python周末培训班',2:'咨询010-68165761 QQ:1465376564'}

print dict1
# 这样输出的没有显示汉字,是显示汉字的其它编码

dict2 ={1:'python视频培训班',2:'咨询010-68165761 QQ:1465376564'}
for key in dict2:
print dict2[key]

7、unicode的汉字编码写到文本文件中
需要根据文本文件的编码进行转换
可以encode('utf-8')或encode('gbk')

总结:凡是报错信息中出现的错误包含“ASCII”,就是没有指定汉字编码的问题。


----获取字符串的编码类型----------------------------------------------------------------
>>> date = urllib2.urlopen("http://www.baidu.com")
>>> d = date.read()
>>> import chardet
>>> chardet.detect(d)
{'confidence': 0.99, 'encoding': 'utf-8'}


分享到:
评论

相关推荐

    Python快速入门(PPT、源码)资源汇总

    这个文件名可能由于编码问题显示为乱码,但通常在Python学习资源中,它可能是指一个案例或项目文件,可能是一个练习程序或者游戏,如"飞机大战",用于实践和巩固所学知识。 5. **源代码**: 源代码文件是实际的...

    python2.7 和pymysql安装依赖包

    linux SUSE 上安装python2.7及pymysql所有依赖的包汇总

    Python自动化小技巧知识分享

    15. 分类汇总写入excel不同sheet表:使用Python的pandas和openpyxl模块,可以实现分类汇总写入excel不同sheet表。这可以帮助用户快速分类汇总数据,提高工作效率。 16. 两张excel表对账,找不同的项目:使用Python...

    py源码实例Python从多路径多Excel表中获取数据并存入新表

    - 在读取Excel文件时,需要注意Excel文件的编码格式是否正确,以免出现乱码问题。 - 在合并数据时,确保所有数据列名一致,否则可能需要进行列名调整或数据清洗。 - 考虑到性能问题,对于非常大的数据集,可以考虑分...

    20200318附加-2019年电赛综合测评方案详细计算过程(pdf版本,有朋友反映word版本乱码,特意转为pdf).zip

    这个文件原本可能是Word文档,但由于一些用户遇到了乱码问题,制作者将其转换成了PDF格式以确保内容的正确显示。PDF(Portable Document Format)是一种通用的文件格式,能够保持文档的原始布局和样式,避免因不同...

    sublime text build 安装过程中配置及常见问题汇总

    3. **中文乱码问题**: - 安装 Chinese Localization 插件。 - 设置 Sublime Text 的字体为支持中文的字体。 #### 七、结语 Sublime Text 是一个强大的编辑器,通过安装各种插件可以极大地提高工作效率。希望...

    AI人工智能:54份行业重磅报告汇总

    从压缩包子文件的文件名称来看,"AIΣ║║σ╖ѵÖ║Φâ╜∩╝Ü54Σ╗╜ΦíîΣ╕ÜΘçìτúàµèÑσæèµ▒çµÇ╗"这段看似乱码的名称可能是由于编码问题导致的显示错误,但在实际解压后,每个报告应该...

    大数据平台搭建与运维课件5大数据搭建与运维(项目五).docx

    - **文档格式**:需要一份英文文档,确保其编码为utf-8,以防处理时出现乱码问题。 ### 2. MapReduce程序编写 - **map.py**:这是Map阶段的程序,负责对输入数据进行预处理,如去除空格、转换标点符号,并按照单词...

    supesite7.5 采集 所有CSDN下载的采集工具打包汇总

    - 编码处理:由于中文字符的存在,需要理解字符编码,如GBK、UTF-8等,防止乱码问题。 - 动态加载页面的处理:如果网页使用AJAX动态加载内容,可能需要模拟浏览器行为,如使用Selenium库。 - IP代理和反反爬策略:为...

    Eclipse环境配置_汇总

    在“首选项”-“通用”-“工作区”中,可以设定项目默认编码,避免因编码不一致导致的乱码问题。 4. **插件安装**:Eclipse的强大在于其丰富的插件生态。通过“帮助”-“Eclipse Marketplace”或“安装新软件”功能...

    练习05_要求1

    在这个【项目09】中国姓氏排行研究作业中,我们需要运用Python进行一系列的数据处理和分析。以下是根据题目要求解析的各个知识点: 1. **数据读取与合并**: 使用`pandas`库中的`pd.concat()`函数,将"data01"和...

    2.CSV版本.rar

    在处理不同编码的CSV文件时,需要确保正确指定编码,避免乱码问题。 5. **数据清洗**:在实际应用中,CSV文件可能含有缺失值、异常值或不一致的数据。数据清洗是处理CSV文件的重要步骤,包括填充缺失值、删除重复项...

    2019年全国省市县区划矢量数据shp格式

    解决这个问题的方法可以是利用GIS软件或编程语言(如Python的geopandas库)重新导出数据,确保正确的字符编码。另外,“大家可以用县级再生成市级的”提示了一个可能的解决方案:如果县级数据正确,可以通过汇总县级...

    TXT转Excel

    - **编码问题**:如果TXT文件的编码与系统默认编码不符,可能导致乱码。这时需要确认文件的编码类型,并在Excel导入时选择正确的编码。 - **大数据量**:如果TXT文件非常大,Excel可能会遇到内存限制。这时可以考虑...

    Oracle OLAP10-11.pdf

    尽管文档的部分内容似乎是乱码或者非标准字符,但仍然可以从可识别的信息中提取出关键知识点。 ### 标题:“Oracle OLAP10-11.pdf” 该标题表明文档涵盖了Oracle OLAP技术在版本10到11之间的内容。这意味着文档...

    SQL21自学通(LABVIEW)

    虽然描述部分似乎是乱码,并没有提供有用的信息,但通过目录和部分内容,我们可以提炼出一系列重要的知识点,涵盖了SQL的基础到高级特性。 ### SQL简介与历史 SQL(Structured Query Language)是一种用于管理关系...

Global site tag (gtag.js) - Google Analytics