`

pymongo 中文乱码问题

 
阅读更多

原文地址:

http://windkeepblow.blog.163.com/blog/static/1914883312013988185783/

 

 如题,其实我的问题很简单,就是在写爬虫的时候拿到网页的信息包含类似“\u65b0\u6d6a\u5fae\u535a\u6ce8\u518c”的字符串,实际上这是unicode的中文编码,对应的中文为“新浪微博注册”。其实我就是想找一个函数让这一串东西显示中文而已,没想到百度了白天找到合适的。遇到这种问题千万不要用什么 “python编码” “unicode中文编码” “unicode解码”这样的关键字去搜,一大堆网页出来毫不相关。

      其实这个问题一个函数搞定,如下:

Example 1:

>>> s = r"\u65b0\u6d6a\u5fae\u535a\u6ce8\u518c"

>>> s

'\\u65b0\\u6d6a\\u5fae\\u535a\\u6ce8\\u518c'

>>> print s

\u65b0\u6d6a\u5fae\u535a\u6ce8\u518c

>>> s = s.decode("unicode_escape");     #就是这个函数

>>> print s

新浪微博注册

 

Example 2:

>>> str_ = "Russopho\xe9bic, clichd and just pl\xe9ain stupid."

>>> print str_

Russopho?bic, clichd and just pl?ain stupid.

>>> str_ = str_.decode("unicode_escape")

>>> print str_

Russophoébic, clichd and just pléain stupid.

(这个方法解决了我在插入数据到mongodb时遇到的“bson.errors.InvalidStringData: strings in documents must be valid UTF-8”问题)

 

附上关于这个问题的相关博客链接:http://www.cnblogs.com/yangze/archive/2010/11/16/1878469.html

小结:

以后遇到奇葩问题要想好关键字再搜,不然很有可能一无所获。

分享到:
评论

相关推荐

    pymongo--mongodb python文档

    本教程旨在介绍如何使用PyMongo与MongoDB进行交互。MongoDB是一个面向文档的NoSQL数据库,而PyMongo是其Python语言的官方驱动程序,允许Python程序与MongoDB数据库进行通信。本教程假设您已经下载并安装了MongoDB,...

    pymongo-1.9.tar.gz

    《MongoDB监控与pymongo-1.9在Linux环境中的应用详解》 MongoDB,作为一款高性能、无模式的NoSQL数据库,以其强大的数据处理能力和灵活的数据模型,在大数据时代备受青睐。对于开发者来说,有效地监控MongoDB的运行...

    pymongo的使用和开发

    **Pymongo的使用与开发** Pymongo是Python中用于操作MongoDB数据库的一个强大库。MongoDB是一种文档型数据库,它的设计理念是灵活、可扩展性和高性能。下面我们将深入探讨Pymongo如何帮助我们利用这些特性进行开发...

    linux安装pymongo,命令行可import,代码中报错

    这里,我们主要关注的是一个已知问题,即`pymongo`与`bson`包之间可能存在的冲突。下面将详细介绍这个问题及其解决方案。 `pymongo`是Python的一个库,用于与MongoDB数据库进行交互,它包含了丰富的功能,如连接...

    pymongo驱动程序安装方法

    pymongo驱动程序安装方法,解压pymongo-2.7.2.tar.gz

    pymongo-2.3.tar.gz

    《Python中的MongoDB客户端:pymongo-2.3》 MongoDB,作为一个高效、灵活且可扩展的文档型数据库,被广泛应用于大数据处理和实时分析。Python作为一门易读性强、适合快速开发的编程语言,与MongoDB的结合使得数据...

    Python-FlaskPyMongo支持Flask应用的PyMongo

    **Python-FlaskPyMongo支持Flask应用的PyMongo** Flask-PyMongo是Python Flask框架的一个扩展,它为Flask应用提供了与MongoDB数据库交互的功能。MongoDB是一种流行的NoSQL数据库,以其灵活性、高性能和易用性而受到...

    pymongo-2.7.tar.gz

    pymongo提供了丰富的异常类,如`InvalidOperation`、`AutoReconnect`等,帮助开发者捕获并处理可能出现的问题。 七、安全认证 pymongo 2.7支持MongoDB的认证机制,如SCRAM-SHA-1、MONGODB-CR(旧版)等,确保数据库...

    pymongo使用方法

    **PyMongo库与MongoDB连接** PyMongo是Python的一个库,用于与MongoDB数据库进行交互。MongoDB是一种非关系型数据库(NoSQL),它以键值对的方式存储数据,非常适合处理大量的非结构化或半结构化数据。在Python中,...

    Python库 | pymongo-3.7.0-py3.4-macosx-10.6-intel.egg

    在数据处理方面,pymongo提供了一种流式API,允许在获取大量数据时避免一次性加载到内存中,从而避免内存溢出的问题。此外,它还支持索引管理,使得查询性能得以优化,开发者可以通过`create_index()`方法创建索引,...

    PyPI 官网下载 | pymongo-3.2.1-py3.2-win32.egg

    《PyPI官网下载的pymongo-3.2.1-py3.2-win32.egg:Python数据库操作的基石》 PyPI(Python Package Index)是Python开发者的重要资源库,它提供了丰富的第三方Python库供全球用户下载使用。在这个案例中,我们关注...

    Python库 | pymongo-3.12.1-cp39-cp39-macosx_10_9_x86_64.whl

    《Python库pymongo-3.12.1:连接MongoDB数据库的高效工具》 在Python编程领域,数据处理和存储是至关重要的环节。MongoDB作为一款强大的NoSQL数据库,因其灵活的数据模型和高性能而受到广泛欢迎。而Python与MongoDB...

    Python库 | pymongo-3.3.0-cp27-none-macosx_10_11_intel.whl

    Python库pymongo是连接和操作MongoDB数据库的官方驱动程序。MongoDB是一个流行的NoSQL数据库,以JSON格式存储数据,适用于处理大量非结构化或半结构化数据。pymongo库提供了Python开发者与MongoDB交互所需的所有功能...

    Python库 | pymongo-3.11.0-cp27-cp27m-manylinux1_i686.whl

    《Python库pymongo-3.11.0:连接MongoDB数据库的高效工具》 在Python编程领域,数据管理是至关重要的环节,而MongoDB作为一款强大的文档型数据库,被广泛应用于各种项目中。为了方便Python开发者与MongoDB进行交互...

    Python库 | pymongo-3.0.1.win32-py3.4.exe

    Python库pymongo是连接和操作MongoDB数据库的重要工具,其3.0.1版本的Windows版适用于Python 3.4环境。MongoDB是一个流行的开源、分布式文档型数据库,而pymongo则是Python编程语言与MongoDB之间的桥梁,使得Python...

    Python-模拟pymongo集合对象的小型库用于测试目的

    对于Python开发者来说,`pymongo`是与MongoDB交互的主要库。然而,在进行测试时,直接连接到实际的MongoDB服务器可能不切实际或效率低下,这时就需要模拟工具。`mongomock`就是这样一个小型库,它专门设计用来模拟`...

    pymongo 3.7.1 win_amd64.whl

    Python 要连接 MongoDB 需要 MongoDB 驱动,使用 PyMongo 驱动来连接。

    pymongo-3.12.0-cp38-cp38-win_amd64

    pymongo-3.12.0-cp38-cp38-win_amd64

    PyPI 官网下载 | pymongo-3.9.0-cp27-cp27mu-manylinux1_x86_64.whl

    《PyPI上的pymongo-3.9.0-cp27-cp27mu-manylinux1_x86_64.whl:Python数据库交互的关键工具》 在Python的世界里,PyPI(Python Package Index)是众多开发者获取、分享和安装第三方库的主要平台。这个名为“pymongo...

Global site tag (gtag.js) - Google Analytics