论坛首页 编程语言技术论坛

字符串和编码字串(16进制数)的相互转换

浏览 13750 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2007-05-31  
发现标准的JSON格式比较耗带宽,绝的还是转为UTF8的好

如果要把如下所示的Json编码转换为汉字可以使用

{"A1": "adj. \\u7b2c\\u4e00\\u7b49\\u7684}

def hex2unicode(s):
    return eval('u"""'+s+'"""')

python 代码
  1. >>> a=u"一个问题".encode('utf-8')  
  2. >>> a  
  3. '\xe4\xb8\x80\xe4\xb8\xaa\xe9\x97\xae\xe9\xa2\x98'  
  4. >>> b=repr(a)  
  5. >>> b  
  6. "'\\xe4\\xb8\\x80\\xe4\\xb8\\xaa\\xe9\\x97\\xae\\xe9\\xa2\\x98'"  
  7. >>> print unicode(eval(b),"utf-8")  
  8. 一个问题  
   发表时间:2007-06-01  
http://blog.csdn.net/mayflowers/archive/2007/04/18/1568852.aspx

看下这篇文章,关于python的中文,讲得很详细.

PS:把文章加到python圈子吧.
0 请登录后投票
   发表时间:2007-06-01  
谢谢提示
0 请登录后投票
   发表时间:2007-06-01  
汉字UTF16比UTF8更省。平均每个汉字UTF8占3字节,UTF16只有2字节。
0 请登录后投票
   发表时间:2007-06-01  
找到一篇文章
http://en.wikipedia.org/wiki/Comparison_of_Unicode_encodings
0 请登录后投票
论坛首页 编程语言技术版

跳转论坛:
Global site tag (gtag.js) - Google Analytics