`
ouspec
  • 浏览: 882487 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

ruby GB2312和UTF-8编码转换

阅读更多
最近在做RSS导入功能,用了rubyforge上的feedtool,还不错。

就是代码转换老是报错:Iconv::IllegalSequence

后来发现原因是网络编码很混乱,一定要加上IGNORE参数,就好了。记录一下。

Iconv.iconv("UTF-8//IGNORE","GB2312//IGNORE",text)
分享到:
评论
3 楼 sevk 2011-01-30  
把utf8编码的中文字符串最后一个字切成乱码
可以这样解决:

如果 s[-3,1].between?("\xe0","\xef")
则 切向前一个字节
2 楼 zy13 2007-07-23  

用rss的方式只能导入最近的一些文章
那么如何通过博客的html地址导入博客全部文章呢?
1 楼 jefferson 2007-01-11  
ruby编码有点不爽,我以前玩过一小段ruby的小例子,遇到utf8编码的问题,由于没有使用unicode,truncate方法在切割字符串时,有可能会把utf8编码的中文字符串最后一个字切成乱码
后来我在网上找到一些解决办法:在 environment.rb 裡面加上
$KCODE = 'u'
require_dependency 'jcode'
好像就可以支持utf8了

相关推荐

    Ruby 与编码

    Ruby 与编码 常见问题 * 乱码的问题 * Ruby 中 Unable to convert "\x89" from ASCII-8BIT to UTF8 *Incompatible character encodings: ASCII- 8BIT and UTF-8

    rails3.1.0解决数据库取出来的信息编码为utf-8

    标题 "rails3.1.0解决数据库取出来的信息编码为...总之,解决Rails应用中的编码问题需要对数据库配置、模型、迁移、视图和前端资源都有深入理解,通过上述步骤,可以确保数据在存储和显示过程中保持正确的UTF-8编码。

    检测并转换C++、Java、JavaScript、PHP和Ruby中的Zawgyi-One字体编码___下载.zip

    首先,你需要将Zawgyi-One文本转换为UTF-8,然后使用`icu4c`的Unicode转换功能进行检测和转换。 2. **Java**: Java内置了对多种字符编码的支持。可以使用`java.nio.charset.Charset`类来检测和转换编码。先尝试将...

    ruby编码转换

    这意味着如果原字符串是用UTF-8编码的,而你将其编码信息改为GBK,那么当试图按照GBK解码时,可能会出现乱码。 #### 三、使用`encode`方法进行编码转换 在Ruby 1.9中,提供了`encode`方法来实现真正的编码转换。`...

    编码之间的转换

    在上述Ruby代码中,我们创建了一个`Iconv`对象,将GBK编码的字符串转换为UTF-8编码。 编码转换在处理多语言网站、电子邮件、数据库存储等场景中至关重要。例如,如果一个网站需要兼容不同地区的用户,就需要对用户...

    国际化 - jcode库和$KCODE

    在Ruby中,处理UTF-8编码通常非常简单,因为它是Ruby默认的内部字符串编码。然而,当处理其他编码的数据时,我们需要确保正确的转换以避免乱码问题。 为了实现国际化,开发者通常会采用I18N(国际化的缩写,取自...

    ruby-ruby的json实现-优质项目.zip

    默认情况下,Ruby使用UTF-8编码。 以上就是Ruby中处理JSON的基本知识点。在实际项目中,理解这些概念并熟练运用将有助于更有效地处理数据交换,特别是在与API交互、存储和恢复数据时。在提供的压缩包文件“ruby_...

    Ruby-Ruby库和CLI命令可视化终端中的各种Unicode和ASCII编码

    你还需要设置正确的终端编码,通常是UTF-8,这可以通过修改终端配置或环境变量(例如在bash中设置`LC_ALL`和`LANG`)来完成。 Ruby标准库中的`String`类包含了处理编码的方法,如`encode`用于编码转换,`force_...

    Rails的中文乱码问题

    解决Rails的中文乱码问题,需要对整个应用的编码环境进行统一和检查,确保每个环节都支持和识别UTF-8编码。同时,学习和理解Ruby的字符串处理机制以及Rails的编码设置是至关重要的。通过调试和测试,可以逐步定位并...

    Rails中上传文件保存中文文件名乱码

    除了编码转换之外,还需要确保文件存储路径也支持UTF-8编码。在Linux系统中,大多数现代文件系统如EXT4、XFS等都支持UTF-8,但在旧的系统或某些特殊配置下,可能需要检查文件系统的编码设置。 另外,还可以在数据库...

    Ruby-Unicode字符串调试帮助

    Ruby 1.9及更高版本默认使用UTF-8编码,这意味着所有字符串都是Unicode字符串。Ruby中的String类提供了许多内置方法来处理Unicode字符,如`codepoints`, `chars`, 和 `each_char`,它们可以帮助开发者遍历和操作字符...

    ruby基础教程(第四版)第19章 encoding编码1

    例如,如果脚本编码为UTF-8,则字符串和正则表达式也将被解释为UTF-8。 为了兼容编辑器如Emacs和Vim,可以在脚本开头添加特定的**魔法注释**来指定脚本的编码。在Ruby 2.0之后,如果没有指定魔法注释,默认编码为...

    Rdoc支持中文的解决方案

    如果`option.rb`没有处理中文编码的逻辑,我们需要添加或修改相关代码,确保它能识别并处理UTF-8编码。 解决中文支持问题的一种方法是检查`RDoc::Options`类,这是处理命令行选项的中心。我们需要确保当用户输入`--...

    StringEncodings.jl:使用iconv在Julia中进行字符串编码转换

    使用这个库,我们可以轻松地将UTF-8编码的字符串转换为GBK,或者将GBK编码的数据转换为Unicode。这对于处理来自不同来源,编码不统一的数据尤其有帮助。 下面是一些使用`StringEncodings.jl`进行字符串编码转换的...

    Ruby在cmd下中文显示乱码以及不支持OpenSSL的问题解决

    - 在Ruby文件的顶部添加 `# encoding: UTF-8` 的注释,告诉Ruby解析器使用UTF-8编码加载文件。 ```ruby # encoding: UTF-8 puts "你好,世界!" ``` - 这种方法适用于包含中文字符的Ruby脚本文件,确保脚本中的...

    json:Ruby的JSON实现

    Ruby的JSON实现 描述 这是根据RFC 7159 的JSON规范的实现。 从版本1.0.0开始,将提供两个变体: ... 要对未经UTF-8编码的原始二进制字符串进行编码,请使用String的to_json_raw_object方法(该方法生成一个

Global site tag (gtag.js) - Google Analytics