encoding in ruby and rails

全部 Ruby Python PHP Flash C++ .net Rails Flex C C# Django

浏览 2468 次

锁定老帖子主题：encoding in ruby and rails 精华帖 (0) :: 良好帖 (1) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
andyhu1007 等级: 性别: 文章: 67 积分: 780 来自: 北京	发表时间：2008-09-10 相关推荐: 诗歌rails之encoding in ruby and rails [ruby on rails] docker中使用rails Ruby on Rails - 新建项目，数据库配置(Mysql) Centos 7 + Ruby on Rails CVE-2019-5418 Ruby on Rails 路径穿越与任意文件读取漏洞更多相关推荐 Ruby 项目中有一个csv文件因为是latin1 encoded，所以解析就会出现错误。解决方案：可以通过Iconv.iconv("UTF-8", "latin1", file.read)把stream转化成UTF-8格式（rails的默认编码是UTF-8）。局限：当然此种方法的局限是限定了文件的编码只能是latin1的时候才能解析正确。当然，如果没有特殊字符，其他的一些ASCII字符(single byte character)在两种编码之间会转换正确。但一当文件中有其它编码的特殊字符，那就歇菜了。更进一步：使用gussing工具猜编码吧，比如下面这段 File.open(tmp_file, 'w') do \|f\| input = file.read charset = CMess::GuessEncoding::Automatic.guess(input) f.write(Iconv.iconv('UTF-8', charset, input)) end 以上问题详见此讨论顺便说下ruby的encoding ： 1. In ruby <= 1.8, strings were effectively just byte streams. Those bytes would often contain text in one encoding or another, but there was no formal way to record exactly which one (if any; binary data has none). All the default methods assumed single byte encoding (such as US-ASCII), so behaviour was odd when the encoding was multibyte (such as UTF8). 2. In ruby 1.9: str.encode!("UTF-8") File.open("file", "r:UTF-8") {\|f\| ...........} 声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

feeling3_4 等级: 初级会员性别: 文章: 10 积分: 30 来自: 北京	发表时间：2008-09-11 我gem install 了 cmess，为什么每次require，都说找不到这个东西呢？
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → 编程语言技术版

跳转论坛: