- 浏览: 149292 次
- 性别:
- 来自: 北京
文章分类
最新评论
def detect_encode require 'hpricot' require 'open-uri' @doc = open("http://www.baidu.com") { |f| Hpricot(f) } guess_res = NKF.guess(@doc.to_s) case guess_res when NKF::SJIS @encode = "Shift_JIS" when NKF::EUC @encode = "EUC" when NKF::JIS @encode = "JIS" when NKF::UTF8 @encode = "UTF-8" end pp @encode # 取得编码 end
编码转换
def self.convert_char_encoding(encoding, data) begin case encoding when 'jis' return Kconv.tojis(data) when 'Shfit-JIS' return Kconv.tosjis(data) when 'EUC-JP' return Kconv.toeuc(data) when 'UTF-8' return Kconv.toutf8(data) else exit(1) end rescue SystemExit => e p 'set invalid charcter encoding or nil.' exit(0) end end
发表评论
-
Google App Engine and others
2010-09-15 11:27 823有用的技术文章 先记载 有空 研究下 さくっとRails ... -
基于jquery和mini_magick的图片裁剪
2010-09-15 11:07 1474引用网址 http://duyouhua1214.iteye ... -
ruby gem相关命令使用
2010-08-26 12:45 1603gem相关命令使用 1.显示gem的帮助和版本 gem – ... -
深入理解alias, alias_method和alias_method_chain
2010-08-06 17:14 971http://blackanger.blog.51cto.co ... -
Rails 3 特点
2010-08-06 16:38 923真的想留下来 http://railslove.com/w ... -
Fix N+1 Queries
2010-08-06 16:16 917http://rails-bestpractices.com/ ... -
query-reviewer sql explain and review in the page
2010-08-06 12:20 1335引用网址 http://github.com/dsboulde ... -
request-log-analyzer log分析工具
2010-08-06 12:03 1621参考网址: http://github.com/wvanber ... -
IE7 Bug导致Rails Session保存失败
2010-08-06 10:56 976http://www.letrails.cn/archives ... -
Rails保存记录而不更新时间戳
2010-08-06 10:54 1356引用地址: http://www.letrails.cn/a ... -
how to generate qrcode on ror
2010-02-04 16:27 8751. In your rails project, in ... -
rmagick ror 上 安装
2009-11-18 09:06 860rmgick 安装规范 ror很多人现在在用了,但是发现 ... -
Update Rails to 2.2.2 (Rails 2.2.2)
2009-03-08 14:53 990gem install -v=2.2.2 rails Suc ... -
Use helpers in controllers or models
2009-01-19 16:22 930引用http://snipplr.com/view/2505/ ... -
open-flash-chart
2008-11-07 14:07 2437http://pullmonkey.com/2008/7/23 ... -
rake db:migrate
2008-11-07 11:58 1281【ruby on rails】rake db:migrate ... -
rss maker
2008-11-07 11:43 1095http://gdgdlog.net/log/show/130 ... -
acts_as_authenticated
2008-11-07 11:35 1123ruby script/plugin install act ... -
validates
2008-11-07 11:24 1071先週ずっとインフルエンザでダウンしてました。 今日はvail ... -
rails で model の変更を監視するプラグイン
2008-11-07 11:12 1367acts_as_modified モデルの変更を監視して、各 ...
相关推荐
字符编码检测和转换 附件中:FileEncodeDetector.java 此文件可以检测指定文件的编码格式 public static String getFileEncode(File file) {...} 附件中:FileCharsetConverter.java 此文件可以实现两个编码的相互...
本项目的目的是对大量文本文件进行快速编码检测和转换,以协助mnbvc语料库项目的数据清理工作
本项目旨在对大量文本文件进行快速编码检测和转换以辅助mnbvc语料集项目的数据清洗工作_charset_mnbvc
其次,`FileCharsetDetector.java`很可能是实现文件编码检测和转换的Java源代码文件。在这个类中,开发者可能定义了方法来读取文件,使用`chardet.jar`检测文件的编码,然后将文件内容转换为期望的编码,如UTF-8。...
通过研究源码,可以深入理解字符编码的工作原理,以及如何利用Java语言实现编码检测和转换。同时,这也为自定义或扩展编码转换工具提供了可能,开发者可以根据实际需求进行定制化开发。 总结来说,...
EncodingMixToUtf8是文件编码检测和转换为UTF-8命令行工具。内容为什么? Visual Studio 2015 RTM在处理以非UTF-8编码方式编码的源文件中。 因此,这是一个快速解决方案,可以将源文件转换为UTF-8的工具。 我已将其...
在`code.php`中,我们可以看到关键的函数和逻辑,比如文件遍历、编码检测和转换的实现。开发者可能需要了解PHP的基础语法,如文件操作函数(`fopen()`, `fread()`, `fwrite()`, `fclose()`),字符串处理函数(`mb_...
3. `lib`目录:可能包含项目所依赖的第三方库或框架,这些库可能用于文件操作、编码检测和转换等功能。 4. `config`目录:配置文件,可能包含转换规则、默认编码设置等信息。 5. `tests`目录:测试用例,用于验证...
Java提供的标准库支持多种编码转换,但直接操作起来可能会比较复杂,因此这类工具类的出现,简化了编码检测和转换的过程。 在Java中,`java.nio.charset`包提供了对字符编码的支持,如`Charset`类用于表示字符集,`...
之后,工具会自动执行编码检测和转换过程,而用户可以在“说明.htm”中找到关于如何查看转换结果和解决可能出现的问题的指导。 总结而言,“大批量文件编码转换 v1.0.zip”是一个专门针对文件编码转换需求设计的...
4. `FileEncoding.cs`:这个文件可能包含了对文件编码检测和转换的相关方法,是实现批量转换的关键部分。 5. `myPressBar.Designer.cs`和`myPressBar.cs`:可能是自定义进度条组件的代码,用于显示转换过程的进度。 ...
在学习和使用这个源码时,你可以了解到如何在易语言中处理字符串,以及如何实现编码检测和转换的逻辑。这对于开发跨平台或者需要处理多源数据的应用来说是非常有价值的。同时,这也可以帮助你深入理解字符编码原理,...
这个工具能够自动检测源文件的编码类型,并将其转换为指定的统一编码格式,如UTF-8,以确保代码的正确性和一致性。 在Java编程中,字符编码是非常关键的,因为不同的编码标准会影响字符的表示方式。GBK是中国大陆...
这个转换类通常包含一系列方法,用于处理各种编码转换的细节,如错误处理、异常检测以及对特殊字符的支持。 描述中的"解决iconv无法完美转换的问题"指出,这个类可能采用了不同的策略或算法来避免`iconv`函数在某些...
这个工具首先遍历指定的文件或文件夹,对每个文件应用编码检测算法。确定了每个文件的原始编码后,它会按照用户设定的目标编码进行转换。转换过程中可能会涉及到字节流的读取、解码、编码和重新写入等步骤,确保...
"EncodingConverter-1.0"可能是一款基础的文件编码转换工具,版本号1.0表示这是其初始版本,可能包含了基本的文件读取、编码识别、转换和保存功能。在使用这类工具时,应确保了解文件的原始编码和需要转换的目标编码...