`

编码检测 和 转换

阅读更多
def detect_encode
require 'hpricot'
require 'open-uri'
 @doc = open("http://www.baidu.com") { |f| Hpricot(f) }
     guess_res = NKF.guess(@doc.to_s)
     case guess_res
     when NKF::SJIS
       @encode = "Shift_JIS"
     when NKF::EUC
       @encode = "EUC"
     when NKF::JIS
       @encode = "JIS"
     when NKF::UTF8
       @encode = "UTF-8"
     end
  pp @encode # 取得编码
end

编码转换
def self.convert_char_encoding(encoding, data)
   begin
     case encoding
       when 'jis'
         return Kconv.tojis(data)
       when 'Shfit-JIS'
         return Kconv.tosjis(data)
       when 'EUC-JP'
         return Kconv.toeuc(data)
       when 'UTF-8'
         return Kconv.toutf8(data)
       else
         exit(1)
     end
   rescue SystemExit => e
     p 'set invalid charcter encoding or nil.'
     exit(0)
   end
end
分享到:
评论

相关推荐

    java文件字符编码检测和转换

    字符编码检测和转换 附件中:FileEncodeDetector.java 此文件可以检测指定文件的编码格式 public static String getFileEncode(File file) {...} 附件中:FileCharsetConverter.java 此文件可以实现两个编码的相互...

    本项目的目的是对大量文本文件进行快速编码检测和转换,以协助mnbvc语料库项目的数据清理工作.zip

    本项目的目的是对大量文本文件进行快速编码检测和转换,以协助mnbvc语料库项目的数据清理工作

    本项目旨在对大量文本文件进行快速编码检测和转换以辅助mnbvc语料集项目的数据清洗工作_charset_mnbvc.zip

    本项目旨在对大量文本文件进行快速编码检测和转换以辅助mnbvc语料集项目的数据清洗工作_charset_mnbvc

    java 文件编码转换

    其次,`FileCharsetDetector.java`很可能是实现文件编码检测和转换的Java源代码文件。在这个类中,开发者可能定义了方法来读取文件,使用`chardet.jar`检测文件的编码,然后将文件内容转换为期望的编码,如UTF-8。...

    文件任意编码转换工具 ExecuteConvertFile

    通过研究源码,可以深入理解字符编码的工作原理,以及如何利用Java语言实现编码检测和转换。同时,这也为自定义或扩展编码转换工具提供了可能,开发者可以根据实际需求进行定制化开发。 总结来说,...

    EncodingMixToUtf8:文件编码检测和转换工具

    EncodingMixToUtf8是文件编码检测和转换为UTF-8命令行工具。内容为什么? Visual Studio 2015 RTM在处理以非UTF-8编码方式编码的源文件中。 因此,这是一个快速解决方案,可以将源文件转换为UTF-8的工具。 我已将其...

    php大批量文件编码转换 v1.0

    在`code.php`中,我们可以看到关键的函数和逻辑,比如文件遍历、编码检测和转换的实现。开发者可能需要了解PHP的基础语法,如文件操作函数(`fopen()`, `fread()`, `fwrite()`, `fclose()`),字符串处理函数(`mb_...

    源文件编码格式批量转换工具

    3. `lib`目录:可能包含项目所依赖的第三方库或框架,这些库可能用于文件操作、编码检测和转换等功能。 4. `config`目录:配置文件,可能包含转换规则、默认编码设置等信息。 5. `tests`目录:测试用例,用于验证...

    java检测编码工具类

    Java提供的标准库支持多种编码转换,但直接操作起来可能会比较复杂,因此这类工具类的出现,简化了编码检测和转换的过程。 在Java中,`java.nio.charset`包提供了对字符编码的支持,如`Charset`类用于表示字符集,`...

    大批量文件编码转换 v1.0.zip

    之后,工具会自动执行编码检测和转换过程,而用户可以在“说明.htm”中找到关于如何查看转换结果和解决可能出现的问题的指导。 总结而言,“大批量文件编码转换 v1.0.zip”是一个专门针对文件编码转换需求设计的...

    文件编码批量转换器

    4. `FileEncoding.cs`:这个文件可能包含了对文件编码检测和转换的相关方法,是实现批量转换的关键部分。 5. `myPressBar.Designer.cs`和`myPressBar.cs`:可能是自定义进度条组件的代码,用于显示转换过程的进度。 ...

    易语言源码易语言下载地址编码转换源码.rar

    在学习和使用这个源码时,你可以了解到如何在易语言中处理字符串,以及如何实现编码检测和转换的逻辑。这对于开发跨平台或者需要处理多源数据的应用来说是非常有价值的。同时,这也可以帮助你深入理解字符编码原理,...

    java源文件编码转换工具加源码(自动检测源文件编码类型)

    这个工具能够自动检测源文件的编码类型,并将其转换为指定的统一编码格式,如UTF-8,以确保代码的正确性和一致性。 在Java编程中,字符编码是非常关键的,因为不同的编码标准会影响字符的表示方式。GBK是中国大陆...

    php 编码相互转换类(gbk转换utf8)

    这个转换类通常包含一系列方法,用于处理各种编码转换的细节,如错误处理、异常检测以及对特殊字符的支持。 描述中的"解决iconv无法完美转换的问题"指出,这个类可能采用了不同的策略或算法来避免`iconv`函数在某些...

    批量编码转化工具(实现文件编码的自动检测)

    这个工具首先遍历指定的文件或文件夹,对每个文件应用编码检测算法。确定了每个文件的原始编码后,它会按照用户设定的目标编码进行转换。转换过程中可能会涉及到字节流的读取、解码、编码和重新写入等步骤,确保...

    文件编码转换器

    "EncodingConverter-1.0"可能是一款基础的文件编码转换工具,版本号1.0表示这是其初始版本,可能包含了基本的文件读取、编码识别、转换和保存功能。在使用这类工具时,应确保了解文件的原始编码和需要转换的目标编码...

Global site tag (gtag.js) - Google Analytics