`

关于encoding utf-8

阅读更多
一 gem解决方案
https://github.com/m-ryan/magic_encoding
二,rake task 解决方案

desc "Manage the encoding header of Ruby files"
task :check_encoding_headers => :environment do
  files = Array.new
  ["*.rb", "*.rake"].each do |extension|
    files.concat(Dir[ File.join(Dir.getwd.split(/\\/), "**", extension) ])
  end
 
  files.each do |file|
    content = File.read(file)
    next if content[0..16] == "# coding: UTF-8\n\n"
     
    ["\n\n", "\n"].each do |file_end|
      content = content.gsub(/(# encoding: UTF-8#{file_end})|(# coding: UTF-8#{file_end})|(# -*- coding: UTF-8 -*-#{file_end})/i, "")
    end
 
    new_file = File.open(file, "w")
    new_file.write("# coding: UTF-8\n\n"+content)
    new_file.close
  end
end



三,日常解决方案
#encoding: utf-8

#config/application.rb
config.encoding = "utf-8"

有区别,一个内容,一个源代码

试过,没用的解决方案
#config/application.rb
#我试试没管用啊
Encoding.default_external = Encoding::UTF_8
Encoding.default_internal = Encoding::UTF_8


#solution is to use BOM http://www.w3.org/International/questions/qa-byte-order-mark or put

# encoding: UTF-8

or

# coding: UTF-8

#on top of files in utf-8.

#To set UTF-8 globally, you can put

config.encoding = "utf-8"

#in your config/application.rb which is equivalent to

Encoding.default_external = Encoding::UTF_8
Encoding.default_internal = Encoding::UTF_8

#which in turn is the equivalent to putting:

# encoding: UTF-8




-
分享到:
评论

相关推荐

    C# 生成xml文件,编码为utf-8方法

    最后,使用 MemoryStream 对象的 ToArray 方法将 XML 数据转换为 byte 数组,然后使用 Encoding.UTF8.GetString 方法将其转换为 UTF-8 编码的字符串。 在上面的代码中,首先创建了一个 MemoryStream 对象,然后创建...

    gb2312,utf-8,utf-8-bom等编码格式的互相转换

    UTF-8-BOM,全称是“UTF-8 Byte Order Mark”,它在UTF-8编码的文件开头添加了一个特殊的字节序列(0xEF, 0xBB, 0xBF)来标识该文件使用的是UTF-8编码。BOM主要用于帮助软件识别文件的编码,但并非所有UTF-8编码的...

    PB9转换utf-8例子

    标题中的“PB9转换utf-8例子”指的是在PowerBuilder 9(PB9)环境下将数据从非UTF-8编码转换为UTF-8编码的一种解决方案。由于PB9本身不直接支持这种转换,开发者通常需要利用外部库或者特定的编程技巧来实现这个功能...

    解决Invalid byte 1 of 1-byte UTF-8 sequence

    标题 "解决Invalid byte 1 of 1-byte UTF-8 sequence" 涉及的问题是关于字符编码不匹配引发的错误,通常在处理包含非ASCII字符的文本文件时出现。UTF-8是一种广泛使用的字符编码标准,能表示世界上大部分语言的字符...

    字符编码转换类,支持 ANSI、Unicode、Unicode big endian、UTF-8、UTF-8+Bom互相转换

    UTF-8的特殊之处在于它包含一个字节顺序标记(BOM),即UTF-8+BOM,但大多数情况下,UTF-8无BOM更常见。 在PHP中,进行字符编码转换可以使用内置函数,如`mb_convert_encoding()`,这个函数可以将字符串从一种编码...

    Java解决UTF-8的BOM问题

    在Java编程中,UTF-8编码是一个非常常见且广泛使用的字符编码格式,它能支持全球大部分语言的字符表示。然而,UTF-8有一个特殊特性,那就是它可以带有Byte Order Mark(BOM),这是一个特殊的字节序列,用于标识数据...

    utf-8 互转 gb2312 转码

    with open('output.txt', 'w', encoding='utf-8') as f_out: f_out.write(content) ``` 在这个过程中,`'input.txt'`文件以GB2312编码读取,内容被解码为Unicode,然后以UTF-8编码写入到`'output.txt'`文件中。 ...

    C#写的 GBK GB2312 UTF-8转换

    在这个例子中,`Encoding.GetEncoding("GBK")`获取了GBK编码器,`GetBytes()`方法将GBK编码的字符串转换为字节数组,然后`Encoding.UTF8.GetString()`将这个字节数组还原为UTF-8编码的字符串。 对于文件的编码转换...

    UTF-8编码转化(Visual Basic)

    如果需要将这些字符串转换为UTF-8,可以使用`Encoding`类的`GetString`和`GetBytes`方法: ```vbnet Dim utf8Bytes As Byte() = System.Text.Encoding.UTF8.GetBytes("Your string here.") Dim utf8String As ...

    UTF-8_GB2312-Src

    《UTF-8与GB2312编码转换在电话本管理中的应用》 在数字化信息时代,字符编码标准是确保不同设备和系统间数据交换的关键因素。本文将深入探讨两个常见的中文字符编码——UTF-8和GB2312,并以三星手机电话本为例,...

    PB字符串转XML文件,解决PB12.5创建UTF-8文件BOM问题(powerbuilder 12.5)

    解决PB创建UTF-8文件带BOM问题; 2.字段串直接生成XML文件。 由于项目需要,需要字符串转为XML文件,直接用Fileopen进行EncodingUTF8编码后,发现文件实际为UTF-8 BOM编码 问度娘发现有相同问题,但解决方式是利用...

    脚本可以批量去除XML文件中的<?xml version=“1.0“ encoding=“utf-8“?>

    脚本可以批量去除XML文件中的“1.0“ encoding=“utf-8“?>

    Source Insight 3支持Utf-8

    对于处理各种编码格式的源代码文件,Source Insight 3表现出了良好的兼容性,其中包括UTF-8编码。 UTF-8是一种广泛使用的Unicode字符编码方案,它可以表示Unicode字符集中的所有字符,覆盖了全球大部分语言的文字。...

    java 编码 UTF-8、ISO-8859-1、GBK

    可以通过 `-Dfile.encoding=UTF-8` 参数来设定JVM的默认编码。 对于JSP,由于它涉及到网页的显示,处理中文字符会更复杂。当从数据库读取数据时,需要根据数据库的编码进行适当的转换。例如,如果数据库是UTF-8,...

    xml.rar_UTF XML_UTF-8编码_utf_utf-8_xml utf-8

    在XML文档的开头,通常会有一个类似于`<?xml version="1.0" encoding="UTF-8"?>`的声明,这里的"UTF-8"就是指明了文档的字符编码方式。如果缺少这个声明或者声明错误,解析器可能无法正确解析包含非ASCII字符的XML...

    winForm中进行Utf-8 及 GB2312转换

    在winForm中进行Utf-8和GB2312之间的转换,主要涉及到.NET Framework中的System.Text命名空间,特别是Encoding类。这个类提供了多种编码的实例,如Encoding.UTF8和Encoding.GetEncoding("GB2312"),用于进行编码和...

    eclipse默认编码GBK改为UTF-8

    - 对于已存在的项目,右键点击项目 -> `Properties` -> `Resource`,在`Text file encoding`中选择`UTF-8`。 - 如果项目中有特定文件需要设置特定编码,可以通过右键点击文件 -> `Properties` -> `Resource` 来...

    Eclipse项目的GBK编码转为UTF-8插件

    Eclipse是一款广泛使用的Java开发集成环境,而GBK和UTF-8是两种常见的字符编码格式。在处理源代码时,编码的选择至关重要,因为它直接影响到字符的正确显示和处理。GBK编码是中国大陆广泛使用的汉字编码标准,它包含...

    批量将Java源代码文件的编码从GBK转为UTF-8

    老项目采用GBK编码格式,而新项目采用的UTF-8编码格式,如果直接把Java源代码复制到Eclipse中所有的中文信息会出现乱码。所以写了个小的方法类,将java文件的编码格式从GBK转UTF-8

    JDK中文转utf-8编码

    例如 D:\jdk1.5.0_06\bin>native2ascii.exe -encoding utf8 abc.txt bcd.txt,可以将 abc.txt 文件中的中文字符转换为 utf-8 编码,并将结果保存在 bcd.txt 文件中。 dos 命令是一个重要的命令,可以用来进入特定的...

Global site tag (gtag.js) - Google Analytics