`
holin
  • 浏览: 17793 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

ruby GB2312 URL encode

阅读更多

class String
  def utf8_to_gb2312
    encode_convert(self, "gb2312", "UTF-8")
  end 

  private
  def encode_convert(s, to, from)
    require 'iconv'
    begin
      converter = Iconv.new(to, from)
      converter.iconv(s)
    rescue
      s
    end
  end
end

s = "搞笑".utf8_to_gb2312
require 'uri'
puts URI.escape(s)
"http://index.baidu.com/main/word.php?word=%B8%E3%D0%A6"

 

首发:http://www.holin.info/posts/4d6d0374ff1f012d4d000002

分享到:
评论
2 楼 hsiss 2011-03-21  
encode_convert应该是类方法吧
1 楼 sunsmooth 2011-03-04  
require 'iconv'

Iconv.iconv("GB2312//IGNORE","UTF-8",s)

相关推荐

    utf-8 互转 gb2312 转码

    s_utf8 = s_gb2312.encode('gb2312').decode('utf-8') ``` 需要注意的是,不是所有UTF-8或GB2312编码的字符串都能相互转换,因为GB2312编码范围有限,不能表示UTF-8中的所有字符。在实际操作中,我们需要先检查输入...

    encodeToGb2312.js 汉字转GB2312格式

    js将汉字转换为GB2312编码格式,用法:引用此js,调用‘’encodeToGb2312(str)‘’即可。

    unicode与GB18030(GB2312,GBK) 转换码表

    例如,通过`codecs.decode()`和`codecs.encode()`方法,可以实现GB18030到Unicode,或者Unicode到GB18030的转换。 理解这些编码标准和转换过程对于处理中文文本的软件开发者来说至关重要,尤其是当涉及到跨平台、跨...

    js gb2312编码

    总之,理解并正确使用JavaScript中的GB2312编码、mailto:链接中的汉字编码以及百度URL编码,对于开发涉及中文内容的Web应用至关重要。通过适当的编码方法,可以确保信息在不同系统和平台间准确无误地传递。

    ASCII,GB2312等格式转换

    多种格式转换, 抱括UrlEncode,UrlDecode,HtmlEncode,HtmlDecode,MD5(16位),MD5(32位),简繁体,GB2312,BIG5

    gb2312 汉字集合-6376个汉字

    GB2312,全称为“汉字国标交换码”,是中国大陆在1980年制定的一套汉字编码标准,是最早的简体中文字符集。它在计算机领域中扮演着重要的角色,为早期的中文信息处理提供了基础。GB2312编码标准包括了6763个常用汉字...

    utf8、gb2312编码互转

    utf8_text = gb2312_text.encode('gb2312').decode('utf-8') ``` 在其他编程语言中,如Java或C#,也有相应的API可以实现这个功能。此外,还有许多图形界面工具可以方便地进行文件的编码转换,比如Notepad++、...

    UNICODE和GB2312对应关系表

    ### UNICODE与GB2312编码对照解析 #### 前言 在计算机科学领域,字符编码是一项基础而重要的技术,它确保了不同系统、语言之间的文本数据能够被正确识别和处理。其中,UNICODE(统一码)和GB2312是中国乃至全球...

    UTF-8GB2312互转

    UTF-8和GB2312是两种常见的字符编码格式,它们各自有其特点和适用场景。本篇文章将详细探讨UTF-8与GB2312之间的转换,以及如何解决在数据传输或程序处理中文参数时可能出现的乱码问题。 首先,UTF-8是一种广泛使用...

    GB2312-UTF-8编码批量转换

    GBK是在GB2312基础上的扩展,兼容GB2312,增加了更多的汉字和一些其他语言的字符,总共包含20902个汉字以及符号,仍然是双字节编码,旨在解决GB2312不能满足大量汉字需求的问题。 UTF-8(Unicode Transformation ...

    编码转换小工具(UTF-8转GB2312)

    这个“编码转换小工具”就是为了解决这样的问题而创建的,它专注于将UTF-8编码的文件转换为GB2312编码。让我们深入探讨一下编码的概念、UTF-8和GB2312的区别,以及编码转换的重要性。 首先,字符编码是计算机表示和...

    网址编码解码,jQuery版Url.encode,Url.decode,Url.parse.rar

    网址编码解码,jQuery版Url.encode,Url.decode,Url.parse,一个来自jQuery的URL Decoder解码、编码插件,为你的URL安全定义一道安全防线,示例文件本身就是一个值得学习的实例,自带的示例将告诉你如何使用这款URL...

    GB2312UTF-8字符互转

    GB2312(全称为“汉字编码字符集国家标准”,又称GB2312-80)是中国大陆早期制定的一套汉字编码标准,主要用于简体中文。它包含了6763个常用汉字和682个非汉字图形符号,采用双字节编码,每个字符占用两个字节。GB...

    GB2312转换UTF_8编码字符_Dll_gb_

    在"GB2312转换UTF-8编码字符_Dll_gb_"这个主题中,我们讨论的是如何将使用GB2312编码的字符转换成UTF-8编码。这通常涉及到编程语言中的字符串操作,例如在Python中可以使用`encode`和`decode`方法,或者使用第三方库...

    URL encode 与 URL decode 的C语言实现.zip

    为了解决这个问题,URL编码(URL encode)和解码(URL decode)机制应运而生。这个压缩包文件"URL encode 与 URL decode 的C语言实现.zip"显然提供了用C语言编写的函数,用于对URL进行编码和解码操作。 URL编码是一...

    gb2312toutf8

    f.write(content.decode('gb2312').encode('utf-8')) ``` 在实际应用中,还可能涉及到批量转换、流式处理或者嵌入到其他应用程序中的场景。因此,理解各种字符编码的本质和转换机制对于开发者来说至关重要,尤其是...

    gb2312到utf8的转换

    utf8_text = gb2312_text.encode('gb2312').decode('utf-8') ``` 3. **命令行工具:** `iconv`是一个命令行工具,可以用于不同编码间的转换,如在Linux或MacOS上: ```bash iconv -f gb2312 -t utf8 input.txt -...

    KindEditor ASP版后台编辑器UTF-8和GB2312均可用

    其核心优势在于既能适应UTF-8编码,也能应对GB2312编码,这意味着无论是在国际化的网站环境中,还是在中国国内的简体中文环境下,KindEditor都能无缝地工作。 1. **编辑器特性**: - **富文本功能**:KindEditor...

    UTF-8编码转BIG5、gb2312

    例如,在Python中,可以使用`encode`和`decode`方法来实现编码间的转换,如`str.encode('utf-8').decode('gb2312')`。 在实际操作中,需要注意的是,转换过程可能会丢失一些无法映射到目标编码中的字符。因此,确保...

    JS+小程序 汉字与gbk2312编码互转

    例:中 D6D0 国 B9FA http://www.mytju.com/classcode/tools/encode_gb2312.asp 开发小程序蓝牙时,发送中文,硬件蓝牙要求gbk2312转码,我费了九牛二虎之力,终于找到简单有效的方法

Global site tag (gtag.js) - Google Analytics