`
trace
  • 浏览: 125548 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Ruby UTF-8 String to Hex String

阅读更多
今天用hbase的Ruby thrift api,发现它对utf-8的支持并不好。比如我要插入一条记录,值为“中国”,我不能直接写成“中国”,而是需要将”中国“转换为”\xE4\xB8\xAD\xE5\x9B\xBD“。同理,我取数据时取到的就是“\xE4\xB8\xAD\xE5\x9B\xBD”(字面值),需要想办法转换成“中国”。

将一个UTF-8编码的字符串转换为十六进制编码的二进制字符串,需要这么做:
"中国".bytes.to_a.pack("C*")

将一个十六进制编码的二进制字符串转换为UTF-8编码的字符串,需要这么做:
hexstr.scan(/..(..)/).map{|x| x[0].to_i(16)}.pack("C*")
分享到:
评论

相关推荐

    UTF8_TO_HEX

    标题“UTF8_TO_HEX”指的是一个程序或功能,它的主要任务是将UTF-8编码的字符串转换成拉丁字母(Latin1)编码表示的形式。在计算机领域,字符编码是用来表示文本的一种方式,不同的编码标准适用于不同的语言和地区。...

    achieve-the-hex-string-to-decimal-.rar_hex string to hex

    标题中的"achieve-the-hex-string-to-decimal-.rar_hex string to hex"明确指出我们要探讨的是关于十六进制字符串(Hex String)转换为十进制数(Decimal)的问题。描述中提到的实现长度小于N个字符的十六进制字符串...

    UTF8转16进制工具 Utf8ToHex

    标题中的"UTF8转16进制工具 Utf8ToHex"指的是一个能够将UTF-8编码的字符串转换成16进制表示形式的实用工具。描述中提到的例子,中文的“你好”在UTF-8编码下是"\xE4\xBD\xA0\xE5\xA5\xBD",这个就是将UTF-8编码转换...

    js gb2312和utf-8互转

    function Gb2312ToUtf8(s1) { var s = escape(s1); var sa = s.split("%"); var retV = ""; if (sa[0] != "") { retV = sa[0]; } for (var i = 1; i ; i++) { if (sa[i].substring(0, 1) == "u") { retV +=...

    hex-to-string.rar_String to Hex VC_String to hex_hex to string_h

    标题"hex-to-string.rar"中的"String to Hex VC"和"hex to string"暗示了这是一个关于在Visual Studio环境下,特别是VC++(Visual C++)中实现16进制与字符串相互转换的教程或代码示例。下面我们将详细探讨这个主题...

    pb9.0 UTF-8 编码转换为Unicode 编码格式

    PowerBuilder9.0开发环境下,可以把UTF-8的编码转换为Unicode的编码格式,在pb9.0环境下测试通过。

    GBK与UTF-8之间的转换

    但是,这种方法存在一些问题,例如,使用new String(tmp.getBytes("GBK"), "UTF-8")这种方法将GBK编码的字符串转换成UTF-8编码的字符串时,可能会出现乱码的问题。 出现这种问题的原因是,因为客户端使用GBK编码,...

    char-string-to-HEX.rar_LABVIEW STRING_char to hex_labview 16进制

    标题"char-string-to-HEX.rar_LABVIEW STRING_char to hex_labview 16进制"明确指出,这是一个关于LabVIEW的实验项目,其核心功能是将字符串转换成16进制表示。这个压缩包可能包含了完成这一功能所需的VI(Virtual ...

    asp_hmac_sha256加密支持中文utf-8编码

    总之,ASP HMAC-SHA256加密方案为ASP开发者提供了一种安全的、跨语言的加密手段,特别是在处理包含中文字符的场景下,通过UTF-8编码确保了数据的正确性和安全性。通过深入理解和正确使用,可以在ASP应用中有效地保护...

    中文转UTF-8编码

    ### 中文转UTF-8编码知识点详解 #### 一、前言 在计算机科学与互联网技术领域中,字符编码是一项非常重要的技术。随着全球化的发展,多语言支持成为了软件开发中的基本需求之一。其中,UTF-8(Unicode ...

    H-Converter bin to hex.zip

    标题中的“H-Converter bin to hex.zip”是一个压缩文件,其中包含一个名为“H-Converter bin to hex.exe”的可执行程序。这个程序是为IT专业人士和爱好者设计的小型工具,主要用于进行二进制(bin)与十六进制(hex...

    utf82hex:将utf8文本转换为utf8十六进制字符串的工具

    'e6bca2e5ad97' // Hex string representation of the unicode encoded in utf-8 > utf82hex . decode ( "e6bca2e5ad97" ) '漢字' 查看“ UTF-8(十六进制)”部分,并将其与输出进行比较以了解其工作原理。

    UTF-8GB2312互转

    UTF-8和GB2312是两种常见的字符编码格式,它们各自有其特点和适用场景。本篇文章将详细探讨UTF-8与GB2312之间的转换,以及如何解决在数据传输或程序处理中文参数时可能出现的乱码问题。 首先,UTF-8是一种广泛使用...

    change-ascii-to-string.zip_ASCII-to-HEX

    本程序"change ascii to string.vi"旨在演示如何在LabVIEW中将ASCII码转换为字符串。 首先,我们要理解ASCII码和字符串之间的关系。ASCII码是基于拉丁字母的一套电脑编码系统,最初只使用7位二进制数(即128个不同...

    URL编码,Gb2312页面提交到Utf-8页面

    ### URL编码:Gb2312页面提交到Utf-8页面 #### 一、引言 在Web开发中,不同编码格式之间的数据转换是常见需求之一。本文将深入探讨如何实现从Gb2312编码的网页向Utf-8编码网页的数据提交过程中的URL编码转换。Gb...

    bin-hex bin to hex convert

    HEX文件是包括地址信息的,而BIN文件格式只包括了数据本身。在烧写或下载HEX文件的时候,一般都不需要用户指定地址,因为HEX文件内部的信息已经包括了地址。而烧写BIN文件的时候,用户是一定需要指定地址信息的。

    解决scratch3.0scratch-hex文件下载失败问题

    scratch-gui在npm安装过程中出现下载不到scratch-hex文件的问题解决方案

    课程设计:解决arduino软件 无法将utf-8字符转换成gbk字符十六进制的问题,串口显示转换的gbk字符

    在这个示例中,`utf8ToUtf32`和`utf32ToGbk`是两个假设已存在的辅助函数,分别用于从UTF-8字符串中提取Unicode码点和将Unicode码点转换为GBK编码。在`printGbkHex`函数中,我们实现了从UTF-8到GBK的转换并打印出结果...

    中文转utf8 16

    ### 知识点总结 #### 一、UTF-8 编码原理与16...对于实际应用来说,通常可以直接使用 Java 内置的方法如 `new String(bytes, "UTF-8")` 或 `string.getBytes("GB2312")` 进行编码转换,这些方法更加简洁且易于理解。

    将字符串转换成gb2312或者utf-8编码的参数(js版)

    `String.prototype.UrlEncode`函数则是用于将字符串转换为UTF-8编码的URL参数,主要利用了JavaScript的内置函数`escape()`,然后对结果进行进一步处理,特别是处理Unicode字符。这个函数的工作原理如下: 1. 先使用`...

Global site tag (gtag.js) - Google Analytics