`
kankan1218
  • 浏览: 277770 次
  • 性别: Icon_minigender_1
  • 来自: 大连
社区版块
存档分类
最新评论

日文网站搜索时,关键字在url地址栏里有一个编码的过程,perl怎么获得这个编码后的结果?

    博客分类:
  • perl
阅读更多
日文网站搜索时,关键字在url地址栏里有一个编码的过程,perl怎么获得这个编码后的结果?
比如说在 http://voi.0101.co.jp/voi/index.jsp 这个网站搜索关键字 サマー ,
得到的url是:http://search-voi.0101.co.jp/voi/freeword/?store=&q=%83T%83%7D%81%5B ,
我现在想知道怎么用perl实现把 サマー 转化为 %83T%83%7D%81%5B ?

---------------------------------------------------------------------------------------------


Shift_JIS是cp932的子集,就好比中文字符编码gb2312是cp936(gbk)的子集一样。

%83T%83%7D%81%5B
uri_escape的结果,把不合法的URI字符(包含控制字符、大部分标点、大于0x7F的字符)用%XX表示,合法的字符(包含大小写字母、数字、部分标点)可以直接显示。

之前是用Python试的。现在用Perl试了下,结果正常:

Perl code:
#!/usr/bin/perl
use URI::Escape qw(uri_escape);
use Encode qw(encode decode);

$string = 'サマー ';
$uri_cp932 = uri_escape(encode('cp932', decode('utf8', $string)));
$uri_shiftjis = uri_escape(encode('shiftjis', decode('utf8', $string)));
print "$string\t$uri_cp932\t$uri_shiftjis\n";

# 运行结果:
# サマー  %83T%83%7D%81%5B%20     %83T%83%7D%81%5B%20

分享到:
评论

相关推荐

    URL编码 URL编码

    4. 非ASCII字符,如中文、日文等,需要使用UTF-8编码转换成多个十六进制序列后再进行URL编码。 URL编码的应用场景包括但不限于: 1. 查询字符串:在URL中的"?"后面的部分,用于传递参数,如`http://example.com/?...

    jis.rar_jis0208_日文编码

    jis.rar_jis0208_日文编码这个文件包主要涉及的是日文字符编码标准JIS X 0208的相关知识。JIS X 0208是日本工业标准(Japanese Industrial Standard)中定义的一种字符编码系统,主要用于表示日本汉字、假名和其他...

    URL中如果含有中文等非ASCII字符

    由于URL需要在网络上传输,为了确保传输过程中的兼容性和正确性,任何非ASCII字符都需要被编码为特定的形式,这个过程称为URL编码(URLEncode)。URL编码将非安全或不可见的字符转换成百分号“%”后跟两个十六进制...

    日文字库Sjis码表

    标题和描述中的“日文字库Sjis码表”和“sjis--gbk”涉及到的是计算机编码领域的一个重要概念——字符编码。字符编码是计算机处理、存储和传输文本信息的基础,它将各种字符(包括字母、数字、符号以及特定语言的...

    日文版的c#编码規約

    从给定的文件信息来看,这是一份C#的日文编码规范文档,主要涉及编码标准、文件结构等关键内容,以下是对这些知识点的详细解析: ### 关键知识点 #### 1. 方針(Policy) 该编码规范的核心目标是提供一套在软件...

    URL 编码转换工具

    "URL 编码转换工具"是一个专门用于处理URL编码和解码的应用软件,它能够帮助用户将字符串中的特殊字符转换为它们的百分比编码表示,反之亦然。这个工具特别强调支持Unicode,这意味着它可以处理各种语言和字符集,...

    日文乱码转换工具

    【标题】"日文乱码转换工具"涉及的是在处理日语文本时可能出现的编码问题。乱码通常出现在计算机系统不支持或识别错误的字符编码格式时,导致文本无法正常显示。日文乱码尤其常见,因为日语使用了多种字符集,包括...

    日文版SQL的编码规约

    【标题】日文版SQL的编码规约 【描述】这份文档主要针对对日外包项目的开发人员,旨在提供一套适用于日语环境的SQL编码规范,帮助开发者形成良好的编码习惯。 【标签】编码规约(SQL) 【正文】 1. はじめに 在...

    编码转换程序(日文编码等)

    自动识别转换前文件的编码,只需要选择要转换的编码,然后点击转换就可以了,支持文件到文件和文件夹到文件夹的转换。

    日语编码换换器

    《日语编码转换器》是一款专门用于解决日语编码问题的工具,主要功能是将日语的Shift-JIS编码转换成BIG5(通常称为BGK)编码,以便于处理那些因编码不匹配导致的乱码TXT文件,使其能正确显示。在IT领域,尤其是在...

    易语言URL解码算法

    - 创建一个空字符串,用于存储解码后的结果。 - 遍历输入的编码字符串,当找到"%",截取接下来的两个字符,用`StrToNum`转换为十进制数。 - 将这个十进制数转换为ASCII字符,并添加到解码结果字符串中。 - 如果...

    url_decoder_v3.0 url编解码工具

    在互联网通信中,URL(Uniform Resource Locator,统一资源定位符)是每个网页、文件或资源的地址。由于URL在传输过程中需要遵循特定的规则,以确保数据的正确解析和传递,因此URL的编码与解码成为网络开发中的关键...

    一个 编码 转换 小工具

    在IT领域,编码转换是一个非常重要的概念,尤其是在处理多语言或者跨平台的数据时。编码是计算机存储和显示文本的一种方式,不同的编码系统有着不同的规则,例如ASCII、GB2312、GBK、Big5以及我们这里提到的UTF-8等...

    批量修改TXT文档编码

    在IT领域,字符编码是一个非常重要的概念,尤其是在处理文本数据时。不同的编码方式会影响文本的显示和处理。本文将深入探讨“批量修改TXT文档编码”的主题,以及如何使用提供的“批量修改编码工具”来实现这一目标...

    Shift JIS编码表

    而在Shift模式下,通过一个“Shift”键的切换,编码可以扩展到更高范围,以容纳更多的日文字符,包括平假名、片假名以及汉字。 Shift JIS编码表包含大约6875个字符,其中涵盖了JIS X 0208标准中的第一和第二部分。...

    日文Shift_JIS码表

    这个码表将每个字符与一个特定的二进制数值对应,这些数值通常由两个字节组成,允许在单字节的ASCII码基础上扩展出更多的字符空间。码表中的每个条目包含了字符的图形表示和其对应的编码值。 在描述中提到的“完整...

    日文编码规范

    日文编码规范,一些SQL啊,PG等参考

    网站编码详解(送给初级网站程序员)

    3. **GB2312编码**:中国在引入计算机后面临的一个巨大挑战是如何用有限的字节空间表示大量的汉字。GB2312通过将两个大于127的字节组合起来表示一个汉字,解决了这个问题。高字节取值范围为A1-F7,低字节取值范围为...

    c# 关键字密度排行工具 源码

    关键字密度是搜索引擎排名算法中的一个重要因素,合理的关键词分布可以帮助网站在搜索结果中获得更好的排名。此工具的实现,对于SEO从业者和网站开发者来说,具有很高的实用价值。 该工具的核心技术之一是采用了...

    日文 编码 规范

    日文 编码 规范 很好用的

Global site tag (gtag.js) - Google Analytics