js文件\u开头的编码原来是unicode编码 - 海阔天空 - ITeye博客

`

nicegege

浏览: 596979 次
性别:
来自: 北京

最近访客更多访客>>

X_G

jiangqilin

cjj8513

zhaodengfeng1989

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

itlang01：推荐mybatis插件https://github.com/y ...
mysql设置修改时间，更新记录当前时间
longen2011：客户端可以发送包含“Content-Encoding: gzi ...
HTTP消息头详细介绍
Tiro_Li：很抱歉你指出了我博文中的错误，这个问题是由于maven-ar ...
mvn构建web项目异常处理
chen_lian：似乎有点问题的是如果输入 000009能够验证通过
js验证输入的值是否钱数
nicegege：起来Rails的一个五颜六色的羽毛帽，现在是在地面上。 Twi ...
oracle数据库导出命令EXP

js文件\u开头的编码原来是unicode编码

博客分类：

javascript

阅读更多

在js文件中发现一串编码，\u开头。起初以为是ASIIC码，也不是。utf-8编码也不是。后来，发现是unicode编码。支持中文和英文。很容易和URL编码混淆。例如，在浏览器地址栏中的空格变为%20，汉字变为%开头的字符串等等。

高人实现的unicode转码和解码特有意思。支持中文英文。

javascript代码如下：

<script type="text/javascript">// <![CDATA[
var decToHex = function(str) {
    var res=[];
    for(var i=0;i < str.length;i++)
        res[i]=("00"+str.charCodeAt(i).toString(16)).slice(-4);
    return "\\u"+res.join("\\u");
}
var hexToDec = function(str) {
    str=str.replace(/\\/g,"%");
    return unescape(str);
}
var bianma=function()
{
document.getElementById('code12').value=decToHex(document.getElementById('code11').value);
}
var jiema=function()
{
document.getElementById('code12').value=hexToDec(document.getElementById('code11').value);
}
// ]]></script>

<p><textarea id="code11" style="width: 500px; height: 100px;" rows="5" cols="50" height="100"></textarea> <br />
<input onclick="bianma()" type="button" value="编码" />&nbsp;
<input onclick="jiema()" type="button" value="解码" /><br />
<textarea id="code12" style="width: 500px; height: 100px;" rows="5" cols="50"></textarea></p>

转自http://www.cnblogs.com/skykang/archive/2011/06/02/2068802.html

分享到：

Notepadd++使用总结 | 简单的使用httpClient之远程请求获取数据

2015-04-15 18:07
浏览 3410
评论(0)
分类:Web前端
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

VB6读写Unicode_vb6_unicode_: 5. **处理BOM**：Unicode文件通常以Byte Order Mark (BOM) 开头，它是一个特殊的Unicode字符，用于标识文件的字节顺序。在VB6中，写入Unicode文件时，系统会自动添加BOM。如果需要读取有BOM的Unicode文件，通常不...

javascript下汉字和Unicode编码互转代码: 在本篇文档中，我们会详细介绍JavaScript语言是如何实现汉字与Unicode编码之间的相互转换的。首先，我们需要了解JavaScript内置的字符串处理函数`escape()`和`unescape()`。这两个函数在早期JavaScript版本中用于...

EncodeDecode & ANSI-UTF8编码转换工具: 这个过程可能涉及到字节顺序标记（BOM）的处理，BOM在某些UTF-8文件的开头用以标识其编码类型，但在其他情况下可以省略。使用此类工具时，用户需要注意一些问题。首先，如果源文件的编码格式判断错误，转换结果...

[简单]js汉字与Unicode互转: Unicode编码通常以`\u`开头，后面跟着4位16进制数字。例如，转换Unicode编码27704为汉字： ```javascript let unicode = "\\u27704"; let hanziFromUnicode = String.fromCharCode(parseInt(unicode.substr(2), 16)...

C#将Unicode编码转换为汉字字符串的简单方法: Unicode编码使用一对16位的数字来表示一个字符，这通常以`\u`开头，后面跟着4位16进制数字，如`\u4e2d`代表汉字“中”。在JavaScript中，这种形式的编码经常出现，因为JSON等数据格式通常使用Unicode编码来表示非...

python解决js文件utf-8编码乱码问题(推荐): BOM是Unicode编码的一种标记，它在文件开头添加了几个特定的字节，以此来声明该文件使用的是UTF-8、UTF-16或UTF-32编码。上述Python脚本的核心步骤如下： - 使用`chardet.detect()`函数来检测文件的当前编码格式...

第十一节编码转义介绍-01: JavaScript编码使用“\u”开头的Unicode转义方式，可以将字符的Unicode数值转换为安全的字符。例如，“<”可以转换为“\u003c”或“\x3c”。此外，JavaScript还提供了jsfuck编码方式，例如http://www.jsfuck.com/。 ...

JScript中使用ADODB.Stream判断文件编码的代码: 4. 读取文件的前两个字节，并使用escape方法处理得到一个编码后的字符串（bom），这个字符串实际上是这两个字节的Unicode编码。 5. 利用switch语句判断bom的值，并根据这个值来确定文件的编码类型。 - 如果bom为...

Unicode转换工具: 1. 输入：用户可以输入包含普通字符的字符串，或者输入以“\u”或“\”开头的Unicode编码。 2. 选择转换方向：工具会提供选项，让用户选择是从普通字符串转换到Unicode，还是从Unicode编码转换回普通字符串。 3. ...

javascript unicode与GBK2312(中文)编码转换方法: `ToUnicode` 方法首先调用 `escape` 函数，然后使用 `toLocaleLowerCase` 将所有百分号编码转换为小写，接着用 `replace` 函数将所有 `%u` 替换为 `\u`，形成 JavaScript 中的 Unicode 转义序列。 `ToGB2312` 方法...

JS实现汉字与Unicode码相互转换的方法详解: 后来发现网上的一些js里会把变量中的汉字都表示成”\u“开头的16进制编码，这样应该可以解决上面的问题。最近有时间在网上查找了一下实现方式，一种比较大众化的： function tounicode(data) { if(data == '') ...

A开头的17个汉字书写法: 最常见的是Unicode编码，其中包含了大量汉字。例如，"阿"的Unicode码是U+97E7，"啊"是U+5426，"哀"是U+547C，"唉"是U+548C，"挨"是U+6293，"矮"是U+7D20，"爱"是U+7231，"碍"是U+7A0B，"安"是U+5B89，"案"是U+6848，...

Url编码转换程序 gb2312 utf-8 编码解码: 而UTF-8是一种变长的Unicode编码，它可以表示几乎所有的世界语言字符，包括中文，并且在Web上得到了广泛的应用。编码过程是从一种字符集（如GB2312或UTF-8）转换到URL编码，解码则是相反的过程。在GB2312到URL编码...

使用Node.js处理前端代码文件的编码问题: UTF8编码的文件有时会包含一个字节顺序标记（Byte Order Mark，简称BOM），用以指示该文件采用的Unicode编码格式。在UTF8编码中，BOM通常由三个字节"EF BB BF"组成。BOM虽然能够标识文件的编码格式，但在某些情况下...

关于js和php对url编码的处理方法: 这个函数遍历字符串，当遇到 `%u` 开头的序列时，将其转换回相应的 UTF-8 字符，而对于其他 `%` 开头的序列则按照标准 URL 编码进行解码。 `js_unescape()` 函数的工作原理如下： 1. 遍历字符串，当遇到 `%u` 开始...

Python-convert2utf将目录下的全部源文件转成UTF8编码: 尽管BOM在某些情况下有助于识别文件的编码类型，但在许多编程语言和编辑器中，BOM可能会引起问题，如在Python中可能导致意外的字符出现在文件开头。因此，将其移除可以保证文件在不同环境下的兼容性。在Python开发...

php 正确解码javascript中通过escape编码后的字符: 它使用正则表达式匹配`escape`编码的字符串，包括`%u`形式的Unicode编码和`%`开头的其他百分比编码。这个函数的主要逻辑如下： 1. 使用`preg_match_all`函数匹配字符串中的三种模式： - `%u`后面跟着4个十六进制...

Python中还原JavaScript的escape函数编码后字符串的方法: 通常，这种编码方式将汉字或其他字符转换成一种“%uXXXX”形式的编码（其中“XXXX”为Unicode编码的十六进制形式）。而在Python中，我们需要找到一种方法将这种编码形式还原为原始的字符串形式。从给出的部分内容...

js实现unicode码字符串与utf8字节数据互转详解: JavaScript中的字符串本质上是使用UTF-16编码形式的，这是为了向后兼容早期的Unicode版本。当需要将这些字符串数据用于网络传输或者数据库存储时，通常需要将其转换为其他编码，如UTF-8，因为网络和数据库往往以字节...

JS获取中文拼音首字母，并通过拼音首字母快速查找页面内的中文内容: 在JavaScript中，中文字符是Unicode编码，可以通过`charCodeAt()`方法获取每个字符的Unicode值。但是，直接使用这个方法无法得到对应的拼音，因为它返回的是数字而非汉字的拼音表示。为了将中文字符转换为拼音，...

Global site tag (gtag.js) - Google Analytics