`
nicegege
  • 浏览: 589751 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

js文件\u开头的编码原来是unicode编码

 
阅读更多

在js文件中发现一串编码,\u开头。起初以为是ASIIC码,也不是。utf-8编码也不是。后来,发现是unicode编码。支持中文和英文。很容易和URL编码混淆。例如,在浏览器地址栏中的空格变为%20,汉字变为%开头的字符串等等。

高人实现的unicode转码和解码特有意思。支持中文英文。

javascript代码如下:

<script type="text/javascript">// <![CDATA[
var decToHex = function(str) {
    var res=[];
    for(var i=0;i < str.length;i++)
        res[i]=("00"+str.charCodeAt(i).toString(16)).slice(-4);
    return "\\u"+res.join("\\u");
}
var hexToDec = function(str) {
    str=str.replace(/\\/g,"%");
    return unescape(str);
}
var bianma=function()
{
document.getElementById('code12').value=decToHex(document.getElementById('code11').value);
}
var jiema=function()
{
document.getElementById('code12').value=hexToDec(document.getElementById('code11').value);
}
// ]]></script>

<p><textarea id="code11" style="width: 500px; height: 100px;" rows="5" cols="50" height="100"></textarea> <br />
<input onclick="bianma()" type="button" value="编码" />&nbsp;
<input onclick="jiema()" type="button" value="解码" /><br />
<textarea id="code12" style="width: 500px; height: 100px;" rows="5" cols="50"></textarea></p>

 转自http://www.cnblogs.com/skykang/archive/2011/06/02/2068802.html

分享到:
评论

相关推荐

    VB6读写Unicode_vb6_unicode_

    5. **处理BOM**:Unicode文件通常以Byte Order Mark (BOM) 开头,它是一个特殊的Unicode字符,用于标识文件的字节顺序。在VB6中,写入Unicode文件时,系统会自动添加BOM。如果需要读取有BOM的Unicode文件,通常不...

    javascript下汉字和Unicode编码互转代码

    在本篇文档中,我们会详细介绍JavaScript语言是如何实现汉字与Unicode编码之间的相互转换的。 首先,我们需要了解JavaScript内置的字符串处理函数`escape()`和`unescape()`。这两个函数在早期JavaScript版本中用于...

    C#将Unicode编码转换为汉字字符串的简单方法

    Unicode编码使用一对16位的数字来表示一个字符,这通常以`\u`开头,后面跟着4位16进制数字,如`\u4e2d`代表汉字“中”。在JavaScript中,这种形式的编码经常出现,因为JSON等数据格式通常使用Unicode编码来表示非...

    EncodeDecode & ANSI-UTF8编码转换工具

    这个过程可能涉及到字节顺序标记(BOM)的处理,BOM在某些UTF-8文件的开头用以标识其编码类型,但在其他情况下可以省略。 使用此类工具时,用户需要注意一些问题。首先,如果源文件的编码格式判断错误,转换结果...

    [简单]js汉字与Unicode互转

    Unicode编码通常以`\u`开头,后面跟着4位16进制数字。例如,转换Unicode编码27704为汉字: ```javascript let unicode = "\\u27704"; let hanziFromUnicode = String.fromCharCode(parseInt(unicode.substr(2), 16)...

    python解决js文件utf-8编码乱码问题(推荐)

    BOM是Unicode编码的一种标记,它在文件开头添加了几个特定的字节,以此来声明该文件使用的是UTF-8、UTF-16或UTF-32编码。 上述Python脚本的核心步骤如下: - 使用`chardet.detect()`函数来检测文件的当前编码格式...

    第十一节 编码转义介绍-01

    JavaScript编码使用“\u”开头的Unicode转义方式,可以将字符的Unicode数值转换为安全的字符。例如,“&lt;”可以转换为“\u003c”或“\x3c”。此外,JavaScript还提供了jsfuck编码方式,例如http://www.jsfuck.com/。 ...

    JScript中使用ADODB.Stream判断文件编码的代码

    4. 读取文件的前两个字节,并使用escape方法处理得到一个编码后的字符串(bom),这个字符串实际上是这两个字节的Unicode编码。 5. 利用switch语句判断bom的值,并根据这个值来确定文件的编码类型。 - 如果bom为...

    Unicode转换工具

    1. 输入:用户可以输入包含普通字符的字符串,或者输入以“\u”或“\”开头的Unicode编码。 2. 选择转换方向:工具会提供选项,让用户选择是从普通字符串转换到Unicode,还是从Unicode编码转换回普通字符串。 3. ...

    javascript unicode与GBK2312(中文)编码转换方法

    `ToUnicode` 方法首先调用 `escape` 函数,然后使用 `toLocaleLowerCase` 将所有百分号编码转换为小写,接着用 `replace` 函数将所有 `%u` 替换为 `\u`,形成 JavaScript 中的 Unicode 转义序列。 `ToGB2312` 方法...

    JS实现汉字与Unicode码相互转换的方法详解

    后来发现网上的一些js里会把变量中的汉字都表示成”\u“开头的16进制编码,这样应该可以解决上面的问题。 最近有时间在网上查找了一下实现方式,一种比较大众化的: function tounicode(data) { if(data == '') ...

    A开头的17个汉字书写法

    最常见的是Unicode编码,其中包含了大量汉字。例如,"阿"的Unicode码是U+97E7,"啊"是U+5426,"哀"是U+547C,"唉"是U+548C,"挨"是U+6293,"矮"是U+7D20,"爱"是U+7231,"碍"是U+7A0B,"安"是U+5B89,"案"是U+6848,...

    Url编码转换程序 gb2312 utf-8 编码 解码

    而UTF-8是一种变长的Unicode编码,它可以表示几乎所有的世界语言字符,包括中文,并且在Web上得到了广泛的应用。 编码过程是从一种字符集(如GB2312或UTF-8)转换到URL编码,解码则是相反的过程。在GB2312到URL编码...

    使用Node.js处理前端代码文件的编码问题

    UTF8编码的文件有时会包含一个字节顺序标记(Byte Order Mark,简称BOM),用以指示该文件采用的Unicode编码格式。在UTF8编码中,BOM通常由三个字节"EF BB BF"组成。BOM虽然能够标识文件的编码格式,但在某些情况下...

    关于js和php对url编码的处理方法

    这个函数遍历字符串,当遇到 `%u` 开头的序列时,将其转换回相应的 UTF-8 字符,而对于其他 `%` 开头的序列则按照标准 URL 编码进行解码。 `js_unescape()` 函数的工作原理如下: 1. 遍历字符串,当遇到 `%u` 开始...

    Python-convert2utf将目录下的全部源文件转成UTF8编码

    尽管BOM在某些情况下有助于识别文件的编码类型,但在许多编程语言和编辑器中,BOM可能会引起问题,如在Python中可能导致意外的字符出现在文件开头。因此,将其移除可以保证文件在不同环境下的兼容性。 在Python开发...

    php 正确解码javascript中通过escape编码后的字符

    它使用正则表达式匹配`escape`编码的字符串,包括`%u`形式的Unicode编码和`%`开头的其他百分比编码。这个函数的主要逻辑如下: 1. 使用`preg_match_all`函数匹配字符串中的三种模式: - `%u`后面跟着4个十六进制...

    JS获取中文拼音首字母,并通过拼音首字母快速查找页面内的中文内容

    在JavaScript中,中文字符是Unicode编码,可以通过`charCodeAt()`方法获取每个字符的Unicode值。但是,直接使用这个方法无法得到对应的拼音,因为它返回的是数字而非汉字的拼音表示。 为了将中文字符转换为拼音,...

    js实现unicode码字符串与utf8字节数据互转详解

    JavaScript中的字符串本质上是使用UTF-16编码形式的,这是为了向后兼容早期的Unicode版本。当需要将这些字符串数据用于网络传输或者数据库存储时,通常需要将其转换为其他编码,如UTF-8,因为网络和数据库往往以字节...

Global site tag (gtag.js) - Google Analytics