发现现在几乎所有的网站都对url中的汉字和特殊的字符,进行了urlencode操作,也就是:
http://hi.baidu.com/%BE%B2%D0%C4%C0%CF%C8%CB/creat/blog/
这个样子,中间%形式的,肯定就是我的登录用户名称了吧。
为什么对这些字符进行了u的编码形式,是为了字符编码(gbk、utf8)还是为了不出现特殊的字符在url中?都知道要转,但是转了的真正好处呢。查看了网上的很多资料,也没有找到更加准确的说法。
url转义其实也只是为了符合url的规范而已。因为在标准的url规范中中文和很多的字符是不允许出现在url中的。
看一下php的urlencode的说明了。
urlencode — 编码 URL 字符串
string
urlencode
( string
$str
)
返回字符串,此字符串中除了 -_.
之外的所有非字母数字字符都将被替换成百分号(%
)后跟两位十六进制数,空格则编码为加号(+
)。此编码与 WWW 表单 POST 数据的编码方式是一样的,同时与 application/x-www-form-urlencoded
的媒体类型编码方式一样。由于历史原因,此编码在将空格编码为加号(+)方面与 RFC1738 编码(参见 rawurlencode()
)不同。此函数便于将字符串编码并将其用于 URL 的请求部分,同时它还便于将变量传递给下一页。
标准的英文说明是:
"...Only alphanumerics [0-9a-zA-Z], the special characters "$-_.+!*'()," [not including the quotes - ed]
, and reserved characters used for their reserved purposes may be used unencoded within a URL."
那哪些字符是需要转化的呢?
1. ASCII 的控制字符
这些字符都是不可打印的,自然需要进行转化。
2. 一些非ASCII字符
这些字符自然是非法的字符范围。转化也是理所当然的了。
3. 一些保留字符
很明显最常见的就是“&”了,这个如果出现在url中了,那你认为是url中的一个字符呢,还是特殊的参数分割用的呢?
4. 就是一些不安全的字符了。
例如:空格。为了防止引起歧义,需要被转化为“+”。
明白了这些,也就知道了为什么需要转化了,而转化的规则也是很简单的。
按照每个字符对应的字符编码,不是符合我们范围的,统统的转化为%的形式也就是了。自然也是16进制的形式。
和字符编码无关
通过urlencode的转化规则和目的,我们也很容易的看出,urleocode是基于字符编码的。同样的一个汉字,不同的编码类型,肯定对应不同的urleocode的串。gbk编码的有gbk的encode结果。
apache等服务器,接受到字符串后,可以进行decode,但是还是无法解决编码的问题。编码问题,还是需要靠约定或者字符编码的判断解决。
因此,urleocode只是为了url中一些非ascii字符,可以正确无误的被传输,至于使用哪种编码,就不是eocode所关心和解决的问题了。
编码问题,不是urlencode所要解决的。
参考资料:
http://www.blooberry.com/indexdot/html/topics/urlencoding.htm
http://cn.php.net/manual/zh/function.urlencode.php
分享到:
相关推荐
它支持对整个URL或URL的特定部分进行操作,如查询参数。 在编程中,很多语言都内置了URL编码和解码的函数。例如,在JavaScript中,有`encodeURIComponent()`、`decodeURIComponent()`等方法;在Python中,可以使用`...
网址编码解码,jQuery版Url.encode,Url.decode,Url.parse,一个来自jQuery的URL Decoder解码、编码插件,为你的URL安全定义一道安全防线,示例文件本身就是一个值得学习的实例,自带的示例将告诉你如何使用这款URL...
自己动手写了一个HTML码URL-encode码转换器,给大家分享一下。
这个压缩包文件"URL encode 与 URL decode 的C语言实现.zip"显然提供了用C语言编写的函数,用于对URL进行编码和解码操作。 URL编码是一种将非ASCII字符转换为ASCII字符集的过程,以便在网络上传输。它遵循以下规则...
**UrlDecode**则是对UrlEncode的逆操作,用于将经过UrlEncode编码后的URL字符串还原成原始的URL。 #### 五、总结 HtmlEncode与HtmlDecode是Web开发中处理HTML内容时常用的两种技术,它们可以帮助开发者有效地防止...
【渝海URL编码转换工具 v1.1_yh_url_encode】是一个专用于处理URL编码问题的实用工具。在互联网通信中,URL(统一资源定位符)是用于标识资源的字符串,它包含网络协议、主机名、路径、查询参数等部分。然而,URL中...
arraysort 对一维数组进行排序 decto 将十进制数字转成其它进制字符串 getsep 得到指定符号分隔开的文本数组 hexdecode 将16进制字符串以指定字符集进行解码成字符 hexencode 将字符串指定字符集进行编码成16进制...
因此,我们需要使用 `URLEncoder.encode()` 对URL进行编码,将特殊字符替换为 `%xx` 的形式,然后在服务器端使用 `URLDecoder.decode()` 进行解码,恢复原始字符串。 4. **UTF-8**:UTF-8是一种常用的Unicode编码...
加密的过程通常包括选择一个密钥,然后使用特定的加密算法对明文进行操作,生成密文。解密则是加密的逆过程,通过相同的密钥和解密算法,将密文还原为原始的明文。在encode加密中,虽然没有传统意义上的密钥,但编码...
它不会对URL的协议、主机名、路径等部分进行编码,只对其中的特殊字符进行处理。 2. **保留字符**:与`encodeURI()`函数不同,`encodeURIComponent()`不会放过任何特殊字符,包括空格。它会将空格编码为`%20`,而...
在Java中,可以使用`java.net.URLEncoder.encode()`方法对加密字符串进行编码,解码则使用`java.net.URLDecoder.decode()`。 7. **异常处理**:在实际应用中,应更全面地处理可能抛出的异常,包括捕获并记录异常...
1. `URLEncoder.encode`: 对普通字符串进行编码,使其适合在URL中传输。 2. `URLDecoder.decode`: 解码URL中的编码字符串,恢复原始的文本信息。 在处理网络请求、特别是涉及到中文字符和其他特殊字符时,这两个...
EnCode/DeCode工具可以方便地将这些特殊字符转换为它们的百分号编码,如空格转为"%20",反之亦然,这对于调试和处理URL参数非常有用。 在实际使用中,`code.exe`可能是这个工具的执行文件。用户只需运行这个程序,...
XSS Encode是针对这种攻击进行防御的一种策略,主要涉及对用户输入内容进行编码,防止其被浏览器误识别为可执行的脚本。 **XSS攻击类型** 1. **存储型XSS**:攻击者将恶意脚本存储在服务器上,当其他用户访问含有...
在实际开发中,应始终注意编码和解码的正确上下文,避免对整个URL进行不必要的编码,以及确保使用正确的字符集,以防止乱码问题。同时,了解JavaScript中的相关函数可以帮助在前后端交互时保持编码的一致性。最后,...
无论是进行编码还是解码,都需要严谨的逻辑和对加密算法的深入理解。 总之,易语言encode加密解密是易语言编程中涉及信息安全的重要环节。通过学习和理解这些源码,开发者可以更好地掌握加密技术,提升软件的安全性...
在某些情况下,为了保护源代码不被未经授权的用户查看或修改,开发者可能会使用微软提供的工具MS Script Encoder(SCRENC.EXE)对ASP脚本进行加密。这种加密方式使得Web主机和Web客户无法直接读取或修改源代码,增强...
在Java中,`java.net.URLEncoder`类可以对URL中的特殊字符进行编码,避免URL解析错误;`java.lang.StringEscapeUtils`类则提供了对字符串中特殊字符的转义和unescape功能,适用于HTML、XML等场景。 现在,让我们看...
VB Script EnCode是一种在VBScript(Visual Basic Script)编程环境中使用的加密技术,它允许程序员对源代码进行编码,以防止未经授权的用户查看或修改代码。VBScript是Microsoft开发的一种脚本语言,常用于Web页面...
字符串转EnCode_c# 字符串转EnCode_c# 字符串转EnCode_c# 字符串转EnCode_c# 字符串转EnCode_c# 字符串转EnCode_c# 字符串转EnCode_c# 字符串转EnCode_c#