锁定老帖子 主题:淘宝网的搜索关键字的编码与解码
该帖已经被评为良好帖
|
|
---|---|
作者 | 正文 |
发表时间:2008-12-09
个人感觉是: 1>处理url中使用get传递特殊字符的问题 2>部分加密 3>网站的目录结构可以使用中文,这个已经是很好的理由了。
|
|
返回顶楼 | |
发表时间:2008-12-10
很有可能是TAOBO后台搞群集的时候碰见编码问题了。不同操作系统和中间件间交互编码确实是一个问题。TABAO后台是分布式服务的话也许就会碰见这种问题。
|
|
返回顶楼 | |
发表时间:2008-12-10
你当搞了这么多年网站的都搞不定编码问题也太可笑了。 URL跟后面的服务交互一点关系都没有。
|
|
返回顶楼 | |
发表时间:2008-12-10
这有可能是历史原因导致的,面对历史系统,我确实对编码还搞不定,提不出一个很好的解决方案。GBK在WIN下面有肯能是2转1 在LINUX下可能是3转1。面对这种问题的时候确实很难办。
URL跟后面的服务交互一点关系都没有。我不这么认为, 举个简单的例子吧,你提交表单后,如果你提交的那台服务器应用的工作只是一个适配,它要吧你的参数组织成SOAP报文或其他服务访问规范的时候,这就可以同一编码了。 |
|
返回顶楼 | |
发表时间:2008-12-10
E生迅徒 写道 问楼主一个问题,按照你说的规律,中文是怎么加密的
先说明一点,严格来说这不算是加密,可以说是编码。 中文?中文的道理也是一样的,也许你应该去下个source code,拿去跑一下。 |
|
返回顶楼 | |
发表时间:2008-12-11
Hi,gembler!
请问一下,您能知道http://v.youku.com/v_show/id_XNTg2NTM1ODg=.html 它那个唯一标识 XNTg3MjEwNzI XNTg2NTM1ODg 用java是如何算的? |
|
返回顶楼 | |
发表时间:2008-12-11
最后修改:2008-12-11
wushaoen 写道 Hi,gembler!
请问一下,您能知道http://v.youku.com/v_show/id_XNTg2NTM1ODg=.html 它那个唯一标识 XNTg3MjEwNzI XNTg2NTM1ODg 用java是如何算的? 请看我之前的回复: gembler 写道 Base64转出来的也不是很顺眼。。(大小写,数字,+,=,/) 一起来。
youku疑似Base64转出来的: http://v.youku.com/v_show/id_XNTY4ODk1NDA=.html 从编码之后的样子的style来看,个人感觉是Base64,Base64的实现有很多,你可以到开源社区找找看 要是确实懒的找的话,据我所知,jdk的rt.jar里有两个选择: 1.com.sun.org.apache.xerces.internal.impl.dv.util.Base64(有source code) 2.sun.misc.BASE64Encoder/sun.misc.BASE64Decoder(没source code) 其实你所提到的"唯一标识"可能youku用一个主键ID编码出来的 |
|
返回顶楼 | |
发表时间:2008-12-28
fins 写道 我觉得还有一个原因:
避免直接通过URL 来调用淘宝的相关服务. 举个例子: 你要买搜索苹果. 通常需要进入搜索页面 进行搜索. 而搜索页面有大量的广告 图片 flash之类的. 如果这时候 你突然发现 使用 引用 www.taobao.com/search?key=apple
也能够达到同样效果, 那么很有可能你就不会通过搜索页面去搜索了. 那些广告的价值就低了 =============== 当然 这只是我个人分析 而且这个也许不是主要原因. 强烈支持. |
|
返回顶楼 | |
发表时间:2008-12-28
晕,想的还真多。就是为了避免中文作为url的一部分而引起的浏览器get请求的编码问题。跟其他的都没关系。
|
|
返回顶楼 | |
发表时间:2009-01-18
reeze 写道 gembler 写道 sdh5724 写道 几乎是为了seo. 看来,淘宝网为什么要这么做,已经有答案了。 跟SEO没有关系吧。 这样根本就不SEO。 我认为是为了把url拉丁化,拉丁化的目的是照顾那些IM工具,mail工具等里面对url地址自动加连接时进行url切断时,不被错误切开。 |
|
返回顶楼 | |