论坛首页 Java企业应用论坛

淘宝网的搜索关键字的编码与解码

浏览 77038 次
该帖已经被评为良好帖
作者 正文
   发表时间:2008-12-09  
个人感觉是: 1>处理url中使用get传递特殊字符的问题  2>部分加密    3>网站的目录结构可以使用中文,这个已经是很好的理由了。
0 请登录后投票
   发表时间:2008-12-10  
很有可能是TAOBO后台搞群集的时候碰见编码问题了。不同操作系统和中间件间交互编码确实是一个问题。TABAO后台是分布式服务的话也许就会碰见这种问题。
0 请登录后投票
   发表时间:2008-12-10  
你当搞了这么多年网站的都搞不定编码问题也太可笑了。 URL跟后面的服务交互一点关系都没有。
0 请登录后投票
   发表时间:2008-12-10  
这有可能是历史原因导致的,面对历史系统,我确实对编码还搞不定,提不出一个很好的解决方案。GBK在WIN下面有肯能是2转1 在LINUX下可能是3转1。面对这种问题的时候确实很难办。
URL跟后面的服务交互一点关系都没有。我不这么认为, 举个简单的例子吧,你提交表单后,如果你提交的那台服务器应用的工作只是一个适配,它要吧你的参数组织成SOAP报文或其他服务访问规范的时候,这就可以同一编码了。
0 请登录后投票
   发表时间:2008-12-10  
E生迅徒 写道
问楼主一个问题,按照你说的规律,中文是怎么加密的

先说明一点,严格来说这不算是加密,可以说是编码。
中文?中文的道理也是一样的,也许你应该去下个source code,拿去跑一下。
0 请登录后投票
   发表时间:2008-12-11  
Hi,gembler!
   请问一下,您能知道http://v.youku.com/v_show/id_XNTg2NTM1ODg=.html
它那个唯一标识
XNTg3MjEwNzI
XNTg2NTM1ODg
用java是如何算的?
0 请登录后投票
   发表时间:2008-12-11   最后修改:2008-12-11
wushaoen 写道
Hi,gembler!
   请问一下,您能知道http://v.youku.com/v_show/id_XNTg2NTM1ODg=.html
它那个唯一标识
XNTg3MjEwNzI
XNTg2NTM1ODg
用java是如何算的?


请看我之前的回复:

gembler 写道
Base64转出来的也不是很顺眼。。(大小写,数字,+,=,/) 一起来。

youku疑似Base64转出来的:
http://v.youku.com/v_show/id_XNTY4ODk1NDA=.html


从编码之后的样子的style来看,个人感觉是Base64,Base64的实现有很多,你可以到开源社区找找看
要是确实懒的找的话,据我所知,jdk的rt.jar里有两个选择:
1.com.sun.org.apache.xerces.internal.impl.dv.util.Base64(有source code)
2.sun.misc.BASE64Encoder/sun.misc.BASE64Decoder(没source code)

其实你所提到的"唯一标识"可能youku用一个主键ID编码出来的
0 请登录后投票
   发表时间:2008-12-28  
fins 写道
我觉得还有一个原因:

避免直接通过URL 来调用淘宝的相关服务.

举个例子:  你要买搜索苹果.

通常需要进入搜索页面 进行搜索.
而搜索页面有大量的广告  图片 flash之类的.

如果这时候 你突然发现 使用  
引用
www.taobao.com/search?key=apple


也能够达到同样效果, 那么很有可能你就不会通过搜索页面去搜索了.
那些广告的价值就低了

===============

当然 这只是我个人分析 而且这个也许不是主要原因.



强烈支持.
0 请登录后投票
   发表时间:2008-12-28  
晕,想的还真多。就是为了避免中文作为url的一部分而引起的浏览器get请求的编码问题。跟其他的都没关系。
0 请登录后投票
   发表时间:2009-01-18  
reeze 写道
gembler 写道
sdh5724 写道

几乎是为了seo.


看来,淘宝网为什么要这么做,已经有答案了。

跟SEO没有关系吧。
这样根本就不SEO。


我认为是为了把url拉丁化,拉丁化的目的是照顾那些IM工具,mail工具等里面对url地址自动加连接时进行url切断时,不被错误切开。
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics