`
ghost_fly
  • 浏览: 111728 次
  • 性别: Icon_minigender_1
  • 来自: 长沙
社区版块
存档分类
最新评论

微博短链接的生成算法(Java版本)

    博客分类:
  • JAVA
 
阅读更多

微博短链接的生成算法(Java 版本)

最近看到微博的短链接真是很火啊,新浪、腾讯、搜狐等微博网站都加入了短链接的功能。之所以要是使用短链接,主要是因为微博只允许发140 字,如果链接地址太长的话,那么发送的字数将大大减少。短链接的主要职责就是把原始链接很长的地址压缩成只有6 个字母的短链接地址,当我们点击这6 个字母的链接后,我们又可以跳转到原始链接地址。

开始以为短链接是按照某种算法把原始链接压缩为短链接,再根据算法从短链接反算成原始链接的。后来尝试了下压缩算法(gzip 压缩算法),发现对于url 这种字符串越是压缩,长度就越长。通过对压缩算法的一些了解,发现靠压缩算法来实现这个功能不太靠谱。

后来在网上找到一个生成算法,该算法主要使用MD5 算法对原始链接进行加密(这里使用的MD5 加密后的字符串长度为32 位),然后对加密后的字符串进行处理以得到短链接的地址。原始的算法是C# 版本的,这里我把该算法修改成Java 版本的. 算法的具体代码如下,代码中有注释

package com.csdn.shorturl; 

public class ShortUrlGenerator { 

  

    /** 

      * @param args 

      */ 

    public static void main(String[] args) { 

       // 长连接: http://tech.sina.com.cn/i/2011-03-23/11285321288.shtml 

       // 新浪解析后的短链接为: http://t.cn/h1jGSC 

       String sLongUrl = "http://tech.sina.com.cn/i/2011-03-23/11285321288.shtml" ; // 3BD768E58042156E54626860E241E999 

       String[] aResult = shortUrl (sLongUrl); 

       // 打印出结果 

       for ( int i = 0; i < aResult. length ; i++) { 

           System. out .println( "[" + i + "]:::" + aResult[i]); 

       } 

    } 

  

    public static String[] shortUrl(String url) { 

       // 可以自定义生成 MD5 加密字符传前的混合 KEY 

       String key = "wuguowei" ; 

       // 要使用生成 URL 的字符 

       String[] chars = new String[] { "a" , "b" , "c" , "d" , "e" , "f" , "g" , "h" , 

              "i" , "j" , "k" , "l" , "m" , "n" , "o" , "p" , "q" , "r" , "s" , "t" , 

              "u" , "v" , "w" , "x" , "y" , "z" , "0" , "1" , "2" , "3" , "4" , "5" , 

              "6" , "7" , "8" , "9" , "A" , "B" , "C" , "D" , "E" , "F" , "G" , "H" , 

              "I" , "J" , "K" , "L" , "M" , "N" , "O" , "P" , "Q" , "R" , "S" , "T" , 

              "U" , "V" , "W" , "X" , "Y" , "Z" 

  

       }; 

       // 对传入网址进行 MD5 加密 

       String sMD5EncryptResult = ( new CMyEncrypt()).getMD5OfStr(key + url); 

       String hex = sMD5EncryptResult; 

  

       String[] resUrl = new String[4]; 

       for ( int i = 0; i < 4; i++) { 

  

           // 把加密字符按照 8 位一组 16 进制与 0x3FFFFFFF 进行位与运算 

           String sTempSubString = hex.substring(i * 8, i * 8 + 8); 

  

           // 这里需要使用 long 型来转换,因为 Inteper .parseInt() 只能处理 31 位 , 首位为符号位 , 如果不用 long ,则会越界 

           long lHexLong = 0x3FFFFFFF & Long.parseLong (sTempSubString, 16); 

           String outChars = "" ; 

           for ( int j = 0; j < 6; j++) { 

              // 把得到的值与 0x0000003D 进行位与运算,取得字符数组 chars 索引 

              long index = 0x0000003D & lHexLong; 

              // 把取得的字符相加 

              outChars += chars[( int ) index]; 

              // 每次循环按位右移 5 位 

              lHexLong = lHexLong >> 5; 

           } 

           // 把字符串存入对应索引的输出数组 

           resUrl[i] = outChars; 

       } 

       return resUrl; 

    } 

} 
 

二、 输出结果

执行上面代码的结果如下,会产生46 位字符串,任意一组都可以作为当前字符串的短链接地址。

[0]:::7nUFJn

[1]:::f6Zzy2

[2]:::j6jmQb

[3]:::2eAjea

三、 跳转原理

当我们生成短链接之后,只需要在表中(数据库或者NoSql )存储原始链接与短链接的映射关系即可。当我们访问短链接时,只需要从映射关系中找到原始链接,即可跳转到原始链接。

分享到:
评论
1 楼 xy5811 2011-11-15  
新浪微博应该不是直接用的这个算法,至少chars数组中顺序不一样

相关推荐

    Java资源包01

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    java开源包4

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    java开源包101

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    java开源包6

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    java开源包9

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    java开源包8

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    java开源包10

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    java开源包5

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    java开源包1

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    java开源包3

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    jsp微博系统-毕业设计.zip

    2. **发布模块**:撰写、编辑、删除微博,支持文字、图片、链接等多种内容形式。 3. **互动模块**:点赞、评论、转发、关注等功能,以及消息通知。 4. **搜索模块**:根据关键词搜索微博、用户。 5. **隐私设置**...

    微博源码

    1. **社交媒体平台**:微博是一种社交媒体服务,用户可以发布短消息(通常限制在一定字符数内),分享链接、图片和视频,并与其他用户进行互动,如点赞、评论和转发。构建类似微博的平台意味着我们要实现这些核心...

    java开源包2

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    java开源包11

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    java开源包7

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    网址转换工具

    3. **输出处理**:生成转换后的链接并展示给用户,同时可能保存到剪贴板方便复制。 4. **配置文件**:“im286.com.txt”可能是一个配置文件,包含工具使用的API密钥、短链接服务的配置信息,或是自定义编码规则。 ...

    opencv编译时可能缺少的文件.zip

    同时,压缩包可能还包含了解决这些问题的具体步骤或链接到博主的微博,那里可能有更详细的解决方法和安装指南。 总之,编译OpenCV是一个复杂的过程,需要对操作系统、编译工具和依赖库有深入的理解。遇到问题时,...

    史上最好传智播客就业班.net培训教程60G 不下会后悔

    功能点 站内搜索、栏目管理、视频播放(完全模仿优酷视频页面)、焦点图、静态页面生成(新浪、搜狐等大型网站普遍采用的技术)、文章管理、无刷新评论、评论的无刷新分页、敏感词过滤、用户管理、友情链接管理、...

Global site tag (gtag.js) - Google Analytics