`
月中老郎
  • 浏览: 29223 次
  • 性别: Icon_minigender_2
  • 来自: 广州
社区版块
存档分类
最新评论

短址(short URL)

 
阅读更多

前言:

最近看了一些关于短址(short URL)方面的一些博客,有些博客说到一些好的东西,但是,也不是很全,所以,这篇博客算是对其它博客的一个总结吧。

 

介绍:

短址,顾名思义,就是把长的 URL 转成短的 URL, 现在提供这种服务的有很多公司,我们以google家的 URL shortener 服务: http://goo.gl/ 为例。

首先我们到 http://goo.gl/,然后把地址http://url.cn/XUxifg输入进去,最后它会返回一个更短的URL,http://goo.gl/Jfs6q 。如下图所示:

 


 

URL 解析:

当我们在浏览器里输入 http://goo.gl/Jfs6q 时,DNS首先解析获得http://goo.gl/的IP地址。当DNS获得IP地址以后(比如:74.125.225.72),会向这个地址发送HTTP GET请求,查询 Jfs6q, 这个时候,http://goo.gl/服务器会把请求通过HTTP 301转到对应的长URL http://blog.csdn.net/beiyeqingteng 。后面的解析过程就和平常网址解析是一样的了。

 

短址本质:

短址本质上是实现了一个映射函数 f: X -> Y 。而这个映射函数必须同时具有两个特点:

1. 如果 x1 != x2, 则 f (x1) != f(x2);

2. 对于每一个 y, 能够找到唯一的一个 x 使得 f(x) = y;

对于任何的线性函数,比如 f(x) = 2x,都满足这样的条件。

 

好了,如果了解了短址的本质,我们再来看它是如何实现的。

注明:在google URL shortener 服务中,它允许一个长 url 对应多个短的url。这可能是出于安全上的考虑。在本文中,我们不考虑这种情况。

 

实现:

短址的长度一般设为 6 位,而每一位是由 [a - z, A - Z, 0 - 9] 总共 62 个字母组成的,所以6位的话,总共会有 62^6 ~= 568亿种组合,基本上够用了。在google URL shortener 服务中,短址长度为 5,大概有9亿多种组合.

 

假设我们用数据库来保存长地址和短地址的映射,那么,在表 LongtoShortURL 中,我们会有三列:

1. ID,int,  自动增长;

2. LURL,varchar,  // 长URL;

3. SURL, varchar,  // 短URL。

 

现在我们考虑通过如何长URL得到唯一的短URL。

 

在讲具体算法以前,先提一个问题:10进制数和16进制数之间的转换是否满足刚刚提到的映射函数 f: X -> Y中的两个条件?

答案: 是。

 

本文的思路也是利用进制之间的转换。因为我们总共有 62 个字母,我们可以自创一种进制,叫做 62 进制。其规则如下:

[html] view plain copy print ?
  1. 0  → a  
  2. 1  → b  
  3. ...  
  4. 25 → z  
  5. ...  
  6. 52 → 0  
  7. 61 → 9  
0  → a
1  → b
...
25 → z
...
52 → 0
61 → 9

所以,对于每一个长地址,我们可以根据它的ID,得到一个6位的 62 进制数,这个6位的 62 进制数就是我们的短址。具体实现如下:

[java] view plain copy print ?
  1. public ArrayList<Integer> base62(int id) {  
  2.       
  3.     ArrayList<Integer> value = new ArrayList<Integer>();  
  4.     while (id > 0) {  
  5.         int remainder = id % 62;  
  6.         value.add(remainder);  
  7.         id = id / 62;  
  8.     }  
  9.       
  10.     return value;  
  11. }  
public ArrayList<Integer> base62(int id) {
	
	ArrayList<Integer> value = new ArrayList<Integer>();
	while (id > 0) {
		int remainder = id % 62;
		value.add(remainder);
		id = id / 62;
	}
	
	return value;
}

举例:

对于 ID = 138,通过 base62(138), 我们得到 value = [14, 2]。根据上面的对应规则表,我们可以得到其对应的短址为:aaaabn 。(由 value 得到具体的短址,可以通过switch 语句得到,因为代码太长,在此略过。)

 

当我们想通过短址找到所对应的长地址,方法也很简单,就是把62进制数转成10进制数即可,这样我们就可以得到长地址的ID了。代码如下:

[java] view plain copy print ?
  1. public static int base10(ArrayList<Integer> base62) {  
  2.     //make sure the size of base62 is 6  
  3.     for (int i = 1; i <= 6 - base62.size(); i++) {  
  4.         base62.add(00);  
  5.     }  
  6.       
  7.     int id = 0;  
  8.     int size = base62.size();  
  9.     for (int i = 0; i < size; i++) {  
  10.         int value = base62.get(i);  
  11.         id += (int) (value * Math.pow(62, size - i - 1));  
  12.     }  
  13.       
  14.     return id;  
  15. }  
public static int base10(ArrayList<Integer> base62) {
	//make sure the size of base62 is 6
	for (int i = 1; i <= 6 - base62.size(); i++) {
		base62.add(0, 0);
	}
	
	int id = 0;
	int size = base62.size();
	for (int i = 0; i < size; i++) {
		int value = base62.get(i);
		id += (int) (value * Math.pow(62, size - i - 1));
	}
	
	return id;
}

比如,对于短址aaae9a,其62进制为[0, 0, 0, 4,61,0] ,则其长地址的ID 为[0, 0, 0, 4,61,0] = 0×62^5+ 0×62^4 + 0×62^3 + 4×62^2 + 61×62^1 + 0×62^0 = 1915810。有了ID,我们自然就可以得到长地址了。

分享到:
评论

相关推荐

    短网址工具 ShortURL

    《短网址工具 ShortURL:轻松实现链接缩短与管理》 在互联网时代,长串复杂的网址往往给用户带来不便,无论是分享、记忆还是美观性都存在问题。此时,短网址工具 ShortURL 的出现,解决了这一问题。它是一款高效...

    shorturl-v1.3

    "shorturl-v1.3" 是一个短域名服务的源码包,主要目的是为了实现将长网址转换为简短易记的短网址。这个源码可能是由PHP开发的,因为压缩包中的文件名包含了 `functions.php` 和 `main.php` 等常见的PHP文件。下面...

    java short URL

    在提供的文件`ShortUrl.java`中,可能会包含短链接服务的核心实现,包括长网址的处理、哈希计算、映射以及短链接的生成和解析功能。具体代码会涉及Java的`String`操作、哈希函数(如`java.security.MessageDigest`类...

    ShortUrl短连接程序

    ShortUrl短连接程序 非常简单 有ThinkPHP开发 ShortUrl短连接程序 非常简单 有ThinkPHP开发

    Go-shorturl短链接算法

    本文将深入探讨"Go-shorturl短链接算法"的相关知识点,包括短链接系统的原理、设计模式、Go语言的应用以及如何实现。 首先,短链接的生成主要依赖于哈希函数和编码方式。哈希函数如MD5或SHA-1可以将任意长度的字符...

    短网址生成网站ShortURL.zip

    ShortURL 是一个能缩短网址,并生成二维码的网站。http://3sd.me/APILong -&gt; ShortURL: http://3sd.me/j/shorten Method: POST Parameters: url Return: JSONExamples:$ curl 3sd.me/j/shorten -d "url=...

    ShortUrl 短网址生成工具 支持新浪 腾讯 百度.zip

    在互联网世界中,短网址(ShortUrl)生成工具是一种广泛使用的工具,它能够将长的、复杂的URL转换成简短的、易于记忆的链接。"ShortUrl 短网址生成工具 支持新浪 腾讯 百度.zip"这个压缩包文件提供了一个程序,可以...

    Python实现短网址ShortUrl的Hash运算实例讲解

    本文实例讲述了Python实现短网址ShortUrl的Hash运算方法。分享给大家供大家参考。具体如下: shorturl实现常见的做法都是将原始Url存储到数据库,由数据库返回一个对应ID。 以下要实现的是不用数据库支持就对原始URL...

    Go-shorturl-短链接生成算法

    本项目"Go-shorturl"专注于实现一个短链接生成算法,让我们来详细探讨其中涉及的知识点。 1. **哈希函数与哈希表**: 短链接生成通常会用到哈希函数,如MD5或SHA系列,将长链接转化为固定长度的哈希值。然而,哈希...

    基于PHP的短网址 urlShort.zip

    本项目“基于PHP的短网址 urlShort.zip”提供了实现短网址功能的基础架构。 【描述】"这是一个简单的PHP短网址生成系统,它能够将冗长的URL缩短,便于分享和记忆。通过这个系统,用户可以输入一个长网址,系统将...

    ShortURL:URL缩短服务短网址系统

    另一个是long url转short url的缓存,减少一个长网址可能对应多个短网址所造成的空间浪费 接口 提供long url转short url的api接口: url: http://u.liuin.cn method: POST param: url: string required # 需要转换...

    基于PHP的短网址urlShort源码.zip

    【标题】"基于PHP的短网址urlShort源码"是一个用于创建短链接的软件开发项目,采用PHP编程语言实现。短网址服务是互联网上一种流行的功能,它将长且复杂的URL转换为简短、易记的链接,方便分享和传播。这种服务在...

    shorturl (2).php

    shorturl (2).php

    微信小程序短网址转化小程序shorturl-wechat-master.zip

    这个名为"shorturl-wechat-master.zip"的压缩包文件包含了实现这一功能的源代码和相关资源。 首先,我们来详细了解微信小程序的基本概念。微信小程序是腾讯公司推出的一种轻量级应用开发平台,它无需下载安装即可...

    Go实现短url项目的方法示例

    shortUrl = append(tmp, shortUrl) id = id / 62 if id == 0 { break } } return string(shortUrl) } ``` 在实际应用中,为了保证转换后的短URL足够长,需要设置ID的起始值足够大。 ### 代码结构和逻辑 短...

    short-url 是基于 webman 的短链接服务系统.zip

    在short-url项目中,MySQL存储了长链接和对应的短链接数据,以及可能的用户信息和其他元数据。通过精心设计的数据表结构和索引优化,MySQL保证了数据的快速查询和更新,从而提高了系统的响应速度。 四、系统架构与...

    PHP实例开发源码—短网址 urlShort.zip

    在本实例"PHP实例开发源码—短网址 urlShort.zip"中,我们可以看到如何使用PHP实现这种功能。以下是对这个实例的详细解析: 1. **数据存储与编码** - **哈希函数**:短网址通常基于哈希函数来生成唯一的短码。在...

    搜索链接urlShort 1.1.2-urlshort.zip

    1. **源代码目录**:存放 "urlShort" 服务的核心代码,通常会分为多个文件和文件夹,如 `index.js`(主入口文件)、`shortener.js`(短链接生成模块)等。 2. **配置文件**:如 `config.json`,可能包含数据库连接...

Global site tag (gtag.js) - Google Analytics