前言:
最近看了一些关于短址(short URL)方面的一些博客,有些博客说到一些好的东西,但是,也不是很全,所以,这篇博客算是对其它博客的一个总结吧。
介绍:
短址,顾名思义,就是把长的 URL 转成短的 URL, 现在提供这种服务的有很多公司,我们以google家的 URL shortener 服务: http://goo.gl/ 为例。
首先我们到 http://goo.gl/,然后把地址http://url.cn/XUxifg输入进去,最后它会返回一个更短的URL,http://goo.gl/Jfs6q 。如下图所示:
URL 解析:
当我们在浏览器里输入 http://goo.gl/Jfs6q 时,DNS首先解析获得http://goo.gl/的IP地址。当DNS获得IP地址以后(比如:74.125.225.72),会向这个地址发送HTTP GET请求,查询 Jfs6q, 这个时候,http://goo.gl/服务器会把请求通过HTTP 301转到对应的长URL http://blog.csdn.net/beiyeqingteng 。后面的解析过程就和平常网址解析是一样的了。
短址本质:
短址本质上是实现了一个映射函数 f: X -> Y 。而这个映射函数必须同时具有两个特点:
1. 如果 x1 != x2, 则 f (x1) != f(x2);
2. 对于每一个 y, 能够找到唯一的一个 x 使得 f(x) = y;
对于任何的线性函数,比如 f(x) = 2x,都满足这样的条件。
好了,如果了解了短址的本质,我们再来看它是如何实现的。
注明:在google URL shortener 服务中,它允许一个长 url 对应多个短的url。这可能是出于安全上的考虑。在本文中,我们不考虑这种情况。
实现:
短址的长度一般设为 6 位,而每一位是由 [a - z, A - Z, 0 - 9] 总共 62 个字母组成的,所以6位的话,总共会有 62^6 ~= 568亿种组合,基本上够用了。在google URL shortener 服务中,短址长度为 5,大概有9亿多种组合.
假设我们用数据库来保存长地址和短地址的映射,那么,在表 LongtoShortURL 中,我们会有三列:
1. ID,int, 自动增长;
2. LURL,varchar, // 长URL;
3. SURL, varchar, // 短URL。
现在我们考虑通过如何长URL得到唯一的短URL。
在讲具体算法以前,先提一个问题:10进制数和16进制数之间的转换是否满足刚刚提到的映射函数 f: X -> Y中的两个条件?
答案: 是。
本文的思路也是利用进制之间的转换。因为我们总共有 62 个字母,我们可以自创一种进制,叫做 62 进制。其规则如下:
- 0 → a
- 1 → b
- ...
- 25 → z
- ...
- 52 → 0
- 61 → 9
0 → a 1 → b ... 25 → z ... 52 → 0 61 → 9
所以,对于每一个长地址,我们可以根据它的ID,得到一个6位的 62 进制数,这个6位的 62 进制数就是我们的短址。具体实现如下:
- public ArrayList<Integer> base62(int id) {
- ArrayList<Integer> value = new ArrayList<Integer>();
- while (id > 0) {
- int remainder = id % 62;
- value.add(remainder);
- id = id / 62;
- }
- return value;
- }
public ArrayList<Integer> base62(int id) { ArrayList<Integer> value = new ArrayList<Integer>(); while (id > 0) { int remainder = id % 62; value.add(remainder); id = id / 62; } return value; }
举例:
对于 ID = 138,通过 base62(138), 我们得到 value = [14, 2]。根据上面的对应规则表,我们可以得到其对应的短址为:aaaabn 。(由 value 得到具体的短址,可以通过switch 语句得到,因为代码太长,在此略过。)
当我们想通过短址找到所对应的长地址,方法也很简单,就是把62进制数转成10进制数即可,这样我们就可以得到长地址的ID了。代码如下:
- public static int base10(ArrayList<Integer> base62) {
- //make sure the size of base62 is 6
- for (int i = 1; i <= 6 - base62.size(); i++) {
- base62.add(0, 0);
- }
- int id = 0;
- int size = base62.size();
- for (int i = 0; i < size; i++) {
- int value = base62.get(i);
- id += (int) (value * Math.pow(62, size - i - 1));
- }
- return id;
- }
public static int base10(ArrayList<Integer> base62) { //make sure the size of base62 is 6 for (int i = 1; i <= 6 - base62.size(); i++) { base62.add(0, 0); } int id = 0; int size = base62.size(); for (int i = 0; i < size; i++) { int value = base62.get(i); id += (int) (value * Math.pow(62, size - i - 1)); } return id; }
比如,对于短址aaae9a,其62进制为[0, 0, 0, 4,61,0] ,则其长地址的ID 为[0, 0, 0, 4,61,0] = 0×62^5+ 0×62^4 + 0×62^3 + 4×62^2 + 61×62^1 + 0×62^0 = 1915810。有了ID,我们自然就可以得到长地址了。
相关推荐
《短网址工具 ShortURL:轻松实现链接缩短与管理》 在互联网时代,长串复杂的网址往往给用户带来不便,无论是分享、记忆还是美观性都存在问题。此时,短网址工具 ShortURL 的出现,解决了这一问题。它是一款高效...
"shorturl-v1.3" 是一个短域名服务的源码包,主要目的是为了实现将长网址转换为简短易记的短网址。这个源码可能是由PHP开发的,因为压缩包中的文件名包含了 `functions.php` 和 `main.php` 等常见的PHP文件。下面...
在提供的文件`ShortUrl.java`中,可能会包含短链接服务的核心实现,包括长网址的处理、哈希计算、映射以及短链接的生成和解析功能。具体代码会涉及Java的`String`操作、哈希函数(如`java.security.MessageDigest`类...
ShortUrl短连接程序 非常简单 有ThinkPHP开发 ShortUrl短连接程序 非常简单 有ThinkPHP开发
本文将深入探讨"Go-shorturl短链接算法"的相关知识点,包括短链接系统的原理、设计模式、Go语言的应用以及如何实现。 首先,短链接的生成主要依赖于哈希函数和编码方式。哈希函数如MD5或SHA-1可以将任意长度的字符...
ShortURL 是一个能缩短网址,并生成二维码的网站。http://3sd.me/APILong -> ShortURL: http://3sd.me/j/shorten Method: POST Parameters: url Return: JSONExamples:$ curl 3sd.me/j/shorten -d "url=...
在互联网世界中,短网址(ShortUrl)生成工具是一种广泛使用的工具,它能够将长的、复杂的URL转换成简短的、易于记忆的链接。"ShortUrl 短网址生成工具 支持新浪 腾讯 百度.zip"这个压缩包文件提供了一个程序,可以...
本文实例讲述了Python实现短网址ShortUrl的Hash运算方法。分享给大家供大家参考。具体如下: shorturl实现常见的做法都是将原始Url存储到数据库,由数据库返回一个对应ID。 以下要实现的是不用数据库支持就对原始URL...
本项目"Go-shorturl"专注于实现一个短链接生成算法,让我们来详细探讨其中涉及的知识点。 1. **哈希函数与哈希表**: 短链接生成通常会用到哈希函数,如MD5或SHA系列,将长链接转化为固定长度的哈希值。然而,哈希...
本项目“基于PHP的短网址 urlShort.zip”提供了实现短网址功能的基础架构。 【描述】"这是一个简单的PHP短网址生成系统,它能够将冗长的URL缩短,便于分享和记忆。通过这个系统,用户可以输入一个长网址,系统将...
另一个是long url转short url的缓存,减少一个长网址可能对应多个短网址所造成的空间浪费 接口 提供long url转short url的api接口: url: http://u.liuin.cn method: POST param: url: string required # 需要转换...
【标题】"基于PHP的短网址urlShort源码"是一个用于创建短链接的软件开发项目,采用PHP编程语言实现。短网址服务是互联网上一种流行的功能,它将长且复杂的URL转换为简短、易记的链接,方便分享和传播。这种服务在...
shorturl (2).php
这个名为"shorturl-wechat-master.zip"的压缩包文件包含了实现这一功能的源代码和相关资源。 首先,我们来详细了解微信小程序的基本概念。微信小程序是腾讯公司推出的一种轻量级应用开发平台,它无需下载安装即可...
shortUrl = append(tmp, shortUrl) id = id / 62 if id == 0 { break } } return string(shortUrl) } ``` 在实际应用中,为了保证转换后的短URL足够长,需要设置ID的起始值足够大。 ### 代码结构和逻辑 短...
在short-url项目中,MySQL存储了长链接和对应的短链接数据,以及可能的用户信息和其他元数据。通过精心设计的数据表结构和索引优化,MySQL保证了数据的快速查询和更新,从而提高了系统的响应速度。 四、系统架构与...
在本实例"PHP实例开发源码—短网址 urlShort.zip"中,我们可以看到如何使用PHP实现这种功能。以下是对这个实例的详细解析: 1. **数据存储与编码** - **哈希函数**:短网址通常基于哈希函数来生成唯一的短码。在...
1. **源代码目录**:存放 "urlShort" 服务的核心代码,通常会分为多个文件和文件夹,如 `index.js`(主入口文件)、`shortener.js`(短链接生成模块)等。 2. **配置文件**:如 `config.json`,可能包含数据库连接...