FROM:http://tech.idv2.com/2011/06/17/location-search/
附近地点搜索,顾名思义,就是搜索用户附近有哪些地点。随着GPS和带有GPS功能的移动设备的普及, 附近地点搜索也变得炙手可热。不过在网上却很少有这方面的讨论。本文的方法并不算最好, 但足以应付一般的应用了。
本文中,数据库采用MySQL,语言采用python。理论上别的数据库和语言也没问题, 但我们要在经纬度上设置两个索引,所以如果你的数据库不支持索引,或者不支持在一个查询中使用两个索引, 那就只能想别的办法了。
球面最短距离公式
球面上任意两点之间的距离计算公式可以参考维基百科上的下述文章,这里就不再赘述了。
值得一提的是,维基百科推荐使用Haversine公式,理由是Great-circle distance公式用到了大量余弦函数, 而两点间距离很短时(比如地球表面上相距几百米的两点),余弦函数会得出0.999…的结果, 会导致较大的舍入误差。而Haversine公式采用了正弦函数,即使距离很小,也能保持足够的有效数字。 以前采用三角函数表计算时的确会有这个问题,但经过实际验证,采用计算机来计算时,两个公式的区别不大。 稳妥起见,这里还是采用Haversine公式。
其中
- R为地球半径,可取平均值 6371km;
- φ1, φ2 表示两点的纬度;
- Δλ 表示两点经度的差值。
距离计算函数
下面就是计算球面间两点(lat0, lng)-(lat1, lng1)之间距离的函数。
from math import sin, asin, cos, radians, fabs, sqrt
EARTH_RADIUS=6371 # 地球平均半径,6371km
def hav(theta):
s = sin(theta / 2)
return s * s
def get_distance_hav(lat0, lng0, lat1, lng1):
"用haversine公式计算球面两点间的距离。"
# 经纬度转换成弧度
lat0 = radians(lat0)
lat1 = radians(lat1)
lng0 = radians(lng0)
lng1 = radians(lng1)
dlng = fabs(lng0 - lng1)
dlat = fabs(lat0 - lat1)
h = hav(dlat) + cos(lat0) * cos(lat1) * hav(dlng)
distance = 2 * EARTH_RADIUS * asin(sqrt(h))
return distance
范围搜索算法
在庞大的地理数据库中搜索地点,索引是很重要的。但是,我们的需求是搜索附近地点, 例如,坐标(39.91, 116.37)附近500米内有什么地点?搜索条件是地点坐标与当前坐标之间的距离, 显然是无法应用索引的。
那么换个思路:首先算出“给定坐标附近500米”这个范围的坐标范围。 虽然它是个圆,但我们可以先求出该圆的外接正方形,然后拿正方形的经纬度范围去搜索数据库。
如图,红色部分为要求的搜索范围,绿色部分为实际搜索范围。
先来求东西两侧的的范围边界。在haversin公式中令φ1 = φ2,可得
写成python代码就是
dlng = 2 * asin(sin(distance / (2 * EARTH_RADIUS)) / cos(lat))
dlng = degrees(dlng) # 弧度转换成角度
然后求南北两侧的范围边界,在haversin公式中令 Δλ = 0,可得
写成python代码就是
dlat = distance / EARTH_RADIUS
dlng = degrees(dlat) # 弧度转换成角度
这样,根据当前点坐标,我们可以得出搜索范围为
left-top : (lat + dlat, lng - dlng)
right-top : (lat + dlat, lng + dlng)
left-bottom : (lat - dlat, lng - dlng)
right-bottom: (lat - dlat, lng + dlng)
然后利用这个范围构造SQL语句,即可实现范围查询:
SELECT * FROM place WHERE lat > lat1 AND lat < lat2 AND lng > lng1 AND lng < lng2;
在lat
和lng
列上建立索引,能从一定程度上提高范围查询的效率。
不过,这样查询到的地点是正方形范围内的地点,一些结果与当前点的距离可能会超出给定的距离。 如果要求严格,可以遍历结果并计算与当前点之间的距离,并过滤掉不符合要求的结果。
总结
附近地点搜索条件是距离,而数据库中一般只保存地点的经纬度,因此无法直接查询。 本文将距离转化成经纬度范围,利用经纬度上的索引,提高查询效率。
参考:http://www.cnblogs.com/yeagen/archive/2012/08/23/2653465.html
http://blog.sina.com.cn/s/blog_7c05385f0101eofb.html
相关推荐
### Google Scholar中文版搜索引擎初探 #### 一、Google Scholar中文版简介 2004年11月24日,全球领先的搜索引擎Google推出了一款专门为学术研究设计的搜索引擎——Google Scholar(简称GS)。该服务旨在帮助用户...
《一种基于Linux平台的搜索引擎初探》这篇文章主要探讨了如何在Linux操作系统上构建搜索引擎,并解析了其实现机制和过程。搜索引擎在互联网时代扮演着至关重要的角色,它通过收集、分类和检索网络信息,帮助用户快速...
COM技术初探.doc
网络公关初探资料.pdf
【传媒-“chatGPT+搜索引擎”模式初探】 随着科技巨头微软的创新举措,"ChatGPT+搜索引擎"的新型搜索模式正在重塑互联网信息获取的方式。2023年2月8日,微软推出了new Bing,这标志着一个新时代的到来,谷歌、百度...
企业信息化初探。。。。。
初探图形搜索技术的发展和应用.doc
《实现互联网医疗信息资源精准搜索的策略初探》这篇论文主要探讨了如何在互联网医疗领域实现信息资源的精准搜索,以提升医疗服务的质量和效率。文章针对当前互联网医疗平台存在的问题,如用户搜索效率低、信息匹配度...
关于物联网智能家居的初探. 关于物联网智能家居的初探
### 初探uCOS-II:嵌入式操作系统的基础与应用 #### 一、uCOS-II简介 uCOS-II,全称MicroC/OS-II,是一款专门为嵌入式系统设计的操作系统内核。它由Jean J. Labrosse创建,并在开源社区中得到了广泛的认可和支持。...
地产行业杂谈系列之十六:社区增值服务模式初探
六爻预测彩票初探.pdf
它在信息检索、文本分析和数据清洗等场景中非常有用,特别是在处理用户输入、搜索查询或者处理存在拼写错误的数据时。 二、Excel中的模糊匹配 1. **通配符搜索**:Excel提供了简单的模糊匹配功能,如使用通配符"*...
15、培训学校成本管理初探.doc
### USB2.0规范初探 #### USB2.0概述 USB2.0(Universal Serial Bus 2.0)是一项广泛应用于计算机领域的高速串行总线技术标准,它旨在简化外部设备与计算机之间的连接,提高数据传输速率的同时降低制造成本。USB...
天干地支在择时中的应用初探 天干地支是中国古代的计时系统,用于记录和预测时间周期。天干地支系统由十个天干(甲乙丙丁戊己庚辛壬癸)和十二个地支(子丑寅卯辰巳午未申酉戌亥)组成。天干地支的阴阳属性奇数为阳...
腾讯体育APP发展模式初探.pdf