地理信息检索

Fx_Bull

浏览: 12417 次

最近访客更多访客>>

dfz12300

woodding2008

boosan

wd1282988143

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

数据处理
空间应用

在工程实践中需要解决以下问题:1）检索门店附近一定范围内的活跃顾客，之后可以对顾客进行营销，比如通过push方式给顾客发送促销消息，从而达到拉新的目的 2）检索空间指定区域内，如某个商圈内或者某个商场内的顾客，进行有针对性的营销 3）判断点在哪个区域内，比如查询用户所在的商圈、所在的大学等等。这些功能作为基础服务，需要系统具备很高的性能，低时延、高吞吐。

本文主要介绍如何实现：1）检索指定坐标一定范围内的顾客 2)检索区域(如商圈、购物中心)内的顾客。

数据结构

程序=数据结构+算法，处理问题的关键点是选择合适的数据结构以及算法。空间索引是解决这类问题的利器，常用的空间索引数据结构包含:geohash、kd树、r树等。kd树（k-dimensional树的简称），主要应用于多维空间关键数据的搜索（如：范围搜索和最近邻搜索），利用kd树可以省去对大部分数据点的搜索，从而减少搜索的计算量。

kd-tree

kd树是一种对k维空间中的实例点进行存储以便对其进行快速检索的树形数据结构。kd树是二叉树，表示对k维空间的一个划分（partition）。构造kd树相当于不断地用垂直于坐标轴的超平面将k维空间切分，构成一系列的k维超矩形区域。kd树的每个结点对应于一个k维超矩形区域。

构造kd树的方法如下：构造根结点，使根结点对应于k维空间中包含所有实例点的超矩形区域；通过下面的递归方法，不断地对k维空间进行切分，生成子结点。

在超矩形区域（结点）上选择一个坐标轴和在此坐标轴上的一个切分点，确定一个超平面，这个
超平面通过选定的切分点并垂直于选定的坐标轴，(通常，依次选择坐标轴对空间切分)将当前超矩形区域切分为左右两个子区域（子结点）；这时，实例被分到两个子区域。这个过程直到子区域内没有实例时终止（终止时的结点为叶结点）。在此过程中，将实例保存在相应的结点上。

放到地图上可以化简为，只包含经度、维度的二维空间，依次按照经度纬度(竖一刀横一刀)切分空间,
假设有以下点集:

(41.9483,126.4145),(45.3228,126.4956),(34.0173,113.8261),(29.6967,113.8800),
(36.6535,117.0389),(23.1248,113.6023),(46.3041,128.9676)

构造出kd树如下

kd树构造

空间划分结果如下

空间划分

检索周边

查找(38.9483,116.4145)附近一定距离的点

迅速搜索到这个点位于(36.6535,117.0389)点构成的空间。左右都可能存在符合要求的点
(34.0173,113.8261)的下面空间不会包含目标点，于是过滤掉，放弃搜索。
(41.9483,126.4145)右边的空间不会包含目标点，放弃搜索

具体过程：首先找到包含目标点的叶结点；然后从该叶结点出发，依次回退到父结点：如果父结点的另一子结点的超矩形区域与圆相交，那么在相交的区域内寻找目标点。。

点查找

过滤规则：只需计算与上一级空间点相同经度或者相同纬度下距离是否小于目标距离。这里我们采用了化简后的距离函数，参见地理空间距离计算优化

检索区域

检索某个区域内的用户，只需将圆换成矩形，先查询到矩形内的所有点，然后利判断一下点是否在区域内。

Ray casting algorithm

以用户所在位置为起点，往右边（或左边）发出一条射线，计算该射线与多边形各个边的交点，如果交点个数是奇数则在多边形内部，否则在外部。

附近用户

对附近活跃用户有如下定义:最近30分钟内在门店附近打开应用的用户。需要保留历史记录，如果一个用户29分钟前在周围出现过，但是15分钟前就离开了，那么仍然算是周围用户，也就是说要保留历史状态，用户去过哪儿都可以查到。

周边用户效果图

项目为java项目，基于spring-quartz:


@Scheduled(cron = "0 0/10 * ? * *")

每十分钟触发一次，新建一颗新的索引树，将current指向它，并判断一下，最旧的二叉树是否应该丢弃，检索附近用户化简为检索3棵kd树。

我的顾客

某些poi对应30多万设备，总体近60G空间，且还会继续增长，如何查询某poi购买过的顾客，比较困难，如果扫描到周边用户之后再发起一万次请求判断是否是新客，显然不行。

解决方案：基于lsm思想实现了一个简易的kv存储，保存(poi,购买顾客列表)，直接放在本地磁盘，将求老客转化为求交集。

周边用户分布

简单的采用了k-means进行空间聚类，一定程度上反映了用户分布情况，缺点是聚类效果不够稳定。

取得效果

检索附近用户时总量500w记录延达到2ms以内。

关键代码

关键代码 summer

分享到：

并发编程底层 | 数据仓库基础

2016-04-18 15:38
浏览 781
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Delphi 12.3控件之TraeSetup-stable-1.0.12120.exe: Delphi 12.3控件之TraeSetup-stable-1.0.12120.exe

基于GPRS，GPS的电动汽车远程监控系统的设计与实现.pdf: 基于GPRS，GPS的电动汽车远程监控系统的设计与实现.pdf

基于MATLAB/Simulink 2018a的单机无穷大系统暂态稳定性仿真与故障分析: 内容概要：本文详细介绍了如何利用MATLAB/Simulink 2018a进行单机无穷大系统的暂态稳定性仿真。主要内容包括搭建同步发电机模型、设置无穷大系统等效电源、配置故障模块及其控制信号、优化求解器设置以及绘制和分析转速波形和摇摆曲线。文中还提供了多个实用脚本，如故障类型切换、摇摆曲线计算和极限切除角的求解方法。此外，作者分享了一些实践经验，如避免常见错误和提高仿真效率的小技巧。适合人群：从事电力系统研究和仿真的工程师和技术人员，尤其是对MATLAB/Simulink有一定基础的用户。使用场景及目标：适用于需要进行电力系统暂态稳定性分析的研究项目或工程应用。主要目标是帮助用户掌握单机无穷大系统的建模和仿真方法，理解故障对系统稳定性的影响，并能够通过仿真结果评估系统的性能。其他说明：文中提到的一些具体操作和脚本代码对于初学者来说可能会有一定的难度，建议结合官方文档或其他教程一起学习。同时，部分技巧和经验来自于作者的实际操作，具有一定的实用性。

【KUKA 机器人资料】：KUKA机器人剑指未来——访库卡自动化设备(上海)有限公司销售部经理邹涛.pdf: KUKA机器人相关资料

基于DLR模型的PM10–能见度–湿度相关性研究.pdf: 基于DLR模型的PM10–能见度–湿度相关性研究.pdf

MATLAB/Simulink中基于电导增量法的光伏并网系统MPPT仿真及其环境适应性分析: 内容概要：本文详细介绍了如何使用MATLAB/Simulink进行光伏并网系统的最大功率点跟踪(MPPT)仿真，重点讨论了电导增量法的应用。首先阐述了电导增量法的基本原理，接着展示了如何在Simulink中构建光伏电池模型和MPPT控制系统，包括Boost升压电路的设计和PI控制参数的设定。随后，通过仿真分析了不同光照强度和温度条件对光伏系统性能的影响，验证了电导增量法的有效性，并提出了针对特定工况的优化措施。适合人群：从事光伏系统研究和技术开发的专业人士，尤其是那些希望通过仿真工具深入理解MPPT控制机制的人群。使用场景及目标：适用于需要评估和优化光伏并网系统性能的研发项目，旨在提高系统在各种环境条件下的最大功率点跟踪效率。其他说明：文中提供了详细的代码片段和仿真结果图表，帮助读者更好地理解和复现实验过程。此外，还提到了一些常见的仿真陷阱及解决方案，如变步长求解器的问题和PI参数整定技巧。

【KUKA 机器人坐标的建立】：mo2_base_en.ppt: KUKA机器人相关文档

风力发电领域双馈风力发电机（DFIG）Simulink模型的构建与电流电压波形分析: 内容概要：本文详细探讨了双馈风力发电机（DFIG）在Simulink环境下的建模方法及其在不同风速条件下的电流与电压波形特征。首先介绍了DFIG的基本原理，即定子直接接入电网，转子通过双向变流器连接电网的特点。接着阐述了Simulink模型的具体搭建步骤，包括风力机模型、传动系统模型、DFIG本体模型和变流器模型的建立。文中强调了变流器控制算法的重要性，特别是在应对风速变化时，通过实时调整转子侧的电压和电流，确保电流和电压波形的良好特性。此外，文章还讨论了模型中的关键技术和挑战，如转子电流环控制策略、低电压穿越性能、直流母线电压脉动等问题，并提供了具体的解决方案和技术细节。最终，通过对故障工况的仿真测试，验证了所建模型的有效性和优越性。适用人群：从事风力发电研究的技术人员、高校相关专业师生、对电力电子控制系统感兴趣的工程技术人员。使用场景及目标：适用于希望深入了解DFIG工作原理、掌握Simulink建模技能的研究人员；旨在帮助读者理解DFIG在不同风速条件下的动态响应机制，为优化风力发电系统的控制策略提供理论依据和技术支持。其他说明：文章不仅提供了详细的理论解释，还附有大量Matlab/Simulink代码片段，便于读者进行实践操作。同时，针对一些常见问题给出了实用的调试技巧，有助于提高仿真的准确性和可靠性。

linux之用户管理教程.md: linux之用户管理教程.md

三菱PLC与组态王构建3x3书架式堆垛立体库：IO分配、梯形图编程及组态画面设计: 内容概要：本文详细介绍了利用三菱PLC（特别是FX系列）和组态王软件构建3x3书架式堆垛式立体库的方法。首先阐述了IO分配的原则，明确了输入输出信号的功能，如仓位检测、堆垛机运动控制等。接着深入解析了梯形图编程的具体实现，包括基本的左右移动控制、复杂的自动寻址逻辑，以及确保安全性的限位保护措施。还展示了接线图和原理图的作用，强调了正确的电气连接方式。最后讲解了组态王的画面设计技巧，通过图形化界面实现对立体库的操作和监控。适用人群：从事自动化仓储系统设计、安装、调试的技术人员，尤其是熟悉三菱PLC和组态王的工程师。使用场景及目标：适用于需要提高仓库空间利用率的小型仓储环境，旨在帮助技术人员掌握从硬件选型、电路设计到软件编程的全流程技能，最终实现高效稳定的自动化仓储管理。其他说明：文中提供了多个实用的编程技巧和注意事项，如避免常见错误、优化性能参数等，有助于减少实际应用中的故障率并提升系统的可靠性。

基于STM32的循迹避障小车仿真20250426（带讲解视频）: 基于STM32的循迹避障小车主控：STM32 显示：OLED 电源模块舵机云台超声波测距红外循迹模块（3个，左中右）蓝牙模块按键（6个，模式和手动控制小车状态） TB6612驱动的双电机功能：该小车共有3种模式：自动模式：根据红外循迹和超声波测距模块决定小车的状态手动模式：根据按键的状态来决定小车的状态蓝牙模式：根据蓝牙指令来决定小车的状态自动模式：自动模式下，检测距离低于5cm小车后退未检测到任何黑线，小车停止检测到左边或左边+中间黑线，小车左转检测到右边或右边+中间黑线，小车右转检测到中边或左边+中间+右边黑线，小车前进手动模式：根据按键的状态来决定小车的状态蓝牙模式： //需切换为蓝牙模式才能指令控制 *StatusX X取值为0-4 0：小车停止 1：小车前进 2：小车后退 3：小车左转 4：小车右转

海西蒙古族藏族自治州乡镇边界，矢量边界，shp格式: 矢量边界，行政区域边界，精确到乡镇街道，可直接导入arcgis使用

基于IEEE33节点的主动配电网优化：含风光储柴燃多源调度模型的经济运行研究: 内容概要：本文探讨了基于IEEE33节点的主动配电网优化方法，旨在通过合理的调度模型降低配电网的总运行成本。文中详细介绍了模型的构建，包括风光发电、储能装置、柴油发电机和燃气轮机等多种分布式电源的集成。为了实现这一目标，作者提出了具体的约束条件，如储能充放电功率限制和潮流约束，并采用了粒子群算法进行求解。通过一系列实验验证，最终得到了优化的分布式电源运行计划，显著降低了总成本并提高了系统的稳定性。适合人群：从事电力系统优化、智能电网研究的专业人士和技术爱好者。使用场景及目标：适用于需要优化配电网运行成本的研究机构和企业。主要目标是在满足各种约束条件下，通过合理的调度策略使配电网更加经济高效地运行。其他说明：文章不仅提供了详细的理论推导和算法实现，还分享了许多实用的经验技巧，如储能充放电策略、粒子群算法参数选择等。此外，通过具体案例展示了不同电源之间的协同作用及其经济效益。

【KUKA 机器人资料】：KUKA 机器人初级培训教材.pdf: KUKA机器人相关文档

基于MATLAB的CSP电站与ORC综合能源系统优化建模及应用: 内容概要：本文详细介绍了将光热电站(CSP)和有机朗肯循环(ORC)集成到综合能源系统中的优化建模方法。主要内容涵盖系统的目标函数设计、关键设备的约束条件（如CSP储热罐、ORC热电耦合）、以及具体实现的技术细节。文中通过MATLAB和YALMIP工具进行建模，采用CPLEX求解器解决混合整数规划问题，确保系统在经济性和环境效益方面的最优表现。此外，文章还讨论了碳排放惩罚机制、风光弃能处理等实际应用场景中的挑战及其解决方案。适合人群：从事综合能源系统研究的专业人士，尤其是对光热发电、余热利用感兴趣的科研工作者和技术开发者。使用场景及目标：适用于需要评估和优化包含多种能源形式（如光伏、风电、燃气锅炉等）在内的复杂能源系统的项目。目标是在满足供电供热需求的同时，最小化运行成本并减少碳排放。其他说明：文中提供了大量具体的MATLAB代码片段作为实例，帮助读者更好地理解和复现所提出的优化模型。对于初学者而言，建议从简单的确定性模型入手，逐渐过渡到更复杂的随机规划和鲁棒优化。

网站设计与管理作业一.ppt: 网站设计与管理作业一.ppt

基于MATLAB的双闭环Buck电路仿真模型设计与优化: 内容概要：本文详细介绍了如何使用MATLAB搭建双闭环Buck电路的仿真模型。首先定义了主电路的关键参数，如输入电压、电感、电容等，并解释了这些参数的选择依据。接着分别对电压外环和电流内环进行了PI控制器的设计，强调了电流环响应速度需要显著高于电压环以确保系统的稳定性。文中还讨论了仿真过程中的一些关键技术细节，如PWM死区时间的设置、低通滤波器的应用以及参数调整的方法。通过对比单闭环和双闭环系统的性能，展示了双闭环方案在应对负载突变时的优势。最后分享了一些调试经验和常见问题的解决方案。适合人群：从事电力电子、电源设计领域的工程师和技术人员，尤其是有一定MATLAB基础的读者。使用场景及目标：适用于需要进行电源管理芯片设计验证、电源系统性能评估的研究人员和工程师。主要目标是提高电源系统的稳定性和响应速度，特别是在负载变化剧烈的情况下。其他说明：文章不仅提供了详细的理论分析，还包括了大量的代码片段和具体的调试步骤，帮助读者更好地理解和应用所学知识。同时提醒读者注意仿真与实际情况之间的差异，鼓励在实践中不断探索和改进。

MATLAB实现冷热电气多能互补微能源网的鲁棒优化调度模型: 内容概要：本文详细探讨了MATLAB环境下冷热电气多能互补微能源网的鲁棒优化调度模型。首先介绍了多能耦合元件（如风电、光伏、P2G、燃气轮机等）的运行特性模型，展示了如何通过MATLAB代码模拟这些元件的实际运行情况。接着阐述了电、热、冷、气四者的稳态能流模型及其相互关系，特别是热电联产过程中能流的转换和流动。然后重点讨论了考虑经济成本和碳排放最优的优化调度模型，利用MATLAB优化工具箱求解多目标优化问题，确保各能源设备在合理范围内运行并保持能流平衡。最后分享了一些实际应用中的经验和技巧，如处理风光出力预测误差、非线性约束、多能流耦合等。适合人群：从事能源系统研究、优化调度、MATLAB编程的专业人士和技术爱好者。使用场景及目标：适用于希望深入了解综合能源系统优化调度的研究人员和工程师。目标是掌握如何在MATLAB中构建和求解复杂的多能互补优化调度模型，提高能源利用效率，降低碳排放。其他说明：文中提供了大量MATLAB代码片段，帮助读者更好地理解和实践所介绍的内容。此外，还提及了一些有趣的发现和挑战，如多能流耦合的复杂性、鲁棒优化的应用等。

Simulink与Carsim联合仿真：基于PID与MPC的自适应巡航控制系统设计与实现: 内容概要：本文详细介绍了如何利用Simulink和Carsim进行联合仿真，实现基于PID（比例-积分-微分）和MPC（模型预测控制）的自适应巡航控制系统。首先阐述了Carsim参数设置的关键步骤，特别是cpar文件的配置，包括车辆基本参数、悬架系统参数和转向系统参数的设定。接着展示了Matlab S函数的编写方法，分别针对PID控制和MPC控制提供了详细的代码示例。随后讨论了Simulink中车辆动力学模型的搭建，强调了模块间的正确连接和参数设置的重要性。最后探讨了远程指导的方式，帮助解决仿真过程中可能出现的问题。适合人群：从事汽车自动驾驶领域的研究人员和技术人员，尤其是对Simulink和Carsim有一定了解并希望深入学习联合仿真的从业者。使用场景及目标：适用于需要验证和优化自适应巡航控制、定速巡航及紧急避撞等功能的研究和开发项目。目标是提高车辆行驶的安全性和舒适性，确保控制算法的有效性和可靠性。其他说明：文中不仅提供了理论知识，还有大量实用的代码示例和避坑指南，有助于读者快速上手并应用于实际工作中。此外，还提到了远程调试技巧，进一步提升了仿真的成功率。

02.第18讲一、三重积分02.mp4: 02.第18讲一、三重积分02.mp4

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论