问题:给定大量的出租车时间轨迹序列,分析出正常的行驶轨迹序列。
时间轨迹序列的提取:出租车轨迹
(1)GPS原始数据是<longitude,latitude,timestamp>→(x,y,t)。但是GPS是有噪声的,而且车辆可能趴活。因此要合理提取行驶轨迹用到如下策略
a) ΔT,定义最大时间间隔,如果2个连续GPS记录pi(xi,yi,ti)和pi+1(xi+1,yi+1,ti+1)的时间间隔大于ΔT,那么在ti时刻分割这个时间序列,即作为不同的行驶轨迹。
b) 给定时间间隔Δt,以及Δdistance。如果当前点与上一点距离Δd>Δdistance,那么该点作为上一个轨迹的终点,下一个轨迹的起点。(在实践中,使用的是,上一个点作为终点,当前点作为下一个轨迹的起点)
在实际大量的出租车轨迹中,由于上传数据,存在出租车ID相同的情况,因此有必要区分。
方法1:发现轨迹异常,即存在ID冲突,几乎同一时刻点的车辆出现在2个或2个以上的坐标位置,把该ID异常数据全部清除。
方法2:不清除数据,而是进行简单分类。发现异常数据,把异常数据,进行分类,即通过聚类找到该异常数据合适的类别。假设存在实际上是2个车辆的轨迹<p1,p1',p2,p3,p2',p3',p4,p5,p6,p4'>,在p1'时发现数据异常,此时只有一个类别cluster1{p1},因此需要新创建一个类别cluster2{p1'}。当分析p2时,因为p2与当前类的前一个序列点p1’有异常,那么判定p2是否属于其他类,最后,将p2分类到p1中。此时cluster1{p1,p2},cluster2{p1'},重复上述过程,可以得到cluster1{p1,p2,p3,p4,p5,p6},cluster2{p1',p2',p3',p4'}
方法1的缺点是:可能只有少部分错误,但却弃掉了大部分有用的数据;方法2,可能不能正确的分类,如果上述例子中p2,既可以属于cluster1,也可以属于cluster2,则无法正确分类。即,如果有相同的车辆ID上传数据,而且两辆车在物理距离上也很相近,那么该方法失效。
实践中,采用的是方法2。
这是某天凌晨到凌晨3点形成的出租车行驶轨迹图:
- 大小: 60.1 KB
- 大小: 63.7 KB
分享到:
相关推荐
该GPS轨迹数据集由182位用户在(微软亚洲研究院)Geolife项目中收集,历时超过五年(2007年4月至2012年8月)。 该数据集的GPS轨迹由一系列时间戳点表示,每个点都有其中包含纬度,经度和海拔高度的信息。 该数据集...
标题中的“UKF.rar_ trajectory ukf_GPS UKF_gps dat_卫星定位误差_机动方式”表明这个压缩包包含了使用Unscented Kalman Filter(UKF)算法处理GPS定位的数据和程序。UKF是一种非线性滤波方法,用于估计系统状态,...
在本主题中,我们将深入探讨“Trajectory_轨迹规划_轨迹插补_直线_trajectory_圆弧”的概念,以及如何使用M语言来实现这些功能。 首先,轨迹规划是确定一个物理系统如何从一个位置平滑地移动到另一个位置的过程。这...
【标题】:“Reinforcement Learning with Evolutionary Trajectory Generator” 论文解析 【描述】:本文主要讨论了如何结合进化算法与强化学习,特别是针对四足机器人行走控制的优化问题,通过一种名为“进化轨迹...
5. 结果解释:解析聚类结果,提取有用信息,为决策提供支持。 在提供的文件列表中,"Trajectory"可能包含了算法的源代码、实例数据、说明文档等资源,供用户学习和实践轨道聚类算法。通过深入理解并应用这些资源,...
文章按顺序介绍了轨迹数据挖掘的几个主要方面,包括轨迹数据的提取、预处理、管理,以及轨迹数据的各种挖掘任务。这些挖掘任务包括轨迹模式挖掘(trajectory pattern mining)、异常检测(outlier detection)、轨迹...
1. **更高效的连接算法**:原方法可能采用固定距离阈值或时间窗口连接轨迹点,而改进版可能引入更智能的策略,如动态阈值、基于速度和方向的连接,以适应不同情况下的轨迹连接。 2. **优化的数据结构**:使用更高效...
轨迹模式挖掘(Trajectory Pattern mining)是数据挖掘领域的一个重要分支,主要关注在地理信息系统(GIS)或全球定位系统(GPS)数据中发现有意义的、重复出现的移动模式。这个开源的C++程序旨在帮助研究人员和分析...
《轨迹挖掘(Trajectory Mining)技术详解》 轨迹挖掘,作为一种重要的数据挖掘技术,主要应用于地理信息系统、交通管理、动物迁徙研究等多个领域。在这个名为“Trajectory_Mining-master”的代码库中,我们可以深入...
在实际操作中,GPS Trajectory压缩包文件可能包含多个子文件,每个文件可能对应一个用户或一段时间内的轨迹数据。使用Python等编程语言,配合Pandas、NumPy等库,可以方便地读取、处理和分析这些数据。 总结起来,...
首先,文章标题 "Hybrid Trajectory Planning for Autonomous Driving" 指出了研究的核心内容:自主驾驶汽车的运动规划。这是自动驾驶技术中的一个重要环节,涉及在道路和交通环境中为车辆规划从起点到终点的安全、...
《轨迹规划在自动机器与机器人中的应用》(*Trajectory Planning for Automatic Machines and Robots*)是一本由 Luigi Biagiotti 和 Claudio Melchiorri 共同编著的专业书籍。本书深入探讨了自动机械和机器人领域内...
single and multiple quadrotors, and trajectory generation for single and multiple quadrotors. In Ch. 2 we describe a controller capable of handling large roll and pitch angles that enables a quadrotor...
标题中的"T-Drive trajectory data sample.rar"是一个压缩文件,它包含的是T-Drive出租车轨迹数据集的样本。这个数据集是由微软研究部门提供,用于数据分析、机器学习或人工智能相关的研究和竞赛。由于在描述中提到...
Code to read a file with diferent parametres and follow a trajectory with curves on lines and other paramatres.
总结来说,"轨迹聚类-trajectory-clustering"是一项旨在从地理位置轨迹数据中提取模式的技术,通过改进的DB-Scan等聚类算法实现。这一技术结合Linux环境下的编程实践,如Makefile,以及可能的数据集MoveBank,为理解...
**前馈控制(Feedforward Control)**: 前馈控制是一种控制策略,通过预测输入信号对输出的影响来减少或消除误差。与反馈控制相比,前馈控制不依赖于误差信号进行调整,而是基于对系统特性的了解以及预期输入的变化...