您所在的位置: 成果库 轨迹数据清洗方法及装置

轨迹数据清洗方法及装置

成果类型:: 发明专利

发布时间: 2022-10-27 09:29:37

科技成果产业化落地方案
方案提交机构:天津市滨海新区| 门松 | 2022-10-29 23:04:46
一种轨迹数据的清洗方法,其特征在于,包括: 步骤1:获取轨迹数据,并对所述轨迹数据进行处理得到每个物体在t时间的二维平面 坐标x和y,形成轨迹点(t,x,y); 步骤2:将每个物体的轨迹点(t,x,y)按照时间顺序形成轨迹线,将所述轨迹线上相邻 的两个轨迹点组成的线段作为一个轨迹线段,得到该物体的轨迹线段集合,其中,相邻的两 个轨迹点分别为所述轨迹线段的起点端和终点端; 步骤3:根据每个轨迹线段的距离以及相邻的两个时间t的差值计算每个轨迹线段的近 似速度; 步骤4:根据不同轨迹数据所得的近似速度集合将整个地图划分为不同的时空区域,其 中,每个时空区域的近似速度分布服从正态分布; 步骤5:将步骤3所得轨迹线段的近似速度与步骤4中的时空区域对应,计算步骤3所得 近似速度在所对应时空区域的近似速度分布中的置信度,计算步骤3所得近似速度所在时 空区域的近似速度分布在所述置信度下的均值和标准差,当步骤3所得近似速度与均值之 差的绝对值大于阈值时,对步骤3所得轨迹线段的终点端的轨迹点对应数据进行清洗。
数据获取与处理单元,用于获取轨迹数据,并对所述轨迹数据进行处理得到每个物体 在t时间的二维平面坐标x和y,形成轨迹点(t,x,y); 轨迹线段生成单元,用于将每个物体的轨迹点(t,x,y)按照时间顺序形成轨迹线,将所 述轨迹线上相邻的两个轨迹点组成的线段作为一个轨迹线段,得到该物体的轨迹线段集 合,其中,相邻的两个轨迹点分别为所述轨迹线段的起点端和终点端; 近似速度计算单元,用于根据每个轨迹线段的距离以及相邻的两个时间t的差值计算 每个轨迹线段的近似速度; 时空区域划分单元,用于根据不同轨迹数据所得的近似速度集合将整个地图划分为不 同的时空区域,其中,每个时空区域的近似速度分布服从正态分布; 异常数据清洗单元,用于将轨迹线段的近似速度与时空区域对应,计算近似速度在所 对应时空区域的近似速度分布中的置信度,计算近似速度所在时空区域的近似速度分布在 所述置信度下的均值和标准差,当近似速度与均值之差的绝对值大于阈值时,对轨迹线段 的终点端的轨迹点对应数据进行清洗。

随着便携式高精度位置定位仪器和廉价大容量可靠存储设备的出现,对各种移动 物体进行定位和轨迹记录分析成为了可能,但是由于各种定位手段的局限性,人们获得的 轨迹数据可能会出现许多异常数据。低质量的定位轨迹数据可能会造成人们在数据分析中 获得低质量甚至误导性的结果。因此,如何对原始数据进行清洗成为亟待解决的问题。

现有的数据清洗方法有多种,其中,初步的清洗方案是对原始数据进行一些"非 空"或者数值范围的约束;更进一步的方法是去除轨迹序列中距离差异明显异常的部分。

现有技术的缺点在于异常数据的标准与地形地貌无关,单纯计算连续的两个轨迹 点之间的距离。但是会出现如下情形:一辆车跨越了一座山,两次定位位置分别在山两边的 山脚,但是两次定位的时间差相对较小。上述情形明显为异常数据导致,但是对于整个数据 集来说,两次定位位置直线距离较近,因此不会被判定为异常数据,清洗效果不佳。

中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。

对于已有的全体数据集合,首先去掉速度近似于0的部分,然后用剩下的数据计算 每一次定位的近似速度,然后可以根据每次定位的时间、位置和近似速度画出整个地图的 时间和空间的速度分布,然后把整个地图划分为不同的区域,对于一个区域划分为不同的 时间段,使得这个区域这个时间段的速度分布服从正态分布。与现有技术相比,本发明的有益效果在于,本发明的轨迹数据的清洗方法及装置 同时考虑了时间和区域两个因素,进行时空区域划分,将每个物体轨迹线上相邻两个轨迹 点形成的轨迹线段与对应时空区域的速度进行综合考虑,数据清洗效果好,能够准确清洗 异常数据。

技术合作

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以 通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质 中,该程序在执行时,可包括上述方法的实施例的流程。其中,所述的存储介质可为磁碟、光 盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)。

以上所述本发明的具体实施方式,并不构成对本发明保护范围的限定。任何根据 本发明的技术构思所做出的各种其他相应的改变与变形,均应包含在本发明权利要求的保 护范围内。