一种轨迹数据中的频繁子轨迹查找方法及装置
成果类型:: 发明专利
发布时间: 2022-10-27 09:48:36
轨迹数据就是时空环境下,通过对一个或者多个移动对象运动过程的采样所获得 的数据信息,包括采样点位置、采样时间、速度等,这些采样点数据信息根据采样先后顺序 构成了轨迹数据。常见的轨迹数据包括车辆行驶轨迹、移动互联网用户的旅行轨迹、移动互 联网用户的签到轨迹,等等,海量的轨迹数据里蕴含着丰富的信息,其频繁子轨迹可以表现 大多数人的行为模式及习惯,或者表现气候的变化规律等。
由于轨迹数据是数值数据,不能直接套用目前已相当成熟的字符串频繁子串的查 找算法来查找轨迹数据中的频繁子轨迹,因此,现有技术中大多直接对轨迹数据进行划分 并聚类,将长度为〇 (η)的轨迹划分为0 (η2)个子轨迹,再对这些子轨迹进行聚类分析来发现 频繁子轨迹,整个过程计算复杂度高,运算时间长。
本发明实施例结合了数据挖掘技术、后缀树算法以及非精确匹配,从而实现了较 优的轨迹数据中的频繁子轨迹的查找,通过使用较为高效的字符串算法来处理较为复杂的 多维数值数据,使得整个频繁子轨迹查找过程的计算复杂度大大降低,且合理的聚类方法 也使得本发明实施例对轨迹数据空间信息的聚类划分更加准确。 增加单元,为所述广义后缀树中的每个节点增加一个计数属性,所述计数属性用 于对该节点对应的字符串在所述广义后缀树中出现的次数进行计数.
技术合作
示出了本发明实施例提供的轨迹数据中的频繁子轨迹查找装置的结构框图, 该装置可以用于运行本发明图1至图5实施例所述的轨迹数据中的频繁子轨迹查找方法。为 了便于说明,仅示出了与本实施例相关的部分。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精 神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。