通过一个人或者物体的轨迹能挖掘出很多信息,比如通过地铁数据能分析出哪些是普通出行者,哪些是旅游的,哪些是购物的,哪些是小偷:
今天给大家推送几篇轨迹挖掘相关文章:
一、《轨迹挖掘概述》
作者:YU ZHENG
【概述】
位置获取和移动计算技术的进步已经产生了大量的空间轨迹数据,这些数据代表了各种移动物体的移动性,例如人、车辆和动物。在过去的十年中,已经提出了许多用于处理、管理和挖掘轨迹数据的技术,从而促进了广泛的应用。在本文中,我们对轨迹数据挖掘的主要研究进行了系统的调查,提供该领域的全景以及其研究主题的范围。遵循从轨迹数据推导、轨迹数据预处理、轨迹数据管理到各种挖掘任务(如轨迹模式挖掘、异常值检测和轨迹分类)的路线图,调查探讨了连接、相关性和这些现有技术之间的差异。该调查还介绍了将轨迹转换为其他数据格式的方法,例如图形、矩阵和张量,可以应用更多的数据挖掘和机器学习技术。最后,介绍了一些公共轨迹数据集。本次调查有助于塑造轨迹数据挖掘领域,为社区提供对该领域的快速了解。
【轨迹预处理】
在使用轨迹数据之前,我们需要处理一些问题,例如噪声过滤、分割和地图匹配。这个阶段称为轨迹预处理,是许多轨迹数据挖掘任务的基本步骤。
噪声过滤的目标是从轨迹中去除一些噪声点,这些噪声点可能是由位置定位系统的信号差(例如,在城市峡谷中旅行时)引起的。
停留点检测算法识别移动物体在某个距离阈值内停留一段时间的位置。停留点可以代表用户去过的餐厅或购物中心,比轨迹中的其他点承载更多的语义含义。
轨迹压缩是在保持轨迹效用的同时,压缩轨迹的大小(目的是减少通信、处理和数据存储的开销)。
轨迹分割将轨迹按时间间隔、空间形状或语义含义划分为多个片段,用于聚类和分类等进一步处理。
地图定位旨在将轨迹的每个点投影到真正生成该点的相应路段上。
【轨迹数据管理】
许多在线应用程序需要即时挖掘轨迹数据(例如检测交通异常),需要有效的数据管理算法来快速从大轨迹语料库中检索满足特定标准(例如时空约束)的特定轨迹。通常有两种主要类型的查询:最短距离查询和范围查询。前者还与距离度量相关,例如两个轨迹之间的距离。此外,轨迹有两种类型(历史和近期),需要不同的管理方法。
这是本节的大纲。
空间数据库:介绍空间数据的基本索引和检索算法。
查询:范围查询和 KNN 查询
轨迹的距离度量:点到轨迹、轨迹到轨迹、段到段。
索引结构:3D索引、多版本索引、空间分区+时间索引
检索算法
【轨迹不确定性】
对象连续移动,而它们的位置只能在离散时间更新,使得移动对象在两次更新之间的位置不确定。为了提高轨迹的效用,一系列研究试图对轨迹的不确定性进行建模和降低。相反,一个研究分支的目的是在用户公开他的轨迹时保护用户的隐私。
基于自由空间中的不确定轨迹构建可能的路径
基于低采样率轨迹推断道路网络中最可能的路线
【轨迹模式挖掘】
大量的空间轨迹为分析移动物体的移动模式提供了机会,可以用包含某种模式的单个轨迹或共享相似模式的一组轨迹来表示。在本节中,我们调查了与四类模式有关的文献:共同移动模式、轨迹聚类、频繁序列模式和周期性模式。
【轨迹分类】
使用监督学习方法,我们可以 将轨迹或轨迹片段分类为一些类别,这些类别可以是活动(如远足和用餐)或不同的交通方式,如步行和驾驶。
【轨迹异常检测】
与轨迹数据中经常出现的轨迹模式不同,轨迹异常值(也称为异常)可以是在某些相似性度量方面与其他项目显著不同的项目(轨迹或轨迹段)。它也可能是不符合预期模式的事件或观察结果(由轨迹集合表示)(例如,由车祸引起的交通拥堵)。第 8 节介绍了从轨迹数据中进行异常检测。
【将轨迹转化为图形】
除了以原始形式研究轨迹外,我们还可以将轨迹转换为其他格式,例如图形、矩阵和张量。轨迹的新表示扩展和多样化了轨迹数据挖掘的方法,利用了现有的挖掘技术,例如图挖掘、协同过滤(CF)、矩阵分解(MF)和张量分解(TD)。
【将轨迹变成矩阵】
协同过滤 (CF):基于用户的 CF 和基于项目的 CF
矩阵分解:SVD 和 NMF
上下文感知矩阵分解
张量分解
上下文感知张量分解
【轨迹数据集下载】
这是一个 GPS 轨迹数据集,由 182 位用户在两年多的时间里(从 2007 年 4 月到 2012 年 8 月)在(微软亚洲研究院)GeoLife 项目中收集。该轨迹数据集可用于许多研究领域,例如移动模式挖掘、用户活动识别、基于位置的社交网络、位置隐私和位置推荐。
https://www.microsoft.com/en-us/download/details.aspx?id=52367
二、《大容量智能卡数据在地铁系统中长期停留的旅行模式和行为分析》
作者:Gang Xue , Daqing Gong , Jianhai Zhang , Peng Zhang 、 Qimin Tai
由于北京地铁平均每日交通流量超过1200万人,确保地铁的安全尤为重要。大数据显示,每天有4000多名乘客因各种原因在北京地铁里长期停留。本文提出了一种基于最短路径的识别地铁里长期停留的方法,并对其轨迹进行了分析。结合以往学者的研究,利用地铁数据分析扒窃、广告、乞讨等危害地铁安全的行为。
三、《轨迹数据挖掘方法和应用综述》
作者:Jean Damascene Mazimpaka、Sabine Timpf
位置感知设备的使用越来越多,导致轨迹数据的可用性越来越高。因此,研究人员致力于开发分析方法,包括轨迹的不同数据挖掘方法。然而,迄今为止,这方面的研究大多是孤立的,我们仍然缺乏对轨迹挖掘应用中所解决的问题、用于解决这些问题的方法以及使用所获得的解决方案的应用的综合看法。本文首先讨论了轨迹挖掘的一般方法及它们之间的关系。然后,我们讨论并分类使用轨迹数据所解决的应用问题,并将它们关联到所使用的通用挖掘方法和基于它们的现实应用。我们将轨迹挖掘应用问题归类到主要问题组下,基于它们之间的关系。问题的这种分类可以指导研究人员识别新的应用问题。这些方法之间的关系以及应用问题与挖掘方法之间的关联可以帮助研究者发现方法之间的差距,并激励他们开发新的方法。本文还可以指导分析人员选择适合具体问题的方法。本文的主要贡献是提供了一个综合视图,说明了挖掘轨迹数据的应用和所采用的方法。
导言
轨迹数据和轨迹数据挖掘
挖掘方法
3.1 主要挖掘方法
3.1.1聚类
3.1.2分类
3.2 二次挖掘方法
3.2.1 模式挖掘
3.2.2 异常检测
3.2.3 预测预报
3.3 轨迹挖掘方法的关系
4. 轨迹挖掘应用问题
4.1 运动物体的特征
4.2 发现社会关系
4.3 地点或区域的特征
4.4 地点或地区之间连通性的特征
4.5 发现和识别社会事件
4.6 基于轨迹的预测
4.7 基于轨迹的建议
5. 应用
5.1 运输
5.2 城市规划
5.3 环境治理
5.4 节约能源
5.5 社区服务
5.6 商业应用
5.7 公共安全
5.8 生态学
5.9 体育分析
6. 轨迹数据挖掘中的开放性问题
6.1 处理海量数据
6.2 异构数据的集成和处理
6.3 跨尺度轨迹数据挖掘
6.4 挖掘方法专家和应用领域专家
6.5 隐私处理
7. 结论和今后的工作
四、《基于长短记忆型卷积神经网络的犯罪地理位置预测方法》
作者:肖延辉 王 欣 冯文刚 田华伟 吴绍忠 李丽华
由于犯罪活动本身的隐蔽性以及犯罪嫌疑人的反 侦查行为, 如何准确地预测犯罪分子的位置一直是公 安工作研究的难点所在, 因此本文提出一种基于长短 记忆型卷积神经网络的犯罪地理位置预测方法: 利用 卷积神经网络提取重要犯罪位置特征, 挖掘位置数据 在空间维度上的局部相关性, 然后基于长短记忆型神 经网络学习位置特征在时间维度上的连续性, 进而进 行准确的位置预测。在真实轨迹数据集 GeoLife 上, 本 文方法可以有效挖掘空间相关性和时间连续性, 精确 度达到 0.79, 远远高于随机预测的精确度 0.0007。
五、《提高移动性检测的轨迹数据挖掘技术的概述》
作者:B Jyothi, V Rama Krishna, G Balram, G Kiran Kumar
轨迹数据挖掘在现实世界中起着非常重要的作用,它能够预测人、车辆、动物等的移动位置细节。轨迹数据分析是最困难的任务,这是由于人类的连续移动频繁地改变位置细节。轨迹图可能包含更复杂的噪声细节。为了保证轨迹数据挖掘结果的准确性,需要对轨迹数据分析更加集中。为了对轨迹数据进行分析,不同研究者提出了多种研究方法。文中对各种轨迹数据分析技术进行了讨论。并对研究技术进行了优缺点的比较评价,以评价其性能。最后根据不同的性能指标对研究技术进行数值评价。在此基础上,选取了最佳方法进行轨迹数据挖掘。
完整PDF原文及机器翻译已上传小编知识星球
长按识别下面的二维码可加入星球
里面已有四千余篇资料可供下载
越早加入越便宜
续费五折优惠
机器翻译支持: 北京百分点科技集团股份有限公司
电话:400-6240-800
邮箱:[email protected] 2022