基于GPS导航软件数据的复杂交通网络道路饱和动态建模
发布时间: 2025-08-17 01:31:39 阅读量: 1 订阅数: 4 

### 基于GPS导航软件数据的复杂交通网络道路饱和动态建模
#### 1. 引言
在2015年,某地区报告有1346344辆车辆以及47905公里的道路和高速公路。该地区是中美洲车辆数量第二多的国家,也是拉丁美洲每千名居民拥有车辆数最多的国家之一。不过,这是一个面积较小但道路网络密集的地区,有限的道路基础设施难以应对超百万辆的车辆通行,交通拥堵问题随着车辆数量的增长而日益复杂。大部分交通拥堵集中在大市区道路网络,因此这些路线是研究交通拥堵对出行影响的理想区域。
传统的《公路容量手册》(HCM)可用于计算和预测道路及高速公路的饱和流量等指标,但它需要许多参数,而该地区大部分道路难以获取这些参数,寻找详细的交通动态历史数据也并非易事。由于缺乏实地传感器和最新官方信息,我们利用2018年某GPS导航软件(Waze)应用数据库中的交通拥堵数据,来研究大市区主要道路和高速公路的交通拥堵行为及其对交通动态的影响。这些数据有助于准确估计道路网络饱和度,对决策者规划基础设施项目和合理利用资源具有重要意义。然而,这些数据的结构并非用于此类估计,我们需要进行重要的数据转换来实现分析目的。我们开发了一种基于Waze应用数据重建大市区主要道路的方法,以39号公路为例,通过估计每100米路段的延误及其变化,来了解饱和度的地理分布,这是在有限数据下理解和预测饱和度的第一步。
#### 2. 相关工作
- 以往的研究指出了该地区的十大交通陷阱,但它们主要关注城市直径1公里范围内拥堵的行为,而我们聚焦于特定道路路段的情况。某项目利用聚类分析技术发现,2017年大市区的拥堵报告可分为三类,分别是连接城市中心与周边的道路、人口中心和经济中心,但Waze数据的结构无法满足我们所需的详细程度。
- 有研究使用模拟数据提出了用于车辆网络最短路径发现的分层道路模型,以行驶时间为最短路径计算的度量标准,这启发我们创建一个基于Waze应用数据平均延误的加权道路网络。他们还使用了包含不同类型道路的分层图,这引导我们选择国家道路网络进行研究,因为并非所有道路的行为都相同。我们试图证明可以使用Waze数据作为主要输入构建道路网络,这是创建更复杂网络的第一步。
- 还有研究展示了基于网络的应用在支持城市决策、研究城市动态和交通拥堵方面的三种应用场景,我们使用导航软件应用数据的动机与之相关。另外,有研究采用类似概念创建加权双向有向图,通过速度来估计道路网络的容量。
#### 3. 数据分析方法
为处理数据,我们遵循以下工作流程:
```mermaid
graph LR
A[数据准备] --> B[探索性数据分析]
B --> C[道路网络建模]
```
##### 3.1 数据来源
- **Waze数据集**:拥堵数据由公共工程和运输部提供,每5分钟通过Waze应用程序编程接口直接下载。下载的数据中,一次拥堵是多个用户报告的组合,应用程序会整合这些报告并估计延误等指标。每个报告包含详细的拥堵长度和确切位置的坐标列表,数据最初以JSON格式存储,文件名包含下载的日期和时间信息。2018年全年的完整数据集包含52422040次拥堵报告,工作日有39955000次报告,其中周四和周五分别占20.7%和23%。我们使用以下三个变量来创建道路网络:
- **延误**:基于路段平均速度的延误(秒)。
- **线路**:每次拥堵的坐标列表(纬度和经度)。
- **ID**:每次拥堵的ID。
数据集中的其他变量包括城市、拥堵长度、道路类型、速度和街道名称。
- **国家道路网络**:国家道路网络(NRN)的空间线框对象是构建交通网络的重要输入,它由公共工程和运输部以shape文件形式提供,包含约7700公里的道路和300多条路线的位置信息,涵盖了整个网络中最繁忙的路线。
##### 3.2 数据准备
- **数据创建**:拥堵数据存储在JSON文件中,使用R编程语言将这些文件读取并整合到一个数据框中。每个文件包含部分拥堵数据,我们按列名合并它们。首先对拥堵表进行的更改之一是选择重要列,一些初始变量与我们的目的无关,因为它们包含与Waze
0
0
相关推荐









