一、竞赛意义
“交通大数据”主题竞赛利用实际城市交通大数据,搭建交通信息化发展和应用探索与实践的平台,开展多方面交通数据挖掘研究。目的在于:
(1)推动基于大数据的新一代智能交通系统发展,从数据出发,立足现实,结合理论研究,推进大数据各项工作;
(2)建立一个开放的公共服务支撑平台,提供共享数据、分析工具软件、评价标准及技术、热点问题讨论等;
(3)用大数据提升行业治理能力,用数据说话、用数据管理、用数据决策、用数据创新,围绕现阶段交通行业痛点难点,寻找解决交通实际问题的新思路、新方法。
二、竞赛规则
“交通大数据”主题竞赛要求参赛项目组登录平台,依据大赛主题指定的研究方向和研究内容,从平台获取特定时段的全量轨迹数据,通过测量平台提供的交通信息采集方式,根据其研究需求部署研究环境、获取相关数据、开展相关研究,在规定时间内完成研究并提交作品。
1、数据来源
大赛数据为OpenITS联盟提供的安徽宣城特定时段的全量轨迹脱敏数据,时间维度为30天,数据采集区域覆盖宣城全部干道,主要包括:
● 任意位点、任意时间、任意统计频率的车道级线圈数据;
● 给定最大渗透率下任意占比的浮动车GPS数据。
数据说明:
虚拟测量平台可为大赛提供30天的全域、全量、全时数据,主要提供两类交通信息采集方式:定点检测线圈采集和GPS浮动车移动采集。
线圈数据:根据用户在虚拟交通测量平台设置的时间范围、空间位置、以及线圈装置的漏检率和统计间隔,可以输出虚拟线圈所在断面的流量数据和平均车速数据。其数据结构如下:
字段名 | 描述 |
DEVICEID | 设备ID |
FROMTIME | 统计起始时间 |
TOTIME | 统计结束时间 |
INTERVAL | 统计间隔 |
LANEID | 车道ID |
COUNT | 统计间隔内车辆计数 |
FLOW | 断面换算小时流量 |
ARITHMETIC_AVERAGE_SPEED | 车速算术平均值 |
HARMONIC_AVERAGE_SPEED | 车速调和平均值 |
浮动车GPS数据:根据用户在虚拟交通测量平台设定的时空范围内所设置的浮动车渗透率及其GPS采样间隔,获取浮动车坐标数据。其数据结构如下:
字段名 | 描述 |
TRAVELID | 车辆ID |
sj | 检测时间 |
longitude | 经度 |
latitude | 纬度 |
angle | 车辆方向角 |
speed | 瞬时车速 |
posm | 该有向路段中相对终止节点的里程位置 |
ftnode | 浮动车所处路段的起始节点和终止节点 |
地图数据:用户可在数据平台下载对应的地图数据,其数据结构如下:
字段名 | 描述 |
ROADID | 路段ID |
FNODE | 路段起始节点编号 |
TNODE | 路段结束节点编号 |
Geom | 路段地理信息字段 |
LaneDir | 车道转向信息 |
数据来源网址http://nactrans.openits.cn,数据详情见附件。
2、竞赛选题
“交通大数据”主题竞赛选题分为两个部分,可任选其一完成:
(1) 断面车道级流量预测,预测间隔为5 分钟
参赛者通过测量平台统一提供的线圈、浮动车测量等方式获取数据,建立并优化交通流预测模型。完成模型训练后,上传模型代码,评分系统将针对给定的5个路段断面,分别使用测试数据集对模型进行检测,综合考虑模型5个预测结果的预测精度等指标,给出综合评分。
(2) 路段车流量预测,预测间隔为15 分钟
参赛者通过测量平台统一提供的线圈、浮动车测量等方式获取数据,建立路段车流量预测模型,对不同道路路段进行预测。上传模型代码后,评分系统将针对给定的5个路段,并使用测试数据集对模型进行评价,综合考虑模型的预测误差指标,给出综合评分。
3、提交成果形式
为了便于评委了解作品及其技术细节,在作品提交截止日期前,各团队需要提供以下内容:
(1) 模型完整代码,包括模型的最终参数;
(2) 结题报告;
结题报告须对以下方面内容进行详细说明:
1. 研究背景:介绍研究的由来、意义、环境、状态、前人研究成果以及当前具有的条件等基础信息。
2. 研究数据支撑:介绍作品所使用到的比赛数据,并详细说明这些数据的使用情况。
3. 研究内容:对作品研究的内容进行梳理介绍。
4. 研究技术路线:详细介绍研究的方法、工具和手段,说明研究的流程
5. 研究结果:对研究的结果进行完整、详细、清晰表达。
6. 研究总结:对研究的问题、过程及成果进行总结。
4、评比规则
大赛将提供30天的两个平峰时段(11:00 – 13:00与20:00 – 22:00)、两个高峰时段(7:00 – 9:00与17:00 – 19:00)的数据作为训练集;并提供1周7天同样时段的数据作为测试集。参赛者须基于此完成作品。(训练集见附件,拟指定5个断面和5条路段进行研究)
为体现大赛的权威性、公正性、公平性,参赛作品的评审方法为:
参赛作品将以算法复杂度和预测结果精度作为主要指标进行量化考核(分数占比50%),预测结果精度评价指标主要包括如下几个。
●均方根误差(RMSE),可对预测效果进行综合评价。
●绝对误差平均(MAE),可对预测的绝对误差进行综合评价。
●平均绝对百分误差(MAPE),可对预测的相对误差进行综合评价。
除了上述量化评价指标,作品报告完整性(分数占比10%)、模型算法先进性(分数占比20%)、研究方法的创新性(分数占比20%),也将作为参赛作品考核评价的考虑因素。
三、竞赛组织
“交通大数据”主题竞赛的参赛要求、组织程序和评审办法参照《“新国线杯”第十五届全国大学生交通运输科技大赛实施方案》执行。
四、其他说明
1、多场景虚拟交通测量平台相关问题详见附件使用说明,更多问题请咨询:
陈志军老师,联系电话:15827127655,邮箱:chenzj556@whut.edu.cn
黄玮老师,联系电话:19868388335,邮箱:huangwei5@mail.sysu.edu.cn
2、未尽事宜,解释权及修改权归大赛组委会。
附件-OpenITS多场景虚拟交通测量平台使用说明.docx