• 工作总结
  • 工作计划
  • 心得体会
  • 领导讲话
  • 发言稿
  • 演讲稿
  • 述职报告
  • 入党申请
  • 党建材料
  • 党课下载
  • 脱贫攻坚
  • 对照材料
  • 主题教育
  • 事迹材料
  • 谈话记录
  • 扫黑除恶
  • 实施方案
  • 自查整改
  • 调查报告
  • 公文范文
  • 思想汇报
  • 当前位置: 雅意学习网 > 文档大全 > 公文范文 > 正文

    广东省高速公路通行大数据应用研究与实践

    时间:2023-06-17 15:15:04 来源:雅意学习网 本文已影响 雅意学习网手机站

    李 斌,梁轶涛

    (广东联合电子服务股份有限公司,广州 510000)

    在广东省委省政府的统一规划下,广东省的高速公路路网建设,实现了“镇镇通高速”的目标,为广大车主的出行和物流业的发展提供了坚实的交通基础设施保障. 2020年,广东省根据交通部的统一部署,实施取消省界收费站工程,为全省高速公路架设了大量的感知设备,快速提升了路面的数据采集和信息感知能力. 高速公路的数字化水平得到了大幅度提升. 如何充分利用好高速公路通行数据,成为目前行业内的1个热点问题.

    广东省联网中心在2019年开展取消省界收费站工程项目建设之初,就已为有效开展高速公路通行大数据应用做了系统化的准备,于2020年取消省界收费站系统切换的同时,上线了广东省联网中心数据中台. 基于数据中台,广东省联网中心进行了多项跨行业的通行大数据应用,并取得了一定成效. 本文主要对广东省联网中心面向非收费领域的应用进行了介绍.

    随着国家大数据战略的推进,以及“交通强国”项目逐步实施,高速公路通行大数据应用逐渐引起了行业内、外各单位的重视. 2019年底,国家《交通强国建设纲要》,明确了“大力发展智慧交通. 推动大数据、互联网、人工智能、区块链、超级计算等新技术与交通行业深度融合”的要求. 2020年4月,国家发展改革委明确了“新基建”中“融合基础设施”是指深度应用互联网、大数据、人工智能等技术,支撑传统基础设施转型升级,进而形成的融合基础设施,而“智能交通基础设施”是其中重要的一项. 上述政策都表明,交通大数据与人工智能应用正处于快速发展阶段.

    1.1 高速大数据应用需求迫切,应用场景不断增加

    过去,高速公路的通行数据主要应用于联网收费场景. 但随着近年来国民经济的发展和人民生活水平的提高,高速公路客、货运输量逐年稳步提升;
    私家车普及率的提升,加大了自驾游的普及,重大节假日客运车流量急剧增长. 这些现象既要求各级主管部门实时掌握高速公路出行状况,提升管理水平,也为各种商业化的出行服务平台提供了极好的商机. 而基于高速公路行业的大数据应用,为这些应用场景提供了高效、精准、客观的解决方案. 因此,高速大数据应用需求越来越迫切,其重要性不言而喻.

    1.2 高速大数据维度不断丰富,应用技术不断完善

    过去,高速公路的通行数据维度较为单一,主要是车辆的出口信息,满足的是出口收费的需要. 2020年取消省界收费站后,由于在路上架设了较多的ETC门架,其数据维度极大丰富,数据量也快速增加. 在数据维度上,除了结构化数据外,还增加了通行车辆的图像数据和视频数据. 对于结构化数据,也在原来出口信息的基础上,增加了入口信息、通行的ETC门架信息、货车入口称重信息和出口查验信息等.

    除了数据本身,对于数据的处理技术,近年来也有了很大进步. 人工智能和大数据处理技术已在交通行业有大量的落地应用. 大数据条件下的交通系统分析不是将大数据技术简单套用或者移植到交通领域,而是将大数据技术融入到交通系统分析体系中,是将数据组织成为信息,从信息提炼特征,从特征变化中发现规律,并就对策进行追踪评估的信息处理过程[1]. 进一步,杨超等[2]将交通大数据分为道路定点检测器、出租车GPS、公交IC卡、车牌识别、手机数据等,具有一定的预见性. 就目前而言,高速公路通行数据属于道路定点检测器产生的数据和车牌识别数据2大类. 这些信息和技术在高速公路的融合,能较完整地呈现每一辆车的高速通行路径,为各种应用场景提供了基础支撑.

    1.3 国内外应用研究领域不断扩大,应用前景不断涌现

    高速公路通行数据当前有多个应用研究领域,包括车辆逃费稽核、实时交通分析和车路协同等.

    1.3.1 车辆漏逃费稽核

    该领域是高速公路通行数据服务于本行业的典型场景. 在我国,高速公路的车辆通行费收费标准主要涉及收费车型、行驶里程2个因素,而漏逃费行为的本质,是对这2个因素的主观隐瞒或客观误识别. 通过对收费车辆的真实收费车型和实际通行里程进行大数据分析,则能对车辆的漏逃费行为进行稽核. 目前,在国家交通运输部应急处置中心的统筹下,已建立起1套由“国家- 省(直辖市)”组成的两级稽核体系,“大数据稽核”已写入高速公路联网收费的国家级总体建设方案中.

    1.3.2 实时交通分析

    该领域是高速公路通行数据在数据维度丰富后衍生的新应用领域. 过去该领域主要由导航软件提供商所垄断,其基于用户数据进行的实时交通分析,是1种基于样本的分析方法,能较好地反应出实时路程况. 国内的百度地图、高德地图、腾讯地图,国外的谷歌地图等均是典型的例子. 现在,由于高速公路通行数据维度越来越丰富,数据的实时性越来越高,基于此类数据进行的实时交通分析突显出“全量数据”的独特价值. 例如,利用此类数据,不仅能分析实时路况,还能统计实时的车流量,从而判断高速公路当前的通行饱和度,为各级路段管理单位提供数据支持. 目前,广东、江苏、浙江等高速公路车流量大省均开展这方面的应用,取得成效.

    经过近10 a的快速发展,广东省高速公路路网发达,车流量大,联网路段数量、通车里程、车流量均居全国首位.

    2.1 高速公路路网完善,通行车流量快速增加

    截止至2021年6月30日,广东省联网收费高速公路超过160条,通车里程数超过1万km,占全国的5.7%,每百平方公里里程密度超过5.5 km,是全国的3倍. 广东省近10 a联网里程发展趋势如图1所示.

    图1 广东省近10 a联网里程发展趋势

    在车流量方面,广东省高速公路日均出口车流量超过650万车次,占全国超20%,日均车流密度超过600车次/km,是全国的3.7倍. 在取消省界收费站项目实施后的1 a多时间里,广东省整体车流量基本稳定在全国20%左右,比排在第2、3、4位的省份的车流量之和还大.

    2.2 高速公路通行数据量快速增加,维度多样化

    图2 广东省高速公路原生数据维度和数据量示意图

    随着全国取消省界收费站工程的实施,高速公路通行数据采集的维度快速增加. 通过推广ETC发行,在高速公路大量架设ETC门架,布设RSU天线和图像抓拍设备,高速公路通行数据已从过去的单一维度的结构化数据,扩展到车牌识别数据、车辆抓拍图片数据、视频监控数据等维度. 同时,随着各路段对桥梁、隧道的智能化管理水平的提升,各类桥隧传感器的数据也在快速增加,成为除通行数据以外的有益补充. 以广东省为例,高速公路的原生数据维度和数据量如图2所示. 从图中可看出,全国取消省界收费站工程实施后,短短1 a内积累的数据量,就已经超过了广东省联网收费工作开展以来的全部数据的总和.

    2.3 高速公路通行数据实时性加强

    全国取消省界收费站工程实施后,交通部对通行数据的上传时间给出了明确规定,要求通行流水产生后的30 min内必须上传至省联网中心. 广东省经过“省站直传”等项目的改造后,通行数据上传时效性进一步提升,平均上传时间小于120 s. 时间性的加强,为许多准实时的数据应用场景提供了基础保障.

    广东省联网中心数据中台采用云平台的架构进行建设. 数据中台的核心是1个高性能的行业大数据存储和计算引擎,现已实现数据的集中存储和元数据的标准化;
    集成了多种主流的数据处理引擎和人工智能算法框架,能支撑离线计算、实时计算、图计算等业务场景;
    建立了多项面向大数据和人工智能应用的平台层服务,大幅度提升数据应用开发的效率;
    依托联网收费的安全体系,构建了较完善的数据安全保障体系,有效保证数据开发应用方面的安全性. 数据中台的应用系统架构如图3所示.

    3.1 高性能的大数据系统架构是开展行业大数据应用的基础

    3.1.1 行业大数据应用的系统架构存在问题分析

    图3 广东省联网中心数据中台架构示意图

    高速公路通行数据的数据量急剧增加,仅1 a的数据量,已远超过去十几年的总和. 过往,大数据应用一般被整合于联网收费业务系统中,为其子模块之一. 由于联网收费系统是典型的联机事务处理(OLTP)系统,均采用基于关系数据库系统(RDBMS)的数据应用技术,在面对数据量剧增的情况下,其数据处理性能已无法支撑实际需要. 基于联机分析处理(OLAP)的数据仓库技术,在数据存储和查询上能表现得比OLTP系统更好,但是,其数据处理环节基本上仍基于RDBMS,不能为大数据应用场景提供完整的解决方案. 因此,本行业的大数据应用亟需采用更为合理的数据架构.

    3.1.2 行业大数据应用的系统架构选型分析

    从系统架构上讲,Eric Brewer于2000年提出并被后续证明的CPA定律认为,在一个系统中,数据一致性(Consistency,C)、服务可用性(Availability,A)和分区容忍性(Partition Tolerance,P)这3个要素中只能同时满足2个[3]. RDBMS通过弱化分区容忍性(即P)来保证ACID准则,属于“CA”系统. 因此,在面对海量数据时,将难以快速提升性能(数据量的增加要求有更高的分区容忍性,因数据一般以分区的形式存储于DBMS中). 而大数据应用的特点是查询操作占绝大部分,可弱化数据一致性(即C)来提升性能,因此,“PA”系统更适合该类应用场景. CPA定理尽管提出于多年以前,但经历过12 a的软、硬件技术发展,Eric Brewer于2012年重新审视该定律时,认为其依然成立[4].

    图4 谷歌大数据架构与Hadoop大数据架构的联系

    互联网行业广泛采用大数据平台架构来解决大数据量环境下的数据计算问题. 2003年,谷歌发布了Google File System(GFS)的系统架构,提出了大数据和云计算环境下的高效数据存储解决方案[5];
    2004年,谷歌发布了MapReduce编程模型,提出了分布式计算环境下的编程框架[6];
    2006年,谷歌发布了BigTable系统,提出1种处理大数据的非关系型数据库[7]. 这3个系统及对应的3篇论文的发表,基本确定了现代大数据处理系统的基础架构. 与谷歌公司的系统相对应,开源组织Apache 的Hadoop也提供了其开源解决方案. 二者对应关系如图4所示. 从近20 a的实际应用效果来看,非常好地满足了大数据环境下数据处理对性能、稳定性和易用性的要求.

    3.1.3 广东省联网中心大数据应用的系统架构介绍

    广东省联网中心数据中台的大数据存储和计算引擎是基于Apache Hadoop大数据框架系统构建. 在基础设施服务层(Infrastructure as a Service,IaaS),由超过100台PC服务器,逾600核计算单元和2.4 TB内存构成,保证计算资源充足可用,成本可控. 在计算模型方面,支持MR、DAG、SQL和ML,既能满足一般业务人员,以及熟悉SQL的工程师的需求,又能满足新一代技术人员对DAG和ML的需求,保证技术友好性. 在集群类型方面,既支持基于分析集群的离线计算,又支持流式集群的实时计算,且能和联网收费系统的数据传输通道无缝对接,保证了数据的实时性和完整性.

    3.2 丰富的人工智能服务平台是开展行业大数据应用的支撑

    徐子沛[8]认为从Data.gov开展,面向数据领域的服务平台逐渐成为大数据应用行业的主流,这在一定程度上,是被近10 a证实了的预见. 国家《新一代人工智能发展规划》中明确了重点工作是“围绕增加人工智能创新的源头供给,从前沿基础理论、关键共性技术、基础平台、人才队伍等方面强化部署……”[9],其实质,是把平台作为理论、技术和人才队伍的载体. 可见,一个良好的人工智能服务平台是开展行业大数据应用的支撑. 这里所说的人工智能服务平台,是指集成了多种人工智能关键共性技术的操作系统,各种人工智能计算能力通过服务的形式在平台上提供,是“平台即服务(Platform as a Service,PaaS)”的云计算服务模式在大数据与人工智能领域的具体实现.

    广东省联网中心数据中台基于互联网行业成熟的大数据云平台解决方案,构建了涵盖备数据汇聚、数据处理、基础支撑、平台管理、人工智能和大数据开发等支撑能力的服务平台. 数据汇聚具备实时或离线从各种数据源采集数据的能力;
    数据处理具备实时计算和离线分析等数据加工能力;
    基础支撑和平台管理具备对各种数据业务的统一管理能力;
    人工智能和大数据开发提供对平台汇聚的数据资源进行各类人工智能应用研发的能力.

    3.3 标准的数据资源目录和元数据体系是开展行业大数据应用的起点

    在大数据时代,数据的分析和整合才是最大的挑战. 在国家政策层面,交通运输部于2019年发布的《推进综合交通运输大数据发展行动纲要(2020—2025年)》中,明确提出夯实大数据发展基础的主要任务之一,是“完善信息资源目录编制、采集、传输、交换共享等标准规范”. 信息资源目录作为组织开展数据的分析和整合的基础工作之一,可被视为工作的起点. 在行业技术层面,要让计算机完成该项工作,就要让其能理解数据. 目前,行业普遍利用知识图谱完成该项工作. 从狭义上理解,知识图谱就是大规模的语义网络(Semantic Web)[10]. 所谓“语义”,是指遵循1个统一的标准,给每1片信息赋予1个计算机都能理解的“意义”则是“元数据”[8]. 对于语义网络,构建实体(Entity)、概念(Concept)及其之间的各种语义关系,是一件关键、基础且重要的工作.

    广东省联网中心数据中台的建设团队,从数据中台技术建设开始,就同步开展数据资源目录和元数据标准体系的编制工作. 到2020年6月,陆续发布了《广东省联网中心元数据标准》《广东省联网中心元数据目录》《广东省联网中心元数据管理制度》,并初步构建了元数据目录管理系统,实现元数据的查询和维护. 事实证明,此项工作是后续开展数据治理、数据研发利用和数据安全管理的基础,所以,可被称为广东省联网中心开展行业大数据应用的起点.

    3.4 完善的数据开发和安全管理制度是开展行业大数据应用的保障

    2020年3月30日中共中央、国务院《关于构建更加完善的要素市场化配置体制机制的意见》中,明确将数据作为一种新型生产要素. 为保证新型生产要素能充分释放其价值,全国人大于2021年6月10日通过《中华人民共和国数据安全法》,将于2021年9月1日起施行,于2021年8月20日通过《中华人民共和国个人信息保护法》,将于2021年11月1日是起施行. 上述法律的陆续出台,对行业大数据应用在安全方面提出了更严格的要求.

    广东省联网中心在开展大数据应用时,充分考虑到数据安全对整个开发应用链条的重要性. 从一开始,广东省联网中心就为数据的开发利用,在组织内部发布了一系列的制度规范,包括《数据分类分级保护制度》《数据资源开发利用管理制度》《数据安全服务与运营制度》等,对数据的收集、存储、使用、加工、传输、提供等工作中的人与行为进行了规范,为大数据应用提供了重要保障.

    4.1 精准防疫数据服务

    为提高广东省防疫抗疫工作的科学性、精准性和实时性,广东省联网中心基于数据中台,充分发挥大数据优势,为广东省应急厅、公安厅、交通运输厅、各地市交通局提供了多项“云战疫”交通大数据服务,建立起集防控围栏标定、数据融合处理、信息精准推送等全流程功能为一体的精准防疫数据服务,实现广东省高速公路防疫工作的信息化和系统化,实现全天候监测分析离(入)粤涉疫车辆,为疫情流调溯源工作提供了精准的高速公路通行数据支撑,为科学精准防疫发挥了重要作用.

    该服务基于广东省联网中心数据中台的流式集群构建,通过对目标车辆在高速公路的通行流水进行实时流式处理,实现对符合监控要求的车辆通行信息进行甄别、转换、业务处理和按需推送等操作,从而实现向有关部门的监控系统提供实时数据服务. 系统的框架如图5所示.

    图5 广东省联网中心防疫数据服务系统架构示意图

    从2020年初,广东省联网中心就持续向相关部门提供该数据服务. 如,武汉疫情期间,我们克服“点亮费显”工程正在如火如荼开展的困难,提供了鄂车入粤、经鄂入粤、粤车往鄂返粤、鄂籍车主返程等多项防疫数据服务. 香港疫情期间,我们针对港牌车进入服务区的情况提供数据预警,支撑服务区管理人员引导港牌车辆进入专门的隔离区域停放和休整. 广州疫情期间,我们实现从广州市和佛山市的高速公路入口进入高速公路的车辆信息在其行驶至省界前3个门架时实时向检查站推送车辆相关信息,为检查站精准甄别疫区出省车辆提供数据支撑,同时,还实现了车辆离开广州区域时向车主发送“出省需有48 h内核酸阴性证明”的提示短信,提高了相关防疫政策的精准触达率.

    4.2 车流量预测

    为提高高速公路管理水平,发挥现有交通资源的优势,在一定程度上缓解高速公路拥堵状况,广东省联网中心基于数据中台,充分发挥大数据的优势,建立了全省各路段的车流量预测模型,为路段业主缓解交通拥堵提供了1种除道路改扩建外的有效途径.

    该预测模型通过建立一套包括长短期记忆神经网络(LSTM)和生成对抗网络(GAN),对实时输入的全省车流量信息未来2 h内每5、15、30 min等时间粒度车流量数据进行滚动预测,其加权平均准确率达到95%.

    图6和图7显示了广东省某一收费单元车流量预测值和实际值的回归验证结果. 可看到,图中的虚线(即预测值)与实线(即实际值)具有很高的吻合程度. 同时,可留意到,在实线框框出的一组数据中,实际值出现了之前从未有过的车流量态势,而预测值也能很好地预测出这一态势.

    图6 广东省联网中心某收费单元车流量回归验证示意图(1)

    图7 广东省联网中心某收费单位车流量回归验证示意图(2)

    4.3 高速公路非法运营车辆通行特征识别

    为提高对非法运营车辆和运营行为的打击效率,提升执法人员的精准布控水平,广东省联网中心基于数据中台,充分分挥大数据的优势,为广东省交通运输厅执法部门建立了高速公路非法运营车辆通行特征识别系统.

    该系统利用决策树算法建立起非法营运车辆通行行为的特征规则,并利用历史执法样本建立起基于循环神经网络(RNN)的识别算法. 这样做的目的,一是建立起一套可解释的执法规则解释机制,二是建立起符合此规则的更高效的行为识别系统,实现了执法知识与经验到系统能力的转变.

    在2021年下半年的实际应用中,此算法共识别出了1 500多辆非法营运车辆,后续通过执法结果验证,识别准确率达到85%. 从2021年10月起,广东省相关执法部门开展的高速公路出入口秩序集中整治行动中,根据系统产生的执法线索进行精准执法,仅一天晚上就成功查处超过30台违法车辆,相关成效将在应用过程中逐步展现.

    从国家一系列政策和法律法规的出台,到各地的实践性应用情况都表明,交通大数据与人工智能应用正处于快速发展阶段. 广东省联网中心的研究与实践结果表明,利用合理的大数据系统架构,通过将高速公路联网收费行业的数据资源与大数据和人工智能算法技术进行跨界融合,能赋能各级主管部门,在精准防疫、实时车流分析与预测、高速精准执法等方面发挥实际作用,能助力高速公路营运机构落实创新驱动、提升管理水平. 在大数据与人工智能发展的热潮中,高速公路行业的数字化转型一定能发挥更大的增值应用价值.

    猜你喜欢 车流量广东省联网 “身联网”等五则党的生活(黑龙江)(2022年4期)2022-04-25《物联网技术》简介现代电子技术(2022年8期)2022-04-13《物联网技术》简介现代电子技术(2022年4期)2022-02-21广东省校外培训风险防范提示师道(2021年12期)2021-01-10广东省铸造行业协会十周年会庆暨第四届理事会就职典礼成功举行模具制造(2019年4期)2019-12-29抢占物联网通信世界(2018年27期)2018-10-16基于车流量监测系统的荆岳大桥拥堵预警方法探讨中国交通信息化(2017年9期)2017-06-06参考答案数学教学通讯·初中版(2015年5期)2015-06-17高速公路重大节假日免费车流量金额算法研究与应用中国交通信息化(2014年6期)2014-06-05广东省第八届大学生运动会圆满落幕体育师友(2011年5期)2011-03-20

    推荐访问:广东省 高速公路 通行

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章