充分发挥数据要素的乘数效应,不仅可为汽车产品优化和交通效率提升提供有力支撑,还是赋能汽车、交通产业变革和数字时代新经济发展的必然选择。
1.多次多维挖掘车联网数据要素价值
随着汽车智能网联化升级、道路智能化改造以及城市智慧化治理,摄像头、毫米波雷达、激光雷达、高精定位等各类感知设备在车辆和路侧大量部署,感知并收集到海量车联网数据,如车辆端的运行状态、驾驶行为和轨迹等数据;道路端的信号灯状态、目标轨迹、交通流量等数据;云端的路网地图、交通事件等数据。车联网数据具有地域特征、多源异构、数据量大、多层价值特点。地域特征是指行车和路侧采集的数据因为各地交通环境、路网特点、交通参与者组成的差异而呈现出不同的特点,如山区城市复杂的高架路网环境、快速路为主的中大型城市交通系统,与地面平交信控为主的小城交通系统相比较,行车和管理模式均有较大区别,不同的特征对数据模型的适应性提出了较高的要求。多源异构特征是指车联网数据来源广泛且数据结构复杂。来自于车、路、互联网、个人终端的视频、雷达、激光点云、定位和轨迹、气候、交通管理等异构数据,给数据的汇聚和融合处理带来了一定的挑战。数据量大是指城市与车辆实时产生的数据量巨大,例如一辆普通的智能网联汽车每天能产生 TB 级别的数据12,成都交通运行协调中心日均新增 6 亿条数据,总数据量超过 3100 亿条13,大体量的数据对数据治理和处理工具提出要求。价值差异大是指数据对不同主体的价值存在较大差异,如车辆采集的雷达点云和接管数据对于自动驾驶训练更具价值,而路侧感知数据则对车联网和城市管理更具价值,数据价值的差异也促使行业探索可信数据流通模式和交易机制的形成。

依据中国信息通信研究院《数据要素白皮书(2022 年)》,数据要素投入生产的途径可概括为三次不同的价值释放过程。具体到车联网的数据领域来说,如图 5 所示。一次价值体现在业务贯通层面,通过实体的数字化、数据的标准化和车路云的全方位连接,实现汽车、路侧、云端的全线业务贯通;二次价值体现在数智决策层面,通过对各类数据的深度挖掘和分析,产生超出原始数据以外的新信息,提升车辆和交通的各类决策的效率及科学;三次价值则是体现在数据流通层面,通过数据在主体之间的流动,让数据流通到需要的行业和企业,实现数据要素价值更大释放。数据贯通,车路云典型应用规模化推广。数据的业务贯通价值是指通过数据实现车辆、路侧与云端的业务打通,达到车路云系统内部各主体的贯通,从而实现各类车联网典型应用。车与路的业务贯通,数据承载着信号灯信息、交通感知信息,由路侧通信系统下发给网联车辆,使车辆能及时获取相关的信息,从而实现各类安全、效率类应用,如无锡、重庆等地运行的路侧信号灯和盲区预警应用。车与云的业务贯通,车辆数据承载着车辆状态信息、位置信息、图像信息等,通过网联系统上传至云端后,使云端平台可以实时掌握车辆状态,实现车辆状态的监控,如合肥、南京等地对道路测试车辆的监控系统,通过车载终端实时上传的车辆数据,监控车辆运行状态;同时,云平台可将调度数据、地图数据等通过无线通信传输给车辆,实现远程调度、导航等应用,如长沙的定制公交应用,通过将乘客预定信息下发给公交车辆,实现公交的远程调度。路与云的业务贯通,路侧设备将感知数据和设备状态数据上传给云平台,实现设备的远程监控,降低运维成本,如无锡、重庆等各地云平台的通过路侧设备的心跳数据来监控路侧设备状态;同时,云平台可将配置数据下发给路侧设备,实现设备的远程控制,如远程调整监控设备的角度,也可以将感知算法推动给路侧MEC,实现远程升级。
数智决策,支撑汽车与交通智能化能力升级。通过对数据的加工、分析和建模,提取大量数据中蕴含的深层关系和规律,从而产生新的价值和信息,推动智能网联汽车产品和智慧交通服务升级。汽车厂商依托汽车电气架构和远程升级功能,在售卖产品后持续收集用户使用和反馈数据,快速迭代车辆各类功能。如小鹏汽车基于车主市场调研需求,可以在汽车使用环节推出车内空调“高温抑菌”功能。互联网企业基于数据挖掘开发新功能,服务个人和行业。高德、百度通过对导航数据进行挖掘学习,为个人用户提供信号灯下倒计时服务,同时形成出行大数据报告,为地方交通规划提供决策支撑。路侧运营企业深入挖掘交通数据,赋能智慧交通,助力“双碳”实现。深圳、无锡、襄阳等地通过对路侧采集的交通流数据分析,形成信号灯配时优化方案,可自动化调整路口配时,有效提升交通效率。中信科智联通过接入路侧融合感知设施数据,挖掘出精细化的车速、车型、道路流量等排放相关数据,并结合出行区域数据转化为碳排放数据,为后续“双碳”目标提供支撑。但是车端数据和路侧数据的汇聚和分析,也对企业的数据挖掘、模型分析、数据筛选等能力提出了更高的要求,产生的应用相比一次价值释放更为聚焦和专业。
数据流通,赋能跨行业协同共建产业新生态。数据异质性使得相同数据在不同使用者和不同场景下存在较大价值差别,通过有效的数据流通和交易手段,在前两次基础上可以进一步释放数据价值。车端方面,供应链数据流通降低生产阶段管理成本。德国由宝马、博世等企业牵头成立的 Catena-X 数据空间,用于各供应链企业间数据安全流通交换,实现碳足迹追踪(图6)、零部件质量管理等应用,提升了整个汽车供应链的协作水平。路端方面,路侧感知数据多维赋能多个行业。百度联合清华,发布了基于路侧感知数据的DAIR-V2X 车路协同数据集,为自动驾驶和车路协同解决方案商提供车路协同模型的研发和训练;德清城市运营主体利用路侧的感知数据,为交警、企业等提供道路事件监控等服务,并成功上线大数据交易所。云端方面,车联网数据与交通云、交管云、城管云等融合,在交通管理、城市治理等方面拓展应用。广州市车城网平台通过对接交通车辆管理平台、城管数据中心等平台,通过对车辆闯红灯、逆行、道路遗撒、车斗未封闭等交通事件以及事故进行识别,实现对重点车辆可追溯、自动化监管。

虽然产业各方针对车联网数据要素释放开展了许多有益探索,但目前仍存在路侧数据采集质量差异较大、可信数据流通架构和新型基础设施尚未建成、数据运营和交易机制尚不完善、安全合规准线尚不明晰等方面的问题,影响数据流通和应用的发展,制约数据价值的进一步释放。
2.新技术促进车联网数据要素价值释放
数据要素价值释放的全生命周期包括数据生产、数据流通和数据应用三个环节,数据安全保障则贯穿全生命周期。数据生产层完成数据采集、筛选、处理和分析,实现原始数据向数据服务、数据资产的转变。数据采集与汇聚方面,人工智能识别、时序时空数据库等技术持续提升数据采集的效率和准确性。人工智能识别有助于筛选潜在价值场景,有效节省数据传输和存储成本、提升训练效率,如百度阿波罗基于人工智能识别,可对感知数据进行关键信息提取,可对自动驾驶模型进行针对性训练。时空时序数据库技术能有效的汇聚海量的感知、定位、授时、地图数据,形成具备时空、时序属性的自动驾驶场景集和交通统计数据,为后续挖掘和使用奠定基础。百度推出的天工时序时空数据库能存储实时采集的每辆车自动驾驶时的运行状态,借助高精定位技术和基础地理数据,可在数据库中还原车辆的运行轨迹和场景,实现高效数据分析和算法迭代。不断提高的数据采集精度和效率要求,促进采集技术向更加智能化、动态化的方向发展。针对具体需求选择更有价值的数据,同时基于大模型,未来数据筛选流程有望部署在车/ 路的边缘侧,进一步提高数据采集效率。
数据处理与分析方面,自动化标注、交通大数据模型等技术持续提升数据处理分析效率。特斯拉的 Auto-Labeling、商汤科技的商汤明眸等自动标注技术,能自动对图像和视频中的交通参与者、车道线、标志等信息进行标注,极大提升标注效率,降低数据处理成本。交通大数据模型可对交通及车辆流量信息等进行统计分析,实现区域信号优化、交通态势预测等应用。如深圳基于交通感知数据实现在线动态交通仿真和路网状态精准预测,并从中还原出交通出行量表、路径等关键信息,支撑信控优化方案选择。数据价值释放依赖于专业数据治理工具和数据处理模型,针对非结构化、多源数据关键信息提取的高效治理工具将会成为数据商品化、资产化的关键。同时,面向自动驾驶场景提取、场景泛化以及智慧交通优化、决策的相关模型的迭代一定程度上会影响数据的价值。
数据流通层通过数据控制、交易等实现数据价值可信流通及融合应用。一方面,以数据连接器为代表的技术通过数据加密、使用规则附加等功能确保数据主权。如 Catena-X 数据空间中的数据连接器能在对数据加密的同时,实现数据跨域的删除、锁定、撤回等操作;华为推出的数据胶囊产品,可将加密后的数据、使用策略、描述信息以及校验信息等封装成数据胶囊,实现阅后即焚、定时访问、定点访问、定量访问等功能。另一方面,以可信数据空间为代表的数据流通基础设施快速发展。华为、数鑫科技等企业推出了基于可信数据空间架构的数据交换解决方案,可以在数据主权可控、数据分布式存储的前提下,实现各主体间数据的安全流通和共享。目前,车联网领域数据流通的基础设施还在起步阶段。产业各方对于数据空间形态、数据流通模式、组织形式仍未形成共识,行业级的数据空间平台和组织还未形成。面向未来车联网数据流通的需求,仍需探索非结构化、高敏感性、高度定制化的数据流通技术和解决方案,推动标准化的数据流通中间件研发和行业级的身份及数据认证平台建设,打造行业化的可信数据流通平台。
隐私保护、数据脱敏、数据溯源多方面保障数据安全合规。隐私保护方面,利用同态加密、联邦学习、安全多方计算等技术,探索大模型联合训练,为车联网数据流通过程中隐私保护提供了新的思路。信安世纪、360 数科、安恒信息、腾讯等企业建立可信隐私计算平台,并通过“可信隐私计算评测”,解决数据共享过程中的安全、信任和隐私保护问题。数据脱敏方面,利用人工智能等技术对车外人脸、车牌数据进行脱敏处理,防止敏感信息泄露,如信长城、格尔软件等推出人脸、车牌快速脱敏算法,助力企业满足信息保护要求。数据溯源方面,基于区块链、数字水印等技术保障数据不可篡改、可溯源。如宝马开发的 PartChain 区块链项目,通过对零部件企业数据上链,在数据流通时确保零部件来源可溯;中汽协以区块链为底层架构开发汽车大数据区块链交互平台,将企业脱敏数据的标签上链,保证数据的确权和不可篡改,实现数据资产的线上交易和线下交割。数据水印技术将标识信息隐藏在结构化数据中,使数据在流通和使用过程中具备可识别分发者、分发对象、分发时间、分发目的等特点。如京东安全通过在图片中插入水印信息,实现敏感图片不被轻易转发。目前,针对图像和视频中的人脸、车牌等敏感信息的脱敏技术已经相对成熟,能够满足小批量数据场景下敏感信息保护需求;但面向大数据场景的信息挖掘和处理技术还未成熟,同时针对车联网数据的分类分级方法、不同等级的安全应对体系还在持续探索,区块链、隐私计算及联邦学习等技术也将持续与车联网数据应用场景结合,更好的保障车联网数据的安全应用。