引言:
在自动驾驶技术快速发展的今天,数据驱动的训练模型和测试方法正成为提高系统性能的核心。而在这些测试方法中,开环测试和闭环测试尤其重要,前者能够快速评估系统的基本能力,后者则能确保系统能够在真实世界中可靠运行。但是海量开环测试所使用的静态抽帧标注的数据真值,却难以用于闭环测试。亮道智能提供的4D数据时序真值,既可以支持开环的感知训练,同时可以支持闭环测试,极大提升了自动驾驶开发过程中对数据的利用效率。
1. 数据规模与开环测试:初步验证的第一步
论文《Data Scaling Laws for End-to-End Autonomous Driving》讨论了数据量对自动驾驶模型性能的影响,强调了海量数据在开环测试中的重要性。在开环测试中,模型在不依赖外部反馈的情况下进行验证,评估其对单一场景或任务的反应。
· 开环测试的优势:
开环测试通常依赖于模拟数据集(例如合成图像),这种数据来源丰富、可以高效生成,帮助开发团队在短时间内获得大量的测试结果。通过开环测试,我们可以观察到模型在各种理想化场景中的表现,包括路径跟踪、障碍物检测和避障等基本能力。
· 开环测试的局限性:
然而,开环测试并不反映实际驾驶中的复杂性。在真实世界中,自动驾驶系统需要实时适应周围环境的变化,如交通状况、突发情况和动态决策。而这些因素往往无法仅通过开环测试来评估。因此,虽然开环测试对于评估模型的初步性能至关重要,但无法提供完整的性能反馈,尤其是对于复杂情境下的可靠性和稳定性。
· 开环测试的数据规模与模型性能的关系:
论文《Data Scaling Laws for End-to-End Autonomous Driving》指出,自动驾驶模型的性能与训练数据量之间存在幂律关系。具体而言,增加训练数据量可以显著提升模型在不同驾驶任务(如车道保持、变道和转弯)上的表现。然而,性能提升的幅度随着数据量的增加而逐渐减小,这表明存在“收益递减”现象。
在论文的结论处,作者明确指出,开环测试虽然可以加速测试,但开环测试的性能与模型在实际驾驶中的表现差异依然是巨大的,在开环测试中通过海量数据训练积累的模型表现,在真实环境中表现却难以评估。
2. 硬件在环(HIL)仿真测试:提升闭环评估的精准度
硬件在环(HIL)测试是结合虚拟仿真和实际硬件的闭环测试方法,它将自动驾驶硬件系统集成到虚拟环境中进行测试。这种测试方法可以更加接近现实驾驶情况,并在仿真环境中模拟硬件响应。
· HIL仿真测试的优势:
HIL测试使开发者可以在仿真环境中实时验证硬件组件与控制系统的相互作用,避免了在实际道路上进行高风险的测试。通过这种测试方式,开发者可以模拟多种突发状况,检查硬件是否能够及时响应,并评估系统的稳定性和安全性。
· HIL测试的不可替代性:
在没有实际道路测试的情况下,HIL仿真提供了一种安全而高效的验证方法,能够将硬件与模拟环境紧密结合,保证硬件系统在真实驾驶环境中的可靠性。虽然完全依赖虚拟仿真有其局限,但HIL测试可以弥补这一缺点,提供更加真实的反馈和优化空间。
虽然了解了闭环测试的重要性,但是往往在智驾功能开发的过程中,很多研发团队依然很难有大量数据用于闭环测试,其中最重要的核心,在于对训练数据的理解有较大差异。
并非所有用于开环测试的静态标注数据,都可以用于闭环HIL测试。其主要区别在于:在自动驾驶系统中,感知标注数据可分为“静态标注数据”和“动态标注数据”,这一区分对于闭环测试具有重要意义。
静态标注数据指的是在特定时间点上采集并标注的感知数据,每帧数据对应一个具体的时间点,场景中的对象在标注时被认为是静止的,未考虑传感器与环境之间的实时交互。
静态标注数据主要用于训练感知模型,如目标检测、语义分割等。适用于开环测试,验证模型在静态场景下的表现,但因为忽略了物体的交互,无法用于闭环测试。
动态标注数据指的是动态标注数据是在连续时间序列中采集并标注的感知数据,考虑了场景的动态变化,数据一般是连续帧标注,短则十几秒,长则几分钟,反映了场景的变化。
动态标注数据因为考虑了目标物对象的运动、交互等因素,可以理解为标注的并非是一个个独立的目标,而是一个个驾驶场景,记录了传感器与环境的实时交互。 适用于硬件在环(HIL)测试,评估系统的实时响应能力。
3. 亮道智能:提供“动态标注数据”的端到端感知训练闭环
在亮道智能,我们开发了一整套感知算法训练数据闭环数据工具链产品,该产品可高效生成动态标注数据,支持连续帧标注,可对动态物体进行高精度的标注和追踪,其标注的动态数据在空间位置和时间序列上都具有较高的准确性。兼顾开环测试当中对高质量真值数据的需求,也支持客户通过HIL硬件在环的闭环测试方案,评估智驾系统在真实世界的功能表现。
LD Data Factory 创新解决方案,高效生产感知真值:
亮道智能构建了一套完整的真值生产工具链,以减少90%人工标注工作量为目标,包括数据生产、数据管理、数据合规与数据运维四大板块,确保自动驾驶工具的高质量自动化训练。
核心特征:
✓ VLM技术实现多场景数据均衡分布|消除数据分布偏差
✓ AI预处理系统|集成目标检测/道路特征提取/SLAM算法/多传感器融合
✓ 全栈标注平台LD Editor|支持场景/2D/4D时序/BEV标注
✓ 实时质量反馈系统|确保数据真值一致性
图:亮道智能数据处理工具链
4. 亮道智能:一站式服务,提供4D数据时序真值
亮道智能的4D数据时序真值,可以针对连续帧做自动化标注。在交通场景下对车辆进行标注,当车辆在连续帧中出现遮挡、相似车辆并排行驶等情况时,系统很难准确判断同一辆车在不同帧中的对应关系,容易出现目标丢失、轨迹混乱等问题,亮道智能的自动标注工具链可以很好的解决连续帧的ID不连续、目标物丢失等问题,满足连续帧自动化标注需求。
亮道智能的4D数据时序真值,不仅可以输出目标物的ID、尺寸等基础目标物信息,还包括速度、加速度、遮挡关系等参数的真值,更是我们的技术亮点。
智能驾驶开发过程中,数据是前行的基石,而精准的测试则是保障安全与高效的灯塔。亮道智能凭借创新的 4D 数据时序真值与完善的工具链,成功搭建起从开环到闭环的高效桥梁,攻克了连续帧自动化标注的难关,助力自动驾驶系统在复杂多变的现实交通场景中稳健驰骋,为自动驾驶技术迈向成熟、可靠的未来按下加速键。