天花板 DOTS 数据
发布时间:2024-11-15 02:05:25点击:
今天,2023上海车展盛大开幕,这次除了整车厂,自动驾驶企业也相继带来了很多全新产品发布。相信以BEV感知、Occupancy Network、Segment Anything和ChatGPT为代表的一系列颠覆性技术将进入大众视野,大家惊呼以CV/NLP为代表的人工智能方向终于带来新一轮产业革命。
自动驾驶行业现状
自2018年以来,得益于政策推进、硬件平台和软件算法的逐步成熟,我国的自动驾驶行业势头发展良好,量产乘用车自动驾驶等级正在由L2向L3+过渡,商用车自动驾驶已进入商业化运营阶段。据相关资料统计,中国2022年在售量产商用车中L2和L3的渗透率分别为35%和9%,预计2023年低将达到51%和20%。与此同时,自动驾驶上下游的各类玩家以不同的发展思路积极进入市场,数据解决方案企业-海天瑞声、传统车企、造车新势力、互联网科技公司、解决方案供应商等,限定场景下的商用车也逐步进入商业运营化阶段,据不完全统计,目前国内各类自动驾驶参与者已超过200+。
自动驾驶技术发展
自动驾驶作为软硬件高度结合的人工智能技术产物,其技术发展的三大基石分别为:数据、算法和算力。
1)数据作为自动驾驶研发与量产车的交互媒介,一定程度上决定了自动驾驶技术的上限。目前,组建以数据驱动为核心的数据闭环研发思路成为业界共识,如何有效挖掘数据,有效利用数据成为了数据闭环中的核心技术点,这一点以海天瑞声为代表的数据标注企业很有发言权;
2)算法作为自动驾驶技术的内核,以深度学习为代表的技术在感知层和决策层共同驱动自动驾驶技术的发展,近来,相关的技术包括:“Transformer”、“BEV感知”、“云端大模型”、“重感知轻地图”等方向;
3)算力作为自动驾驶技术的地基,相关的芯片技术也是不可或缺的物料之一,作为车端运行自动驾驶算法的载体,自动驾驶的主控芯片架构由域集中式向中央集中式发展,芯片集成度在逐步提高。
自动驾驶技术未来趋势
目前自动驾驶技术还是以感知定位、决策规划等模块为中心进行发展,感知技术经过这些年的发展已逐步形成数据驱动的迭代体系,Segment Anything和ChatGPT的出现,会让自动驾驶的端到端运行产生了更多的想象空间,相信不久的将来,认知驾驶决策也会出现以数据驱动的模型决策。
可以预见,自动驾驶技术的下半段赛场离不开两个词:“大模型”,“数据”。
自动驾驶数据驱动,让未来可期
我们注意到GPT-3在训练时使用了超过45TB的文本数据,Segment Anything使用了约1100万图像分割数据,那同样自动驾驶技术的终局也一定需要有一套强大的数据驱动链路,通过不断发现有用数据,不断通过人工总结引入正反馈使用核心数据,将人类知识赋能给算法系统,从而实现系统的不断进化。
这套数据驱动链路的高效运转,离不开数据采集/数据管理/数据标注/仿真等模块,数据标注技术至关重要,它是人类驯化系统的工具,不同的标注框是人类先验信息的总结。可以说,数据标注的质量一定程度上影响着算法系统的性能。正因为如此,数据标注技术也逐步成为自动驾驶技术的一个关键方向,以海天瑞声为代表的相关数据标注企业也正受到越来越多的关注。
数据标注技术呈现“智能化”
数据标注方向从深度学习技术发展开始,就独立成为一个技术发展方向。整体分为三个发展阶段:
1)纯人工标注阶段:该阶段主要因为数据标注量少,标注任务简单,绝大部分工作由标注作业员完成;
2)辅助标注阶段:人为主,工具为辅。随着标注量大,人力成本升高,算法技术的不断发展,出现了很多提效的辅助标注工具,来不断解放人力;
3)自动标注阶段:工具为主,人为辅。以自动驾驶为代表的技术不断发展,出现了人工无法标注的任务需求,加之标注数据量的日益扩增,自动标注成为大家关注的重点。
自动驾驶标注需求呈现多样化
自动驾驶系统作为一个复杂的多模块联动的综合系统,随着技术的不断发展,研发认知的不断更新,对标注任务的需求也在不断增加。目前的标注任务主要分为以下几类:
1)摄像头/激光雷达标注:大部分自动驾驶解决方案均配有视觉摄像头和激光雷达,与此对应,会产生2D图像标注需求/3D点云标注需求;
2)单帧标注/多帧标注:随着端到端的感知技术发展,轨迹预测的模型化会产生时序场景的标注需求;
3)场景标注:自动驾驶技术的落地,需要对场景有全面的认知,也会产生雨雾场景/传感器失效场景的标注需求;
4)轨迹预测标注:端到端的技术将会产生更多的标注任务,来不断提炼人类知识。
总而言之,技术的不断发展让自动驾驶的端到端技术可期,数据将成为端到端技术的核心养料。
如何规模化利用好数据,挖掘数据的内在价值将一定程度上影响自动驾驶技术的发展。针对如何建立高效的数据标注体系,海天瑞声作为一家在人工智能领域深耕多年的数据解决方案服务供应商,正式推出了『DOTS-AD自动驾驶标注平台』,助力自动驾驶企业和研发人员高效利用数据,与自动驾驶企业共建数据驱动链路,加速数据闭环利用的正向迭代。
作为一款专为自动驾驶场景设计的全栈式数据标注平台,『海天瑞声DOTS-AD自动驾驶平台』功能强大,稳定性好,能够支持多维度、全方位的自动驾驶标注任务,数据标注效率提升高达8倍!经过内部数亿帧数据的项目打磨,可支持万人同时作业,能够解决项目经理和标注员的使用痛点,提升标注效能,且支持多元化的部署方式。『海天瑞声DOTS-AD自动驾驶平台』拥有以下几大核心功能:
1)全面支持自动驾驶领域各维度2D/3D/4D 点云或图像数据标注;
2)针对不同场景支持辅助标注/自动化标注;
3)支持项目的柔性管理,支持流程/工具/标签的自定义;
4)数据的智能化管理,确保客户的商业数据安全合规。
自动驾驶未来可期,『海天瑞声DOTS-AD自动驾驶平台』将助力自动驾驶技术走向全面智能的新高度,赋能自动驾驶企业算法高效量产,让您的车更智能更安全的行驶在世界的每个角落!