自动驾驶数据库(自动驾驶 数据分析)
本篇文章给大家谈谈自动驾驶数据库,以及自动驾驶 数据分析对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。
本文目录一览:
自动驾驶数据集被迫开放“营业”
“现在自动驾驶很火,火到什么程度?简单来说就是烧钱。”
根据The Information发布最新研究称,投入自动驾驶战场的各家公司已经累计花掉了约160亿美元。需要注意的是,这160亿美元还没算上为了自动驾驶布局而发生的并购。举例来说,英特尔买下Mobileye花掉的153亿美元就不算在其中。
众所周知,自动驾驶技术相当复杂,想要实现商用,花费的时间和成本对于任何一家车企或者科技公司来说都是巨大的,这些投资想要得到回报则需要更长的时间。而且自动驾驶所谓的商业化,还在探索当中。无论是推出RoboTaxi服务的Waymo One,或者是Nuro与Kroger合作的生鲜配送,又或者是安波福和Lyft推出的乘车服务等等。
那么,为了打破各家企业各自为战的局面,一些企业彼此开始尝试开放有价值的自动驾驶数据集,以加快自动驾驶技术的提升,从而推动自动驾驶行业的发展。去年,谷歌母公司Alphabet旗下自动驾驶公司Waymo公开了一部分开放数据集Waymo Open Dataset;近期福特也悄悄发布了其自动驾驶汽车数据集。
这两家自动驾驶公司,是目前公认的在全球自动驾驶研究排名前列的企业。对于自动驾驶行业其他从业者而言,有了公开的数据集,他们能在一定程度上免去重复的资源投入。研发人员可以利用这些数据集来帮助开发自动驾驶汽车的感知算法,有助于推动其研发进程。实际上,这也是一场自动驾驶行业领导者地位的争夺。
什么样的数据有价值?
自动驾驶汽车每天可以收集4TB或更多的原始传感器数据,直到现在,自动驾驶公司收集的数据还是公司的高度机密。但是近几年,自动驾驶领域的各路参与者,在开源数据集共享这件事上颇为“大方”。
在福特的自动驾驶数据集发布之前,Lyft 此前也开源了自己的数据集用于自动驾驶汽车开发。其他开放此类的数据还包括nuScenes、Mapillary Vistas的街道图像集、加拿大不利驾驶条件(CADC)、KITTI用于自动驾驶的研究;以及戴姆勒、马克斯·普朗克(Max Planck)信息学研究所和达姆施塔特工业大学(TU Darmstadt)视觉推断小组开发和维护的Cityscapes数据集。
不过问题在于,过去相关研究人员创建和发布的数据集相对较小,通常仅限于摄像头数据。虽然,安波福发布的NuScenes数据集除图像外还包括激光雷达的雷达数据,Waymo和Argo发布的版本会更进一步。Waymo声称拥有3,000个场景,是NuScenes提供的场景的三倍,并且摄像头和激光雷达信息之间的同步更好。
虽然由自动驾驶测试生成的所有数据对于车辆感知其周围环境,并在整个过程中都是有用的,但实际上只有其中的特定部分对开发和改进系统有用。比如在典型城市街道上一天的测试中,车辆中的工程师和技术人员会选择性的记录发生细微变化或具有挑战性的场景。也就是说自动驾驶数据集需要更加多样和精细化,对从业人员来说才有利用价值。
福特此次公开的自动驾驶数据集,是工程师驾驶配备了四个四核英特尔i7处理器和16GB RAM的汽车,往返底特律大都会机场、密歇根大学迪尔伯恩分校、高速公路、市中心和郊区等地区共行驶了约66公里。其数据主要由4个激光雷达传感器、6个130万像素摄像头、1个500万像素摄像头和1个惯性测量单元,通过路况的细微变化来捕获多样化的数据。
一般而言,在测试结束时,所有数据都将从车辆中提取到数据中心,并对有益的数据进行分析和标记。原始数据本身对于处理器系统核心的学习系统没有多大价值,数据中感兴趣的对象包括行人、骑自行车的人、动物、交通信号灯等变量。在将传感器数据用于训练或测试AI系统之前,所有这些目标都需要进行手工标记和注释,以便系统可以理解其“所见”。
研究人员根据传感器的读数生成地图和行人姿态数据,包括3D地面反射率地图、3D点云地图、六自由度地面真实姿态和局部姿态传感器信息。这些反映了季节差异(数据是在晴天、下雪和多云的情况下以及在秋季期间捕获),并且涵盖了多种驾驶环境,包括高速公路、立交桥、桥梁、隧道、建筑区域和植被覆盖区。
如今,大多数感知系统都严重依赖机器学习或深度核心算法,感知系统处理传感器信号并尝试对车辆周围的物体进行分类。为了能够完成此任务,必须使用经过彻底标记和注释标识所有道路的相关数据,才能更好的发挥出数据的价值。值得注意的是,标记过程可能比原始数据收集还要耗时。
福特指出,福特自动驾驶汽车数据集中的每个日志均带有时间水印,并包含来自传感器的原始数据、校准值、姿态轨迹、地面真实姿态和3D地图。它具有ROS bag文件格式,可使用开源机器人操作系统(ROS)对其进行可视化、修改和应用。
实际上是话语权的争夺
在自动驾驶汽车上投入了大量资金,福特仍然向研究人员免费提供它的自动驾驶汽车数据集,但实际上也有所保留。此次福特公开的包括Argo正在使用的所有九台摄像头的视图,以及两个带有10,000多个带注释目标的数据,但它仅涵盖迈阿密和匹兹堡记录的113个场景。
在自动驾驶技术发展的初期,企业对数据的所有权非常谨慎,各家收集的数据代表着它们的用户、资源和技术。技术垄断虽然能够最大限度地强化自己的优势,但同时也阻碍了技术的进步。虽然自动驾驶车辆数据共享的重要性得到了整个行业的认可,但出于行业竞争、产权保护等等方面的考虑,企业之间大概不会无私贡献所有数据。
事实上,开放数据集确实是在帮助别人,但企业自身也能获益。自动驾驶数据采集是一个周期长,地域广的长时间项目,如果各家都将自己的采集数据共享的话,就可以共同减少数据采集时间,从而促进行业的整体发展,促进商业化。
但实际情况是,在技术层面,对于一般研究而言,得到新的分类和预测算法可能具有巨大的价值。但由于具体数据取决于传感器规格及其在车辆上的位置,还有很多实际原因导致诸多数据无法获得。除非有人使用与捕获数据的原始车辆完全相同的配置,否则如果不对视差进行调整,它对于训练特定的自动驾驶系统可能没有用。
毫无疑问,公开数据集,可以吸引更多企业和开发者利用并补充数据集。如果某一家的数据或者代码被竞争对手采用,相当于这家公司为自动驾驶汽车制定了一个非正式的标准,有助于该企业的发展和地位的加强。这一开放数据的企业也可以将其他公司收购,或者收取利益许可其他企业使用该平台。
?
当前全球所有车企都将智能化转型作为战略来抢占技术的制高点,中国也不例外。2月份出台的《智能汽车创新发展战略》,对中国的自动驾驶来说具有重大利好。但是在回过头来看国外公司开放的自动驾驶数据集,主要针对底特律、波士顿、新加坡等地的环境解析。对于道路、交通、环境差别迥异的国内驾驶环境来说,是否有用还有待商榷。
不过国内的百度“Apollo”自动驾驶平台,也是通过开源代码,联合诸多车企达成合作。此外,小马智行和华为等中国公司,也在快速抢占自动驾驶市场的份额。2019年自动驾驶汽车脱离数据报告中,排名前十的企业中有四家来自于中国。由此可见,中外企业均在抢占自动驾驶各层面技术的标准制定和话语权。
随着“新四化”的不断深入,未来,可能还会有更多的玩家加入到自动驾驶的战场。历史也表明,未来也将是一个开放、合作、同时又相互竞争的局面。无论是传统车厂还是科技企业,无论是国内企业还是国外公司,这场承载着人类未来出行的伟大梦想,正在一步步走近。
文/杨晶
---------------------------------------------------------------------------
【微信搜索“汽车公社”、“一句话点评”关注微信公众号,或登录《每日汽车》新闻网了解更多行业资讯。】
本文来源于汽车之家车家号作者,不代表汽车之家的观点立场。
福特发布自动驾驶汽车数据集 覆盖多种驾驶环境
据外媒报道,近日,福特发布了一个语料库Ford Autonomous Vehicle Dataset(福特自动驾驶汽车数据集),包含从大底特律区的自动驾驶汽车车队收集的数据。福特将该数据集免费提供给研究人员,用于提高自动驾驶汽车在城市环境中的鲁棒性。
(图片来源:福特官网)
为了创建数据集,工程师驾驶配备四核英特尔i7处理器,并具有16GB内存的福特Fusion混合动力车辆,行经底特律大都会机场、密歇根大学迪尔伯恩分校和住宅社区,共行驶约66公里。并通过细微调整路线,来捕捉多样化的数据。捕获的数据主要来自于4个激光雷达传感器、6个130万像素的摄像头、1个5百万像素的摄像头,以及1个惯性测量单元。
本文来源于汽车之家车家号作者,不代表汽车之家的观点立场。
在自动驾驶的路上,百度Apollo走了多远?
10月10日,百度旗下自动驾驶出租车服务Apollo GO正式在北京开放,北京的朋友们可以通过百度地图或Apollo GO的APP下单,在海淀、亦庄的站点免费进行试乘。
这个新鲜玩意儿引来不少人关注,他们之中有汽车媒体、行业从业者、大学生、极客、科技博主,试乘现场的几个站点都在排队,首日呼单量就超过了2600单,甚至有人等了好几个小时都没有叫到车。
想必,大家都想知道百度所谓的“自动驾驶”已经发展到什么程度了,想亲眼看看,幻想中的RoboTaxi是否已经变成现实。不过呢,虽然百度宣称Apollo GO全面开放,但是这个『全面』还是有很多限制的——
首先,运营时段有限,周一到周日的10:00-16:00,避开了早晚高峰以及夜晚的驾驶环境;其次,车辆已经预设好路线,只能在事前计划好的15个站点上下车(类似摆渡车);再来,车速将限制在60km/h以下;每台车只能在后座乘坐1-2名的乘客,乘坐者年龄符合18-60周岁之间;最重要的是,每辆车都配备有安全员,随时保证接管车辆行驶。
号称超L3赶L4级的自动驾驶,却又给出了这么多的限制条件,百度的Apollo GO究竟能达到什么程度呢?百度在自动驾驶领域中又走了多远呢?
百度的自动驾驶发展到什么程度了?
百度的自动驾驶项目早在2013年开始起步,到2015年就累计投入了200亿元,2017年带着一张北京五环的罚单闯入大众视线。在路试落地北京之前,其无人驾驶出租车已经在长沙、沧州进行过了试运营,接送了超过10万名乘客。
就在一个月前,9月15日,一辆没有安全员的无人驾驶出租车载着百度集团副总裁、智能驾驶事业群总经理李震宇和央视记者,在北京首钢园区内行驶。
同一天,百度CEO李彦宏在“百度世界2020大会”上预测了自动驾驶实现商用化的时间表,“5年之内,自动驾驶汽车将进入全面商用阶段”,“凭借智能交通体系,能够提升15%-30%的通行效率”,“5年之内,中国一线城市就不再需要限行,10年之内就能解决交通拥堵问题。”
雄心壮志的背后,确实是有足够的研发实力和经验来支撑。
就在今年2月27日美国加州管理局DMV公布的2019年自动驾驶路测成绩单中,MPI值(Miles Per Intervention,无人工干预行驶的平均里程数)排名前五的公司中,有三家来自中国(百度、Auto X、小马智行),其中以百度为首,并首次超过美国的Waymo,位居第一名。
另外,在Navigant Research为自动驾驶企业制定的竞争力排名榜单中,百度也首次进入到“Leader”评级,与Waymo与Cruise处于同级。
可以说,百度在自动驾驶领域的研发实力,不仅在国内名列前茅,并且已经得到了全球行业的认可。
Apollo技术具体如何实现呢?
硬件方面,一台Apollo测试车包括工控机IPC(包含专用GPU)、GPS定位系统、IMU惯性系统、CAN总线接口卡、大容量硬盘(数据库)。除了这些基础架构的硬件之外,传感器还包括顶部旋转Lidar(128线)、前向摄像头(双目)、侧向摄像头(单目)、车头/尾Lidar(16线)、车身左右Lidar(16线)、车头/尾毫米波雷达、超声波近身雷达等,基本上是武装到牙齿了。
软件层面,Apollo为定制Linus内核(4.4.32),但没有列出具体的应用软件和数据库等等。地图定位上,Apollo采用了Novotel的GPS和IMU组合定位系统,它们可以利用卡尔曼滤波机制融合,提供足够频次和足够精度的定位和姿态信息,这也是目前最好的定位技术之一。
算法层面,Apollo加入DeepDrive深度学习自动驾驶产业联盟,发布了Apollo 的自动驾驶数据集ApolloScape。通过海量、高质的真实数据,为自动驾驶的算法开发、测试进行迭代更新,百度表示,ApolloScape的数据量做到了国内同类数据集的10倍以上。
软硬件的结合,构成了Apollo的自动驾驶系统。其中,整套系统的核心是工控机IPC,这套配置中具体使用了Neousys 6108GC工控机,配套Nvidia的GTX1080显卡,IPC通过USB和Ethernet接口接收各种传感器送来的数据,经过处理后,再通过PCI接口对接CAN卡最终驱动车辆动作。
由于百度是一件互联网企业,并不具备生产车辆的技术与能力。所以这套辅助驾驶系统选择的载体是林肯的MKZ。
为什么是这款车型呢?这里再简单说明一下。
首先,林肯MKZ的电气化结构比较完善,拥有线控油门、线控刹车、线控转向系统;其次,目前有一家以ADAS工具包为主要产品的Dataspeed公司,将林肯MKZ的CAN总线协议破解并封装成ADAS Kit提供于开发者;再来,福特基于拓展出行服务商的目的,愿意想向自动驾驶公司提供相关接口,是为数不多的可选项之一。
综合以上元素,将林肯MKZ改装为自动驾驶测试车是目前最便捷和最实惠的选择。除了Apollo,英伟达、Pony AI等自动驾驶公司也是采用了林肯MKZ。
总得来说,Apollo凭借这些技术,已经可以实现结构化道路的L3级别,或者称为特定场景、有限场景的L3自动驾驶。从北京的体验者反馈来看,在转弯、变道以及调头,大多数情况下无需安全员手动操作,Apollo都能够平稳完成;前方如有车辆速度过慢,Apollo也会进行变道超车;道路中间突然出现行人时,Apollo能够主动降速等待行人通过再行驶。
不过缺点也存在,由于AI的驾驶“习惯”不够人性,在转向和规避行人时的操作十分生硬,常会强行转弯或骤然刹车,容易产生颠簸,部分乘客人表示出现了轻微晕车的情况。
可以说,百度Apollo的技术实力还是有的,只是还有很大的提升空间。那么在自动驾驶领域处于顶尖位置的车企,他们都是什么水平呢?
其它竞争对手的进度
目前,自动驾驶技术的开发企业主要分为三类,第一类是传统车企或汽车零部件厂商,包括通用、宝马、奥迪、大陆、博世等;第二类是互联网科技巨头,包括谷歌、百度、滴滴、阿里等,其中滴滴同时又是出行平台,在自动驾驶研发和使用中有双重身份;第三类是创业型科技公司,包括Auto X、小马智行等。
这里我们就举两个典型的例子,一个是车企代表特斯拉、一个是Google系的Waymo。而两个例子,也恰好是激光雷达和视觉识别两条技术路线的代表。
先说Waymo,Waymo是Google于2009年1月开启的一项自动驾驶汽车计划,之后于2016年12月从Google独立出来,成为Alphabet公司旗下的子公司。
就在今年初,Waymo宣布其自动驾驶路测超过2000万英里;3月,Waymo宣布获得第一轮外部投资,共22.5亿美元,投前估值达到了1050亿美元,远远超过大众、戴姆勒、通用等一众车企。
对比百度的Apollo GO,Waymo的RoboTaxi更早,于2018年年底在美国凤凰城上线Waymo One服务,这也是全球Robotaxi商用化尝试的开端。今年10月,Waymo宣布在凤凰城进入全无人状态驾驶(无安全员),并面向公众公开提供收费服务,这标志着Robotaxi在技术、商业全面实现上走出了第一步。
因为不生产汽车,Waymo的最大优势集中在算法。它是基于激光雷达为主的解决方案,秉持“交通即服务”的商业模式,重激光雷达、重高清地图,优势是能够快速搭建系统原型,不仅对大数据的依赖程度低,还更容易检测、提取和分割数据,安全上更有保障。但是缺点是,传感器的成本高、拓展性弱、商业化速度慢。
与之相对的是,特斯拉的Autopilot代表的是“汽车即产品”的服务模式,从辅助驾驶逐步过渡到完全自动驾驶,重摄像头、重视觉识别、轻地图。因为需要视觉学习,所以对数据的依赖程度更高,为此特斯拉也有自己的“独门秘籍”——影子模式(号称拥有100亿英里的实测数据),优点是成本更低、拓展性更强、商业化速度更快;缺点是,安全控制上不如激光雷达。
从技术上来啊说,特斯拉是目前唯一一家从软件算法到硬件架构全部自研的车企,其软硬件技术也一直处于行业领先。日经BP社曾在拆解Model 3时得出结论,认为特斯拉在电子架构上已经领先竞争对手6年时间;而大众董事会成员Thomas Ulbrich也承认,特斯拉在电动汽车和开发软件方面领先大众10年。
特斯拉Autopilot的主要优势在于神经网络、海量数据与控制算法,虽然理论技术上与Waymo或Cruise难拉开差距,但是它拥有将算法与车辆控制结合的深厚经验。值得注意的是,特斯拉Autopilot投入市场的策略更加激进,就在这个月,特斯拉宣布推送完全自动驾驶版FSD Beta给少部分目标用户,以实现接近L4级的自动驾驶。
从实测体验来看,FSD Beta大部分时间都可以实现“零干预驾驶”,它可以在路口识别红绿灯以及道路旁的禁令标志,能够根据路口标线以及导航自动选择车道。在通过环岛等复杂路口时,FSD Beta也能自主遵守路口让行规则行驶,并自主避让路边的行人和非机动车。
现阶段,无任何标线划定的狭窄道路对于其它所有驾驶辅助系统而言都是噩梦,但以摄像头为主导的FSD Beta仍然能够胜任,路面的边界、通行路径和两侧停泊车辆全部都能被探测到。即使是在两边停满车辆的停车场路段,FSD Beta仍可识别出几乎所有交通参与者。在夜间测试过程中,FSD Beta的识别能力仍与白天时大致保持相同,依然相当精确。
我们离真正的无人驾驶还有多远?
总得来说,百度Apollo在国内已经属于领先地位,在国际上也处于第一梯队, 但是距离业界领头羊Waymo、Cruise以及特斯拉的Autopilot还有一段距离,这也是百度Apollo之后的前进目标。
那我们离无人驾驶还有多远呢?
这取决于前方的困难何时才被解决。譬如技术上的边角案例(Corner Case)。车辆通过雷达或摄像头采集的数据,上传后供机器进行学习,但是实际行驶中,难免出现一些超出机器的经验范围的路况,这些就是边角案例(如台湾Model 3撞货车的例子)。电动汽车百人会的研究报告指出,如今的无人驾驶技术可处理90%的常规路况,但剩下的10%边角案例影响巨大,需要花费90%的时间解决。
譬如说法律上的责任归属的问题。责任主体在任何法律中,都是一个至关重要的概念。但是自动驾驶技术,模糊了这个概念的划分。如果自动驾驶的车辆不幸发生车祸,责任在于驾驶员?在于技术供应商?还是在于车辆所属品牌?这都是目前都是没有解决的问题(如美国Uber致行人死亡的例子)。
譬如说路权与道路规则的制定。无人驾驶车辆是否和人工驾驶车辆享有同等路权、接受统一管理?它们是否行驶在同样的车道、应用同样的交通规则?
譬如产品本质的变化。自动驾驶将大幅提高车辆的使用率,从而降低了整个道路的车辆存量,因为届时人不再需要车辆的所属权,只需要拥有车辆的使用权,这样的性质转变,公众是否能够接受?
譬如说技术上的伦理问题。著名的电车难题又会重现,假设一辆自动驾驶的车辆,面对前方路边突然冲出的行人,可进行躲避操作保护行人,但是会牺牲乘客和道路其它车辆的安全,反之则会伤害行人,AI该如何进行判断选择?
自动驾驶发展要面临的问题还有很多,这里不能一一枚举。也因为如此,致力于自动驾驶技术的企业不能操之过急,将一些还未实现的功能点前置宣传,容易造成公众们的误解,甚至引发重大的安全事故。
汽车供应商大陆在2013年做了一项关于自动驾驶调查,结果显示,66%的美国人认为“自动驾驶汽车让我感到害怕”,50%的人认为“该技术无法可靠运行”。而到了2018年,两项调查结果的数据却增加到了77%。原因可能是特斯拉、Uber等公司在自动驾驶测试中一次又一次的交通事故,影响了公众对于自动驾驶的信心。
百度的未来,自动驾驶的未来
李彦宏在2020年百度世界大会上预测,自动驾驶5年后全面商用,城市拥堵将大大缓解,不再需要限购限行,且随着无人驾驶车辆逐渐普及,交通事故发生率也会大大降低,以车路协同为基础的智能交通基础设施建设,将提升15%-30%的通行效率,从而为GDP贡献2.4%-4.8%的绝对增长。
这样的商业期许也是有市场支撑的,RoboTaxi的商业前景已被众多业界人士和机构所看好。麦肯锡公司预测,中国将会是全球最大的自动驾驶市场,到2030年,自动驾驶汽车总销售额将达2300亿美元,基于自动驾驶的出行服务订单金额将达2600亿美元。
市场调研机构艾瑞咨询则预计,随着人工智能、大数据、云计算、5G等核心技术的日趋成熟,自动驾驶正迎来快速发展阶段。到2022年,全球自动驾驶渗透率将达到50%以上,2030年全球自动驾驶渗透率则将增加至70%。
没有人会怀疑自动驾驶的未来,Waymo用千亿估值告诉所有玩家,自动驾驶是一块巨大的蛋糕。但自动驾驶的漫漫征途需要资金、时间与技术,且由于门槛更高,它不像新势力造车般百花齐放,更是行业中真正高手之间的较量。
尽管在技术上存在长尾效应,相关政策法规仍不明确,大规模商业化年限模糊,但作为L4级自动驾驶最受关注、最得资本青睐的应用场景,RoboTaxi已成为热门赛道。
百度、Waymo、特斯拉、Cruise,谁将主导这场战争呢?
本文来源于汽车之家车家号作者,不代表汽车之家的观点立场。
自动驾驶数据库的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于自动驾驶 数据分析、自动驾驶数据库的信息别忘了在本站进行查找喔。
与本文内容相关的文章: