每经记者:蔡鼎 每经编辑:兰素英
当其他车企还在依赖激光雷达等类型的传感器为用户推出辅助/自动驾驶功能时,特斯拉已经开始依赖神经网络和人工智能进行所谓的完全自动驾驶。
近日,特斯拉宣布已开始向员工推出完全自动驾驶(FSD)V12版本,更新版本号为 2023.38.10。马斯克本人也在X上确认了这一消息。在特斯拉员工之中推出FSD V12版本代表着特斯拉FSD距离走进现实更近了一步。
图片来源:X平台
前几日,特斯拉为中国车主的手册更新了FSD测试版(FSD Beta)功能说明,而特斯拉中国在回应FSD是否落地国内时确认:目前确实正在推进中,但官方并没有公布落地时间表。
之所以FSD V12版本受到如此广泛的关注,是因为这是特斯拉首次放弃代码,使用神经网络进行车辆控制,是实现全新“端到端自动驾驶”的里程碑式跨越。
中信证券认为,特斯拉依赖神经网络的FSD V12为自动驾驶提供了一套未经证明的新路径,若得以走通,将对行业产生较大颠覆;FSD V12有望打造自动驾驶领域的基础底座,引领视觉(算法)的GPT时刻。
FSD V12:完全采用神经网络进行车辆控制
据外媒,虽然特斯拉是在内部小规模使用FSD V12,但随着Cybertruck的全球交付和车机系统假日OTA更新,特斯拉可以更充分地展示其FSD技术的最新突破和功能。FSD V12可能成为全球自动驾驶行业的“游戏改变者”。
Electrek报道截图
据悉,FSD V12本次最主要的更新是完全采用神经网络进行车辆控制,从机器视觉到驱动决策都将由神经网络进行控制。此次更新删除了超过30万行代码,而这些代码之前都是控制车辆的FSD功能,取而代之的是控制转向、加速和制动的神经网络。目前,FSD V12的C++代码只有2000行,相比之下,FSD V11有30多万行。这一更新减少了车机系统对代码的依赖,使其更加接近人类司机的决策过程。
马斯克将特斯拉的FSD V12描述为“端到端人工智能”,采用“光子进入,控制输出(photon in, controls out)”,强调其在真实世界场景中做出复杂决策的能力。据悉,该系统被称为“Baby AGI(婴儿版通用人工智能)”,旨在感知和理解现实世界的复杂性。据报道,特斯拉FSD V12使用了来自全球各地的数百万特斯拉的车身视频作为训练材料来模仿人类司机的驾驶决策。
Reddit上有网友在评论FSD系统的发展过程时称,“过程中的每一步都对下一步计划的实现至关重要。如果没有摄像头收集数据,特斯拉就不会有数百万甚至数十亿英里的FSD训练数据。AutoPilot堆栈使特斯拉能够对驾驶场景进行硬编码,并根据剪辑测试其逻辑。这些片段为FSD V11及更早的版本提供了支持。而当我们在使用这些版本时,特斯拉又在训练其神经网络并收集更多的数据片段。这些数据片段使特斯拉能够使用数百种场景训练神经网络。”
图片来源:Reddit
券商:FSD V12为自动驾驶提供了未经证明的新路径
马斯克此前曾表示,他相信特斯拉将在今年年底前实现“真正的”自动驾驶能力。
今年5月,马斯克表示,V12“是为FSD成为‘端到端人工智能’而保留的,覆盖从图像到转向、制动和加速等的方方面面。”正如美国科技媒体The Verge当时报道的那样,特斯拉FSD V12如今依赖的是车身摄像头和人工智能,而不像其他竞争对手那样依赖激光雷达等其他类型的车身传感器。有网友甚至称,简直就是DriveGPT。
今年6月份,马斯克就称FSD V12将不再是“测试版”,但在当时这究竟意味着什么对用户和外界来说都还非常模糊。自2020年底推出以来,特斯拉一直将FSD功能描述为“测试版”,需要司机的全面干预,因为系统仍在测试和开发过程中。
今年8月,马斯克在加州帕洛阿尔托的一次路测直播中,展示了搭载FSD V12的特斯拉Model S在施工区、变道和复杂路况中的驾驶水平,证明了该系统适应复杂路况的能力。不过,必须说明的是,在整个FSD V12路测的直播中,马斯克还是被迫介入了几次。
中信证券产业策略首席连一席团队认为,特斯拉的“端到端自动驾驶”的潜在影响是更好地实现L3自动驾驶能力。端到端/神经网络的核心好处在于模型迭代的关键由“工程师”变为了更易于规模化的“数据和算力”,因而训练效率和性能上限有望得到显著提升。
落到实处,中信证券认为端到端方案所展示出的性能潜力有望大幅提升自动驾驶系统的接管水平,从而实现真正无可争议的L3能力(例如达到每周接管1次)。但端到端模型的“黑盒”问题目前产业界尚未有十分成熟的解决方案,因此其团队认为,其最终能否迈向追求极致安全性的L4全无人驾驶仍待观望。
此外,中信证券认为特斯拉依赖神经网络的FSD V12为自动驾驶提供了一套未经证明的新路径,若得以走通,将对行业产生较大颠覆。FSD V12有望打造自动驾驶领域的基础底座,引领视觉(算法)的GPT时刻。
对于FSD V12的正式落地时间,中信证券预计明年初正式落地的可能性较大。该券商指出,“尽管(马斯克在8月份的)直播中展现出的能力距离正式推送给消费者仍有距离,但可基本推断当前的V12模型已十分接近端到端,再配合特斯拉在数据和算力上的巨大投入,V12接下来至年底的迭代速度有望大幅加快。”
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前核实。据此操作,风险自担。
每日经济新闻
网友看法
1、网友J20H20:FSD 在设计上就存在根本性的错误:使用AI 神经网络是基于对海量驾驶数据的学习,这些数据是人类产生的,人类开车是完美的吗?不会出错?所以FSD一开始就错了。自动驾驶系统不能使用AI数据归纳方法,而应该使用摄像头激光雷达毫米波雷达探测到周围所有物体的速度和方向,推算出会不会跟车相撞,这是推理的方法,华为和谷歌的系统都是使用这种方法,才能确保安全。
2、网友我是跳跳棋:视觉辅助不是看不清看得清的问题,现在的除雾算法超乎你的想象,你试试大雾天在某个地方违章,你看看交警那个摄像头能看得清你不,其实红外摄像头也是摄像头,视觉最大的问题不是看不清,只是不能很好的从三个维度去理解看到的东西,这才是激光雷达出现的根本原因。如果特斯拉算法足够牛逼,它完全可以靠纯视觉做自动驾驶。激光雷达最大的优点是使用点阵技术,它能从三个维度去感知物体。
3、网友无尘一之夜:2000行可以实现一个神经网络,还可以对环境进行判断,执行车机的操作???
4、网友星星oO月亮Oo睡着了:没激光,就是视觉笑话
5、网友蓝星小红花K:神经网络,网络没信号咋神经?
6、网友简简单单OIO:纯视觉方案我认为经过若干年后可能会比较成熟,但是这中间要牺牲多少韭菜积累经验就难说了。
7、网友怀着八卦的心看世界:看来国内学错方向了,用c++写的2000行代码[捂脸]不是Python
8、网友水草八月半:2000?一个网络框架都不止2000行,就死命催吧
9、网友九哥关于美:作为一个美术工作者,我绝不相信视觉,因为我们的作品都是在利用人们的错觉。
10、网友宁静致远5566789:把30万行代码缩减到2000行,就是创举,每一行就是一套完整的动作指令,如刹车或右拐,每一个指令和网络神经单元对应,形成,视觉--神经单元--指令--动作--视觉,形成闭环,完成连贯流畅,大数据训练增加指令单元,更熟练完成纯无人驾驶
11、网友Goldarren:主动加速和刹车失灵都被一股脑地归罪于车主,那么可想而知其自动驾驶出了错后必定也会归罪于车主,中国不是其自动驾驶实验田,不论谁批准引入,都要承担可能造成的严重后果…自动驾驶并不是无国界的,谁知道中情局会不会在某个时刻去接管呢?
12、网友瓶胆孜然:单机怎么运行神经网络
13、网友窗外的灿烂阳光:就问一下,是车载本地神经网络,还是大数据联网神经网络?不过也不用管它几行代码,能进村土路上跑几圈,不掉沟里才算有点本事了![大笑][大笑]
14、网友随缘001314:国内整天吹特斯拉,马斯克,资本一直在造神
15、网友江湖洒客:参数都不只两千个啦。那怕是用互联网,单纯网络传输协议都不只两千行。无非是封包调用。
16、网友昱淏致良知:对感知不到的情况如何处理?
17、网友朱海铭:你知道其后果吗?看起来高大上科技感十足,特斯拉通过神经网络后台1、会控制你的车。2、会带来更加不安全的意外后果。
18、网友麥克老牛:神经网络不是代码吗?
19、网友sufagl:没有网络时就瘫痪了
20、网友奇妙天空Et:试驾过特斯拉,自动驾驶很多场景下是不能启用的。实际应用场景是有限的。
版权声明:本文来源于互联网,不代表本站立场与观点,迎合教育网无任何盈利行为和商业用途,如有错误或侵犯利益请联系我们。