- 主题:理想也转向FSD,未小理只剩未来了
理想基座模型负责人詹锟(硅谷两周试驾 FSD 14.3)发布会核心发言内容
一、出发前的行业共识:先有判断,再实地验证
大量从硅谷归国的行业技术人,统一给李想和他传递同一个结论:全球高阶智驾只有特斯拉 FSD 属于第一梯队,国内所有车企自研智驾暂时都达不到同一水准。
为避免道听途说、不闭门内卷,专程前往硅谷,连续两周全天候驾驶搭载 FSD v14.3 的 Model S,覆盖城市街巷、环岛、高速、无标线乡村小路全场景深度实测验证。
二、两周试驾后的两大核心直观感受
回国后最深刻的两句话:
特斯拉真的太强大了(可以公开对外表述)
压力真的太大了(内部紧迫感,回国立刻落地行动)
端到端大模型天然排斥激光雷达前融合(核心原因,詹锟硅谷试驾 FSD 后重点输出)
数据逻辑不统一
人类驾驶员、特斯拉 FSD 全部依靠视觉像素做决策,海量影子数据、真实驾驶样本全是摄像头画面;激光雷达点云是另一套数据维度,两套信号融合会产生冲突、模型推理臃肿、延迟变高,车辆操作生硬、变道 / 避让不够自然。
特斯拉纯视觉模型只用像素,输入单一、推理更快、驾驶拟人度更高,詹锟试驾两周 FSD v14.3 后,直观感受到融合多传感器带来的决策拖沓。
激光雷达只能测距,无法理解语义
激光雷达只能输出三维距离点云,识别不了红绿灯颜色、路牌文字、交警手势、施工标识;真正决定智驾好不好用的 “场景理解”,完全依赖视觉 3D ViT 大模型。卷高线数激光雷达无法补齐语义理解短板,属于无效硬件内卷。
点云帧率低、远距离信号衰减
激光雷达帧率远低于摄像头,远距离点云稀疏,高速、远距离预判反而不如长焦高清摄像头;多径反射还容易产生虚假障碍物,干扰主模型判断。
简化模型,提升泛化能力
端到端模型追求极简输入,去掉激光雷达作为主感知输入后,模型参数量、计算压力下降,泛化能力更强,各类小路、异形障碍物适配更好,更容易对齐 FSD v14 的流畅度。
--
FROM 218.108.210.*
国内车厂堆激光雷达也是没有办法的事情,短期只能这么做。
【 在 wuspd 的大作中提到: 】
: 理想基座模型负责人詹锟(硅谷两周试驾 FSD 14.3)发布会核心发言内容
: 一、出发前的行业共识:先有判断,再实地验证
: 大量从硅谷归国的行业技术人,统一给李想和他传递同一个结论:全球高阶智驾只有特斯拉 FSD 属于第一梯队,国内所有车企自研智驾暂时都达不到同一水准。
: ...................
--
FROM 123.118.212.*
这让896线激光雷达情何以堪,还要1000多线摇摇领先呢
【 在 wuspd 的大作中提到: 】
: 理想基座模型负责人詹锟(硅谷两周试驾 FSD 14.3)发布会核心发言内容一、出发前的行业共识:先有 ...
--
FROM 114.254.10.*
菊花的车连大吊车都能撞,激光雷达是瞎子的眼睛就是个摆设
相当于荣~耀模仿苹果的三摄,后面非要多开个窟窿
--
修改:litra FROM 123.120.1.*
FROM 123.120.1.*