周五,终于把“住院”一周的特斯拉提了出来。作为我第一次真正经历的交通事故,至今仍然记忆非常清晰:我已经踩下了刹车,却只能眼睁睁地看着车辆撞了上去。那一刻给我留下的最大疑问只有一个——车辆的紧急制动,似乎并没有真正介入。正因为这个疑问,在周五提车返程的路上,我拨通了特斯拉的 800 客服电话,想了解一下车辆紧急制动的介入机制。特斯拉 800 的客服体验非常专业,对方一步一步指导我调取了事故发生时的行车记录仪视频,并由我将视频上传给他们进行分析。至少在这一点上,我是安心的:数据不是被“后台随意调取”。周六下午,特斯拉的工程师回电,给出了结论:这类从侧面突然窜出的“鬼探头”车辆,属于当前感知与决策体系中极难处理的场景,系统基本无法在有效时间窗口内做出反应。这个结论并不意外,但也引出了一个更有意思的问题。现在的大模型几乎都已经是多模态模型了,既能看图、也能理解视频。那它们是否具备对真实交通事故视频进行工程级分析的能力?这一次,我索性把问题抛给模型本身:使用的是近期热度很高的 Gemini Pro,以及 ChatGPT 5.2。我使用的提示词是:假设你是一位自动驾驶工程师,根据我提供的视频,从汽

技术专业 · 01-18
大模型对事故视频的分析结果
Theme Jasmine by Kent Liao