TechWeb 文/卞海川
在距离上次“AI Talk”整整130天之后,理想汽车创始人兼CEO李想再度接受张小珺专访,系统阐述了理想汽车在人工智能,特别是“司机大模型”(VLA)方面的最新进展。
人工智能尚未减少工作时长,核心挑战仍是“熵增”
“人工智能发展得这么快,但我每天的工作时长并没有减少。”李想的一句开场白引发共鸣。在他看来,当前大多数人仍将AI视为信息工具,而信息的质量受限于索引机制,尤其是RAG(检索增强生成)依赖的源头往往已“失真”,导致“推理很认真,但结果是错的”。
李想进一步提出AI工具的三层分级:信息工具、辅助工具、生产工具。
“只有成为生产工具,人工智能才真正实现爆发。” 他强调,AI若无法切实改善产出质量、压缩时间成本,就无法对工作效率产生实质影响。
拥抱DeepSeek,加速理想VLA模型推进9个月
对于中国大模型行业,李想毫不掩饰自己的赞誉:“无论是DeepSeek还是千问,中国AI在基础模型、推理模型、多模态能力上已经跟美国的距离基本上拉近了。”
李想对DeepSeek以及其创始人梁文锋给出了高度评价,包括“自律”、“会在全世界范围之内去研究和学习最佳实践和最好的方法论的人”。
李想介绍了他从DeepSeek上吸取到的经验。DeepSeek运用了人类的最佳实践,比如说DeepSeek V3采用了一个671B的MoE(混合专家模型)。
专家能力如何构建?李想认为,DeepSeek展示了一个最佳实践:第一步一定要先搞研究。
“任何时候当我们想去改变和提升能力,第一步一定是搞研究,第二步是研发,第三步是把能力表达出来,第四步是能力变成业务的价值。这四个步骤是个极简的人类最佳实践,但我们经常做着就忘掉了,看到什么东西就直接去启动研发,而没有去搞研究。”李想说道。
正是基于DeepSeek的开源,理想汽车在VLA司机大模型的语言能力研发上提速显著,节省了近9个月的时间和数亿元成本。
“我们内心很简单:DeepSeek帮助我们太大,所以我们决定开源自研的星环OS系统作为回馈。”李想表示,就是DeepSeek给我们带来那么大的帮助,我们应该给对社会贡献点什么,不让行业那么卷。说白了纯粹是感谢DeepSeek。
为什么有了DeepSeek,理想还要自研基座模型?李想回应说:“核心在场景需求不同,我们要做车载多模态交互,尤其是VLA(视觉语言行动模型)——需要3D/2D视觉融合,叠加汽车、交通、家庭场景的专业语料,这些垂直领域的数据和训练逻辑,是通用模型没覆盖的。”
理想汽车的AI主航道:打造司机级大模型
目前的L2、L2+组合驾驶辅助仍属于辅助工具阶段,而VLA能够让AI真正成为司机,成为交通领域的专业生产工具。对理想汽车而言, 未来的VLA就是一个像人类司机一样工作的司机大模型”。
在李想看来,辅助驾驶的真正突破点是VLA——一个能像人类司机一样观察、理解并执行行动的多模态大模型。
他将VLA的发展划分为三阶段:
1. 昆虫智能阶段:依赖规则算法、高精地图,智能程度有限;比较像蚂蚁的行动和完成任务的一个方式。
2. 哺乳动物阶段:通过端到端学习模仿人类操作,泛化能力增强;去面对它从来没有学到的、特别复杂的,其实就会遇到问题。
3. 人类智能阶段:VLA具备理解物理世界的能力,结合3D视觉、语言理解和行动执行,“像司机一样工作”。
李想总结称,它会像人类一样的用3D的vision和2D的组合,去看整个真实的物理世界,也包含它能够去看懂导航软件是怎么在运行的,而不是像VLM那样只能看到一张图片。另外一方面,它有自己的整个脑系统,不但要看到物理世界,还能够理解这个物理世界。它有它的language,然后它也有它的CoT(思维链),有推理的能力。
目前,理想正在训练一个32B参数量级的VL(视觉-语言)基座模型,加入了高清2D图像、3D视觉、交通语言语料及VL联合语料(如导航与行为的关联)。
基于此前李想对于人工智能的判断,他认为,只有让辅助驾驶变成一个真正的司机,它才是一个生产力工具,不只是一个辅助工具。
最新公布的视频显示,基于 VLA 模型的辅助驾驶系统,驾驶员可以用语音操控车辆,包括走收费站的人工通道、掉头、靠边停车、停在停车场的 C3 区域等等,这都是辅助驾驶从未有过的体验。
对于行业普遍存在的对辅助驾驶安全性的质疑,李想则表示,“这正是黎明前的黑暗”。他表示,正因为辅助驾驶行业遇到了问题,我最喜欢、最开心的方式,就是去解决行业解决不了的问题,这是我们自己坚决相信的。
李想认为,只要人类会雇佣司机,人工智能技术是把类似这样的一些功能和角色,去变成真正的生产力、生产工具,然后进行替代。
成长带来能量,在痛苦中保持正能量
今年7月,理想汽车将迎来成立十周年。李想表示,创业路上苦多于甜,他选择保留那些有价值的美好片段,用来激励自己保持正能量。“创业确实不容易,但是没必要苦哈哈的。苦和甜是一个硬币的正反面,取决于看哪一面。”他将企业遭遇的打击视为必须面对的挑战,也正是这些挑战,赋予了理想汽车更多的能力。
谈及如何成为更有能量的人,李想认为,关键在于关注自我,接受自身的优点和不足,并用成长替代改变——成长意味着增强能力。除此之外,李想强调亲密关系同样重要,关注他人的成长也能带来能量,家人和同事能够和他形成互补,相互支撑。“我需要家人和同事甚至超过了他们需要我,首先是我需要他们,然后才是他们需要我,我们在一起能够形成非常强的脑力和心力。”李想表示。
回顾几次创业经历,李想表示,从高中创办个人网站至今,自己的思维方式没有什么变化:遇到问题解决问题,解决别人不愿解决的难题,解决用户的痛点,不断向他人学习。不同的是,如今面临的问题更复杂、服务的用户群体更多、公司规模和组织也更庞大。“几次创业一路走来,最难时有人相助,遇坑也能迅速爬出,一帮人齐心协力变得更好,这是种幸运,也没什么可后悔的。”
AI的真正爆发,不仅是技术参数的跃升,更是从“参考”到“生产”的范式转移。司机大模型,或许正是理想汽车投向未来的一张王牌。
转载请注明出处。