首页 > 工作测评 > 工作测评 > 理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

发布时间:2024-07-06 21:19:20

7 月 5 日消息,在今晚的理想智能驾驶夏季发布会期间,理想汽车宣布,端到端 + 视觉语言模型早鸟计划正式启动,号称可让车更智能、更像人。

IT之家汇总主要信息如下:

理想汽车称端到端模型的优势在于“高效传递”和“高效计算”两方面:端到端是一体化的模型,信息都在模型内部传递,具有更高上限,用户所能感受到的整套系统的动作、决策都“更加拟人”;一体化模型可在 GPU 里一次完成推理,且端到端延迟更低,用户可感知到“眼”“手”协调一致,车辆动作响应及时。

一体化模型可实现端到端的可训,完全数据驱动。官方表示,对于用户来说最大的感受就是 OTA 的速度越来越快

视觉语言模型方面,其整体算法架构由统一的 Transformer 模型组成,将 Prompt(提示词)文本进行 Tokenizer(分词器)编码,然后将前视 120 度和 30 度相机的图像以及导航地图信息进行视觉信息编码,通过图文对齐模块进行模态对齐,统一交给 VLM 模型进行自回归推理;VLM 输出的信息包括对环境的理解、驾驶决策和驾驶轨迹,并传递给系统 1 控制车辆。

官方表示,该系统整体设计存在三个亮点:设计了流式视频编码器,能缓存更长时序视觉信息;增加了记忆模块,缓存了多帧历史信息,可解决超长上下文推理时延问题;设计了智能驾驶 Prompt 问题库,系统 2 可以“思考”当前驾驶环境并给系统 1 合理驾驶建议,系统 1 也可在不同场景下调用不同 Prompt 问题,主动向系统 2 进行“求助”。

工作测评更多>>

2025年俄罗斯二手车市场销量与交易额均创历史纪录 首款量产四轮全线控转向SUV,智己LS9 Hyper即将上市 如果OpenAI估值8300亿美元,那谷歌该值多少? 用UWB技术实现精准定位,特斯拉CyberCab无线充电方案将落地 NVIDIA新卡皇RTX 5090 Ti再曝光:功耗直飙超700W!性能提升10% 索尼WF-1000XM6降噪豆耳机拆解曝光:换电池更容易 OpenAI计划明年推出AI音箱,定价200至300美元之间 苹果低价MacBook下月登场:首次搭载A18 Pro手机芯片 Stellantis美国经销商批评前任管理层战略,肯定新任CEO菲洛萨产品与投资方向 人形机器人要上天!众擎机器人与穿越者达成深度合作 特斯拉Model 3 Standard版2026款在泰国正式上市,起售价114.9万泰铢 印尼汽车协会就中国进口卡车合规问题向工业部提交意见 比亚迪约占墨西哥纯电及插混销量的70% 捷途G700越野车提前登陆俄罗斯市场,售价超1090万卢布 曝印度拟将欧盟进口汽车最高关税从110%砍至40% 大众CEO:除非汽车关税降低,否则可能取消奥迪美国工厂计划 工信部划定红线!废旧动力电池不得用于电动自行车 长城汽车重申打死不做增程!穆峰:增程是对技术偷工减料 中国液态金属柔性电子制造研究取得进展 “网络黑嘴”罗永浩or老板贾国龙,到底是谁把西贝推进了泥潭? 特斯拉中国申请“特斯拉智能”商标,国内车型有望近期上线AI 保时捷2025年全球交付量27.94万辆,同比下降10% 标致、雪铁龙等Stellantis旗下品牌有望用上零跑增程技术 美团上线首个开源“重思考”模型,工具调用能力登顶开源SOTA 三个月达成里程碑!《最终幻想战略版》销量破100万份 技术赋能普法,南都出品的法治动漫微视频连获国家省级大奖 《千与千寻》又一次细节!如果你是千寻,你敢拒绝父母那一口饭吗 《最终幻想9》角色设计师 30年老将板鼻利幸离职SE Jennie、Lisa 都在穿的大衣,才是冬日真正的百搭王者 贝壳公益重阳发布银龄报告:我们如何面对“老去”这一共同命题?