发布日期:2026-05-04 10:32 点击次数:106

走完 2026 北京车展的十几个展馆,我最大的感受是,车企的高管,笃信是用上「小龙虾」了——本年,若是你的新车没搭个大模子,你齐不好真谛缔造布会。
火山引擎带着豆包通知搭载超 700 万辆车;腾讯发布出行全场景智能体开放平台;科大讯飞推星火智能座舱;面壁智能展示端侧 Agent 框架 EmbodiedClaw,连驰骋新一代 S 级齐在后排塞了一颗端侧多模态大模子 VLM。
更毋庸说华为的鸿蒙座舱 HarmonySpace 6、良马与阿里斡旋定制的 AI 大模子——放眼望去,通盘这个词车展富饶着一种「不 AI,就出局」的蹙迫感。
但若是你简直坐进这些车里,一辆一辆试夙昔,会发现一个略显莫名的事实。
绝大大齐所谓的「AI 座舱」,本体上照旧一个更智能、会聊天的语音助手。
它们不错帮你策画出去某个景点的打卡和网红餐厅阶梯,搭载了大模子才智,也能和你闲聊极端多话题,何况情怀价值给足。然而,在的确「控车」本领,才智依然欠奉——至少在 Q4 之前,的确的 Agent 控车的量产车,可能还送不到糜费者手里。
这就是 2026 年汽车 AI 最中枢的一个断层:东谈主东谈主齐在讲 Agent 上车,但从 Chatbot 到 Agent,中间差的东西,比大大齐东谈主想象的要多得多。
01 东谈主东谈主齐在讲 Agent,但 90% 照旧 Chatbot两年多之前,大模子上车就如故是车企共鸣,在 2026 年如故不是什么新闻了——它面前是基础设施,而不是端淑的噱头。
豆包(火山引擎)、通义(阿里)、星火(科大讯飞)、腾讯混元、面壁 MiniCPM……简直通盘主流大模子齐在抢汽车的进口。你甚而能在车展的展台上,看到合并家车企,不同家具接入了不同的模子厂商的家具。
的确的问题是:接了大模子之后,体验变了若干?
讯飞也在作念星火智能座舱有筹画|图片起原:极客公园
我在车延期间跟科大讯飞的东谈主聊,他们的星火大模子(星火智能座舱)也在作念上车有筹画。一个很有代表性的细节是,他们告诉我,面前星火上车作念车控的念念路,是大模子生成指示之后,映射到之前传统语音助手的控车阶梯上。换句话说,AI 的「脑子」是新的,但「动作」照旧旧的。
这不是讯飞一家的作念法。面前行业里绝大大齐「大模子上车」的合作模式,齐是车企调用一个云霄大模子 API,替换掉原来的语音引擎。 对话更天然了,学问更丰富了,情怀识别更好了——但你说一句,它答一句,这照旧 Chatbot 的逻辑。
的确的 Agent 上车应该是什么样的?
火山引擎在此次车展发布会上用了一个很准确的表述:从「回合制问答」到「感知-推理-实行-记挂-学习」的一体化闭环。翻译成东谈主话就是,它不仅仅恢复你的问题,而是能主动感知环境、纠合你的意图、拆奉命务、调用车上的各式才智把事情办完,而且还能记着你的俗例,下次作念得更好。
有一个很陋劣的判断法度,你对车说「我有点闷」。Chatbot 会问你「要不要开窗」;而一个的确的 Agent,应该能联结现时温度、湿度、车速、你的历史偏好、后排有莫得东谈主在寝息,自动作念出一套组合退换——可能是开一条缝的车窗加上调低空调两度再怒放座椅透风。
这个差距看起来不大,但背后触及的工程复杂度,是总计不同量级的。
02 从 Chatbot 到 Agent,差的不是模子,是「底座」为什么,从「能聊天」到的确「能办事」这样难?
好多东谈主的第一反应是模子不够强。但其实,以面前豆包、通义、星火这些大模子的才智,纠合「我有点闷」这句话的含义,并不是什么难事。的确的瓶颈在另一个场地:大模子再智慧,若是车企不把底层才智开放出来,它也只可陪你聊天。
这就像你请了一个终点智慧的助理,但你不给他公司的系统权限,不让他调动任何资源。他再智慧,也只可坐在那跟你对话。
Agent 上车,最大的挑战就是这个。
一辆车的底层有几千个硬件接口——空调、车窗、座椅、氛围灯、透风、导航、行车信号……这些东西原来是为「按钮」和「触屏」遐想的,不是为 AI 遐想的。你短暂让一个大模子来操作这些东西,它连信号齐拿不到,更别说安全地为止了。
而且,车控不是小事。若是你仅仅陋劣地把接口显露给 AI,让它径直调用,一朝产生安全问题,成果就可能很严重。
是以 Agent 上车的中枢勤奋不是「大模子能弗成纠合我的话」,而是「纠合之后,怎么安全地、精准地、在对的时机帮我把事办了」。
火山引擎和荣威合作的新家具序列「家越 07」|图片起原:极客公园
在此次车展前后,我真切了解了火山引擎和荣威合作的一套有筹画,叫 CPP 架构。这可能是面前行业里对「Agent 上车」想得最深、作念得最重的一个案例。
CPP 是三个词的缩写:Context、Planner、Pixel。但它不是一个 Agent——它是一个 Agent 的「操作系统」,业内叫 runtime。
先说 Context。
大大齐车载 AI 的「转折文」就是你跟它聊天的纪录。但 CPP 的 Context 作念了一件很激进的事——它把转折文泛化了。不仅仅对话,而是把车表里的通盘信息齐当作 AI 的「感知输入」:9 到 13 路外部录像头、2 到 3 路里面录像头、车辆的通盘传感器信号、用户的长期记挂,甚而豆包 App 上的个东谈主偏好数据。
这个「泛化」听起来陋劣,作念起来极难。因为这些录像头和传感器,原来是为自动驾驶、360 度倒车影像、行东谈主检测这些功能遐想的。你短暂要让座舱 AI 调用它们来判断「后排的小一又友是不是睡着了」,就需要在底层再行买通讯号通谈。荣威能作念到这一步,靠的是七年三代电子电器架构的积存——这不是短期能补的作业。
再说 Planner。
荣威的 CPP 架构|图片起原:荣威汽车
这是 CPP 最中枢的一层。它不是一个单一的大模子,而是一个多模子互助的「任务策画器」。陋劣的指示(开车窗)走一个轻量快速模子,毫秒级反应;复杂的任务(帮我策画未来的行程)走一个深度念念考模子,允许异步科罚;环境感知(后排有莫得东谈主)走视觉模子。
这里有一个很小巧的遐想叫 pre-tool 和 post-tool。比如你说:「北京鸟巢操纵阿谁什么会议中心隔邻的星巴克,帮我导夙昔。」这个苦求很复杂,AI 需要先纠合「鸟巢操纵的会议中心」是水立方照旧国度会议中心,然后搜索隔邻的星巴克,再设定导航。
若是等它全部算完再恢复你,可能要好几秒——在车里,几秒的千里默就会让东谈主合计它死机了。是以 pre-tool 机制会让 AI 先快速回一句「你说的是水立方吧?我面前帮你找隔邻的星巴克」——这段话说出来的 3 秒钟里,后台另一个并行任务如故在汗漫策画了。算完之后,post-tool 把成果汇总,接向前边的话不绝说。用户感受到的是一段连贯的对话,背后其实是两三个模子在并行职责。
终末是 Pixel——像素级实行。
这才是整套架构里最「重」的一层,亦然最需要主机厂我方来作念的一层。荣威的作念法是把底层两三千个硬件接口,封装成七八百个安全的「服务层」接口。AI 不径直操作底层硬件,而是调用这个服务层。 就像你开着车去按 P 档,它按不下去——不是因为有东谈主告诉你「弗成按」,而是在架构层面就锁死了。
这就是他们里面说的「黑区、灰区、彩区」遐想。彩区,AI 不错尽情施展;灰区,有条件地实行;黑区,比如行驶中的关节安全操作,无论 AI 多智慧齐碰不到。
荣威和火山引擎+豆包的缔造强度超出了行业预期。 荣威的服务层封装如故迭代到第三代,光第三代的研发周期就突出两年半。火山引擎的斡旋缔造团队岑岭期近 200 东谈主。而且这不是火山片面作念的——CPP 的每一层齐需要车企和大模子厂商一谈界说,因为车载场景的需求(蔓延敏锐、安全要求、多东谈主多扮装交互)和手机、电脑上的 AI 总计不同。
但原生有筹画的门槛极高。你需要车企高亢把底层架构怒放,需要大模子厂商真切纠合车载场景,需要两边插足两年以上的斡旋缔造——其中每一项齐难度极大,意愿极低。这亦然为什么通盘这个词行业齐在喊 Agent,但的确落地的简直莫得。
03 MaaS 大战,烧到了汽车上本领问题以外,Agent 上车,还有另一个看不见的战场——云服务商场的争夺。
汽车座舱正在成为 MaaS 的新战场。不夸张地说,这可能是继公有云之后,中国科技巨头们最热烈的一次 B 端抢滩。
面前至少有四条阶梯在同期跑。
火山引擎和豆包走的是「C 端撬 B 端」的阶梯。豆包 App 日活如故龙套 3 亿,这意味着字节在天然语言交互、情怀识别、个东谈主偏勤学习上积存了海量的用户数据。火山引擎把这套才智打包,推到汽车端,面前搭载量超 700 万辆,袒护 50 多个品牌、145 个车型——这个数字是行业第一。
豆包座舱助手能已矣的才智|图片起原:极客公园
更首要的是,火山此次发布的「豆包座舱助手」,径直与手机端的豆包 App 买通。这意味着你在手机上考验出来的个东谈主偏好——你心爱被劝慰照旧心爱听干货、你的谈话格调、你常问的问题类型——上车就能无缝继承。这是其他家作念不到的,因为莫得东谈主同期领有一个 3 亿日活的 C 端 AI 利用,和一套 B 端的汽车云服务。
阿里云走的是传统 B 端强客户相关的阶梯。
良马在中国选了阿里斡旋定制 AI 大模子,这是一个象征性事件。阿里云在汽车行业筹商多年,客户基盘塌实,而且在考验基础设施、数据中台方面有深厚积存。
腾讯则选了一条总计不同的路。在车展前一天的 TIMEDAY 大会上,腾讯发布了出行全场景智能体开放平台。他们的逻辑不是「卖模子」,而是「作念底座」——不绑定生态,而是开放才智,让车企在腾讯的平台上我方搭。面前腾讯家具的座舱搭载量超 1800 万辆,在头部车企中浸透率突出 80%。连特斯拉在中国商场,齐选了腾讯来作念微信互联和办法地服务。微信支付、小要领、腾讯舆图——这些生态资源是腾讯的独家护城河。
华为最荒芜,走的是最接近 Tier 1 的阶梯。鸿蒙座舱加乾崑智驾,深度绑定车企,从芯片到操作系统到利用层全部自研。
在这个步地里,火山引擎的位置很秘籍。
极客公园在车延期间参加了火山引擎的媒体群访。火山引擎高管在被问到「是否想作念华为那样的大模子上车 Tier 1」时,明确说了「不想」。但你看他们实验在推的东西——「豆包座舱助手」是齐全的产等级拜托,跟豆包 App 互联互通,年内量产——这如故远远超出了一个「API 供应商」的畛域。
嘴上说不作念 Tier 1,体魄很栽植。
更有真谛的是他在群访中对通盘这个词行业的评价——一句很跑马观花的话:「东谈主才密度较低。」翻译一下,就是火山和字节,合计我方在这个赛谈上是「降维打击」。
这种自信不是莫得真谛真谛的。
字节系有两个别东谈主莫得的东西:一个是豆包 App 积存的海量交互数据和情怀模子(3 亿日活不是白来的),另一个是本日头条和抖音体系千里淀的,内容数据和信息清洗才智。这些钞票用在车载场景里——比如让 AI 带你作念冥想,它从网上学来冥想的过程、话术、配乐,然后联结车内的氛围灯和座椅退换——这种跨域才智不是传统汽车供应商能复制的。
但火山也有我方的短板。
火山引擎在北京车展的展台|图片起原:极客公园
700 万辆搭载量天然是「第一」,但其中大部分是法度 API 接入,的确作念到 CPP 级别深度合作的标杆客户,还在打造中。数据面子,但深度还不够。 这亦然为什么火山高管在群访中反复强调「ToC 的用户体验」和「社会价值」,而对短期交易闭环的问题打了好多太极。
这场 MaaS 大战的本体,其实不是谁的模子更强——的确的赢输手是谁能把「服务闭环」作念得更深。 火山的上风是 C 端生态和内容数据,阿里的上风是 B 端客户相关和云基础设施,腾讯的上风是外交生态和支付。
谁能赢?现鄙人论断还太早。但有少许不错笃信:Agent 上车这件事,正在把汽车产业的竞争维度从「硬件制造」拉,向「软件生态」。
而在这个新战场上,传统车企的话语权,可能比他们想象的要小。
尽管车展上 Agent 上车的声量震天响,正经看,面前的确的 AI 原生架构,在行业里简直莫得量产拜托的案例。即即是合作了一年半的荣威和火山,也才走到 CPP 的 runtime 层,的确能控车、能主动服务、能抓续学习的智能助手,展望最快也要到本年年底才智跟用户碰面。
但这未必阐发了一件事:环球终于不再喜跃,仅仅给车里塞一个聊天机器东谈主了。
从 Chatbot 到 Agent,从「接 API」到「建 runtime」,从「语音助手」到「整车大脑」——这条路确乎很长。但至少在这一届北京车展上,咱们如故看到了行业转机的信号,而一朝 Agent 上车的才智,给糜费者带来跨时间的体验,汽车行业无疑会再次迎来锋利的进化。
毕竟,在中国这个神奇的商场上,即即是大爷大妈,齐是会拿着电脑让东谈主帮手装「小龙虾」的。
本文起原:极客公园开云体育(中国)官方网站
风险指示及免责条目 商场有风险,投资需严慎。本文不组成个东谈主投资提议,也未筹商到个别用户荒芜的投资筹画、财务现象或需要。用户应试虑本文中的任何概念、不雅点或论断是否顺应其特定现象。据此投资,株连自夸。