发布日期:2026-02-22 12:02 点击次数:125

2026 年齐到 2 月了,你如果还没传奇过 Agentic AI,好像率不单是断网这样陋劣——更像是手机齐丢了。
我我方算是从新看着这波波澜起来的。OpenClaw(那时还叫 ClawdBot)火出圈那阵子,好多东说念主第一次着实「看懂」了一件事:咱们想象中的 AI Agent 时间,要津从来不在它能不可聊得更像东说念主,而在它能不可把事办完。
它能开浏览器、能点按钮、能把一个蓝本需要你反复切 App 的任务拆成规范,一齐实践到收尾。你以致会在某个骤然产生错觉:屏幕那头像真实坐着一个很熟识的实习助理。
与此同期,自动化操作这股风,早就吹得手机上了。不管是豆包手机这类软硬件样式,如故各家手机大厂在系统助手上的「行径化」尝试,本质上齐在作念归拢件事——把 AI 从对话框里拽出来,塞进系统和 App 的缝里,让它去完成那些「明明很陋劣但即是很烦」的操作链路:打车、下单咖啡、生成文档。
可是,单纯的云侧智能或单纯的端侧实践,齐有着各自难以朝上的「天花板」。
云侧的 OpenClaw 领有精深的推明智力,但它看不见你手机当下的屏幕,不知说念你此刻的地舆位置,更不敢平直操作你腹地的微信去发个红包;而市面上常见的纯端侧助手,自然能调用腹地的数据和应用,却赓续因为硬件算力截至,在面对高复杂、长经由任务时显得「智力不够用」。
出动端 AI Agent 的输赢手,早就不是「作念云如故作念端」的遴荐题,而是怎么把两者的上风着实买通。近期,一家清华系团队「万象智维」遴荐用「小万」切入阛阓,押注的恰是这样一套买通端云的智力体系: 让云霄作念「大脑」,矜重复杂逻辑与贪图;让端侧作念「算作」,矜重感知与临了一公里实践。
01不仅是「能脱手」,
更是「单干明确」
{jz:field.toptypename/}在 AI Agent 的应用场景中,开辟的定位互异遥远是制约体验升级的要津。电脑与云做事器是天生的恶果器具,凭借 7×24 小时不闭幕动身点的上风,擅长承载复杂谋划与持久实践类任务。而手机则是中枢生计器具,千里淀着最细碎、最个东说念主化的步履习尚和荆棘文数据。
传统的想路是:要么把所罕有据传上云,但这面对秘籍和延长的挑战;要么在端侧硬跑大模子,但这会烧穿手机的电板和算力。
「万象智维」的解法是 「端侧 GUI + 云侧 CLI」 的时间单干。
在「小万」的产物架构中,手机被定位为 荆棘文的主要进口与实践终局 。它自然知说念你是谁、你当今在什么时期和场地、你正在用哪些应用。而云霄的 OpenClaw 则推崇其复杂推理与多任务治愈智力,矜重持久动身点任务、系统级 API 操作等中枢责任。
咱们不错通过两个真实的场景,来望望这种「端云协同」是怎么比单一端侧更聪惠的:
场景一:复随笔档的「端-云-端」勉力
当你收到一份几十页的时间文档时,单纯的端侧模子赓续读不懂深层逻辑,而单纯的云霄模子又无法平直操作你的腹地 App。
在「小万」的经由里, 端侧 Agent 领先秉承,诈欺腹地算力索求文档的要津信息;随后,任务流转至 云霄 ,由 OpenClaw 进行深度的逻辑梳理和纲要生成——这是手机腹地算力难以企及的。临了,处理好的论断回传至手机,由 端侧 Agent 再次接办,筹商你是否需要「发送给共事」或「保存到条记」,并平直调用微信完成发送。
用户感知到的是一次流通的做事,但后台其实发生了两次「端-云-端」的职能移交。
场景二:基于感知的智能通勤
清晨醒来, 端侧 Agent 基于腹地传感器感知到「外面下雨了」,并读取了你腹地日程中「清晨 9 点有会」的信息。
这些荆棘文被脱敏后发送给 云霄 ,云霄大脑赶快贪图出一条躲闪拥挤的打车决策,并决策出「需要提前动身」。
当决策细目后,领导回到 端侧 。此时,「小万」平直在手机腹地唤起打车 App,自动填写主义地、遴荐车型,并停在支付证明页面恭候你点击。
这种「端侧感知、云侧决策、端侧实践」的高效协同模式,既遁入了纯端侧智能智力不及的短板,也处治了纯云霄智能枯竭场景感知和秘籍忌惮的痛点。
02着实处治的难点:
算力、成本与秘籍
从 Demo 走向实用,一定会际遇一堆硬问题。先说最现实的: 成本与恶果 。
把智能体装进手机听起来很容易,但现成决策没法平直照搬。高频调用的畴前场景里,Token 成本绕不外去;手机端还要算昭彰内存、功耗、温度、延长。你不错在云霄把模子堆得很大,手机端必须把每一次 Token、每一次访存、每一次治愈齐算明白。
哪怕是 OpenClaw,也会豪恣挥霍大模子做事的 Tokens。不少网友在酬酢媒体吐槽账单太夸张,幸运飞艇app下载好多专科用户一天就能跑出数百好意思元。如果让手机里的每一个小动作齐去问一遍云霄大模子,这在买卖上是跑欠亨的。
「万象智维」给出的旅途,是算法与系统的深度协同优化,要点作念了两件要津时间责任。
领先,是对端侧推理框架的「极限压榨」。
既然是协同,端侧就不可太弱。「万象智维」开发了一套名为「OmniInfer-VLM」的框架,旨在榨干手机 NPU 的性能。数据露馅,在不甩手精度的前提下,该框架能让多模态推理速率相对传统 CPU 决策擢升接近 20 倍。
这意味着,像屏幕识别、OCR 索求、陋劣的意图判断这些高频操作,十足不错在腹地毫秒级完成,无需联网,既快又省。
在此之上,所以「步履」为中枢的悼念系统。
并不是统共任务齐需要「想考」。现实中,咱们每天的点咖啡、打卡旅途是高度筹商的。每次齐从零推理不仅慢,也更容易出错。
团队引入了一套悼念系统,将用户的高频操作旅途详细成数学模子记载在腹地。当你第十次点归拢种咖啡时,系统不再需要云霄的大脑从新推理「怎么点」,而是平直调用腹地的步履悼念,进行自动化实践。
这不仅让实践速率更快,更蹙迫的是,它大幅减少了对野蛮云霄算力的调用次数——据测算,这种机制能让平均推理延长镌汰约 1.49 倍。
此外,还有秘籍的「护城河」。
在 Agent 时间,秘籍不仅是数据,更是步履。比较于部分决策将每一帧截屏齐上传云霄进行分析,端云协同架构提供了一种折衷的安全性:敏锐的荆棘文(如微信聊天记载、支付密码页面)遥远保留在端侧处理;只好经过脱敏、任务需要的详细领导才会发往云霄。这自然无法作念到 100% 的物理结巴,但比较纯云霄秉承,它在架构上为用户保留了数据的「统共权」。
落地与生态:
清华系团队的工程化答卷
AI 硬件需要的是一种低算力、但在高频场景下仍然迷漫顺的处治决策。想走到畴前使用,总要面对一个现实:算力不可能无尽,体验却必须够稳。
现时,这套决策依然不单是停留在 PPT 上。凭据产物信息,「小万」现时已终昭彰端侧抓久化的荆棘文悼念,在十足依靠端侧自己算力合作云霄治愈的条目下,维持约 40 款主流应用,肃清约 150 个场景任务。不管是打车、消费、支付等畴前任务,如故贪图干系日程,齐不错通过「小万」来完成。
这组数字自然不可等同于「万能 Agent」,但却勾勒了一张瓦解的工程化门路图:先把高频、可考证的任务作念塌实,再把肃清面铺开。
而在部署上,「万象智维」一样把「腹地化」当成中枢智力遐想:「小万」的端侧任务主要诈欺手机腹地算力完成;云侧会为每位用户开设沉静的编造云做事。对有腹地部署需求的企业用户,他们还提供了腹地化部署 OpenClaw 的决策,通过 API 无缝接入「小万」,进一步镌汰秘籍忌惮。
这套锻真金不怕火的工程化打法背后,是淳朴的时间累积。「万象智维」依托清华大学端智能议论团队孵化建立,中枢团队在清华大学谋划机系任炬副西席与清华大学智能产业议论院李元春助理西席的持久引导下,在端侧模子轻量化与高效推理限度有着塌实累积。公司建立后首轮融资便获取来自星连成身手投的数千万元天神轮投资,也侧面印证了行业对其时间门路的认同。
04异日:从东说念主机交互到
Agent-to-Agent
如果说 OpenClaw 让咱们看到「Agent 不错脱手」的可能性,那么「小万」更像在回复另一个问题:当脱手发生在更多样式的端侧开辟上,智能体还能不可把事办完,何况办得让东说念主沉着?
异日的端侧 AI,或然不会局限在手机这一个样式上。眼镜、腕表、以致是异日的新式终局,它们本质上齐是一个个「端侧 Agent」。它们各自领有不同的传感器和实践智力(有的能看,有的能跑),而云霄则是一个通用的「超等大脑」。
「万象智维」正在构建的,恰是聚拢这两者的中间层—— Agent-to-Agent 的交互蚁集 。
在这套采蚁合,任务不再被绑定在某一台开辟上,而是由云霄调节贪图,分发给最稳妥的端侧开辟去实践。出动端 AI 的「脱手时间」依然开场。着实的分水岭,或然不在于谁的模子参数更大,而在于谁能用最工程化的技巧,把聪惠(云)和靠谱(端)着实勾搭在整个,处治那些用户每天齐要作念、又最怕出错的琐事。