如何看待现在 AI 的角色?

封面

一、 AI 只能算临时工

本质问题在于现在的 AI 没有持续的记忆和学习能力,这就和实习生/助理差别巨大。新人可以花几个月甚至几年来培养,但 AI?不管之前聊的多好,新开一个对话就是新招一个临时工,完全不会对你有任何了解。

至于伙伴就更鬼扯了。AI 既没有业绩要求,也不对结果负责,并且完全只拿固定薪水(不管好坏 Token 费都一样)。

所以 AI 只能是一个能力很强(但又偏科)的临时工。这个定位直接影响我们该怎么用它、该对它抱什么预期。

二:当前的替代方案

AI 没有真正的记忆,只有固定长度(而且也不算很长)的上下文窗口。这是模型本身的技术局限。

针对这个局限,目前有两个粗糙的应对方案,在很多时候会给人一种错觉,认为 AI 懂我、记住我了。

第一个方案是上下文压缩。

对话太长塞不下了,就把旧内容压缩成摘要,腾出空间。这本质上相当于让两个临时工交接工作,之前的那位先写个交接说明再走。但压缩必然会丢失信息,两个临时工交接,新员工只能在摘要范围内对你有了解。

第二个方案是 Agent 记忆体系

Memory.md、CLAUDE.md、Skill 这些文件,本质上相当于一套提前写好的员工手册。新临时工来了,先把手册塞给他读一遍。但手册不一定都准确,也不保证临时工会按手册干活。

两种方案的共同问题:它们没有改变 AI 没有记忆这件事,只是在每次新招临时工的时候尽可能多地给他补课。

三、你唯一能积累的资产

临时工来了又走。只有你是忒修斯之船上唯一永恒的存在。在调教 AI 的过程中,真正值得花的力气是打磨那套管理制度,也就是上面那一套 Agent 系统(员工手册),而不要指望 AI 能有任何学习能力。现在的 Hermes、OpenClaw,以及一些主打人设陪伴的产品都是此类。

你不能指望让临时工自己来管理这套体系,每个临时工都会按自己的想法修改,最后必然会把整个体系搞乱(熵增定律总是存在的)。现在那些说自我进化的 AI 系统,在实践中几乎总是会在越来越多的使用过程积累大量零散、碎片、短效的规则。新来的 AI 在一定程度上能多了解你一点,但经常会犯傻,本质上也是临时工管理制度失灵的结果。

当然,你也可以制定一套“维护规则的规则”,然后定时开一个临时工按此执行(有种左脚踩右脚螺旋升天的感觉)。听起来很美好,例如 OpenClaw 的做梦机制,但用起来就不一定了。

插一句,我自己尝试了一个方案,构建自己的独立管理体系,不依赖于任何平台,在 Hermes、Claude code 等平台都能用,还可以用云盘多设备同步,让体系真正属于用户自己。现在已经有了一个 Demo,地址在下面,感兴趣可以玩玩。

GitHub: https://github.com/alone-tree/Capability-Library

四、未来的方向

AI 未来的进化方向一定包含真正的个性化。

这不是把上下文工程做得更精巧,而是让模型真正拥有记忆。现在已经有了一些方向,例如谷歌的 Titans 架构:分层记忆设计,模型的权重会随着使用而不断变化,边处理边学习,“惊讶"的信息自动写入长时记忆。

更简单一点的是 NVIDIA 的 TTT-E2E:读上下文的同时实时更新模型权重——把上下文压缩进大脑本身,而不是压缩成摘要塞回 prompt。

这些都还在研究阶段。也许未来一两年就会出现,也许还需要五年、十年。

五、从商业的角度分析个性化模型

事实上,现在也有些大公司会使用自己的业务数据进行微调训练,已经有些“个性化模型”的味道了。但微调门槛很高(数据、案例,价格、前置要求等)。

未来有可能实现广泛的个性化模型吗?也许有可能。个性模型必然会催生海量的新需求,也会对当前的产品造成明显冲击。

一些商业模式猜测:

订阅制,只要选择个性化模型就要交一笔模型维护费,很可能相当不菲,包括模型的训练和模型权重的存储。如果订阅的是便宜模型,可能价格比较便宜,高端的模型会贵很多。模型规模越大会越贵。顶级模型价格可能和雇一个初级研究员接近(人民币万元/月数量级)

长期绑定,选择一家模型公司,持续使用,持续积累数据,持续优化。迁移成本很高(真正的开除旧员工、招募新员工,需要长期磨合)

合作平台,专属模型可以接入各种智能设备,手机、电脑、音响、汽车、机器人等等,类似于现在的智能家居系统。

一些不确定的点。模型可能运行在云端,或者运行在设备端。或者处于混合状态,云端运行高级模型,设备端运行蒸馏过的小模型。不同的模型通过中间一个协调层来共享临时的会话数据,实现多设备的信息统一。隔一段时间统一根据交互数据进行一次升级。