AI记忆链是什么?
2026年4月13日,我们发布了《AI记忆链商业化白皮书》,正式提出了“AI记忆链”这个概念。白皮书本身是一份比较正式的行业文档,这篇想用更直白的方式,把这件事说明白。
一、现在的AI,有两个地方让人不舒服
用AI的人,大概都遇到过两种情况。
第一种是“失忆”。今天跟AI聊了一个项目,过两天再打开,它完全不记得了。换台设备,从头开始。清了缓存,从头开始。你反复交代过的偏好、习惯、背景,它转头就忘。不是它不想记,是现在大多数产品的架构就没打算让它记。
第二种是“限速”。充了会员,聊得正起劲,突然弹出提示:额度用完了,等几小时再聊。明明交了钱,怎么还被限制?背后的原因是,平台也难受——你用得越多,它付出的算力成本就越高。月费是固定的,成本是浮动的,重度用户用多了,平台就亏。
这两个问题看起来不相关,其实根子是同一个:现在的AI服务,把“存”和“用”绑在一起卖了。
二、把“存”和“用”拆开
我们在白皮书里提出来的方案,叫“双轨制”。说白了就一句话:存储和算力分开计费。
存储轨——交房租。 用户按月租一个属于自己的云端记忆空间。你跟AI聊过的天、做过的项目、留下的偏好,都存在这个空间里。它是你专属的,不会因为换设备或者清缓存就消失。而且数据在本地加密之后再上传,解密密钥只有你自己有。平台只负责保管加密后的数据,看不到内容。
算力轨——交电费。 AI每次回复你,背后都在消耗算力。这部分按实际用量算钱,用多少Token付多少。用得多多付,用得少少付,不用不付。
拆开之后,事情就清楚了。轻度用户不用担心月费白交,重度用户不用被偷偷限速。平台也不用在后台搞各种限制操作,因为多用的算力已经有了对应的收入。存储是存储的钱,算力是算力的钱,分开算账,谁也不绑架谁。
三、记忆怎么才算真正属于你?
分开计费解决的是“怎么收费”的问题。更底层的一个问题是:你的记忆,到底归谁?
在双轨制的架构里,有一个核心设计叫“盲存”。意思是:你产生的对话和记忆,先在本地设备上加密,然后再上传到云端。解密用的密钥,只有你自己拿着。平台手里只有一堆加密过的数据,没有钥匙,打不开。你换一台设备登录,数据从云端同步过来,同样是在本地解密之后再使用。整个传输过程中,平台只负责转发密文,不接触明文。
这样一来,平台的角色就从“数据掌控者”变成了“数据托管方”。就像银行的保险箱——银行有箱子,但钥匙在你手里。基于这个设计,用户对记忆资产拥有完整的权利:可以随时查看全部内容,可以一键导出带走,可以彻底删除。这些权利不是平台“承诺”给你的,是加密架构从技术上保证的。
四、记忆和算力,为什么可以不在同一个地方?
双轨制的另一个好处是:存储和算力在物理上可以分开部署。
存储节点放在离用户近的地方,数据传输快,也方便满足不同地区的合规要求。算力节点可以放在电力成本低的地方,通过Token的方式远程调用。当AI需要回忆你的历史对话时,只需要从存储节点提取相关的“语义向量”——一种经过加密处理的数学表示,不包含原文——然后传到算力节点进行计算。原始的记忆数据根本不需要离开存储节点。
这有点像苹果iCloud的运作方式。中国用户的iCloud数据存在贵州,但你在全球任何一个地方用苹果服务,体验都是一样的。数据存在哪里不重要,重要的是你能随时访问,服务是连续的。AI记忆链用的是一样的思路。记忆放在哪、算力来自哪,用户不需要关心。用户只需要感受到一件事:这个AI记得我。
五、这跟大模型是什么关系?
需要说明一点:AI记忆链不是一个大模型,也不替代任何大模型。它是一层架构,架在大模型之上,专门负责“记忆”这件事。你用文心、用通义、用DeepSeek,盘古大模型都可以接入这层架构。记忆链不挑模型,只提供长记忆能力。
这个定位的好处是中立。不绑定任何一家模型厂商,不跟任何一家云厂商竞争,只做中间这一层。就像当年的关系链——不管你在哪个社交App里交朋友,关系链本身才是留住你的东西。
六、总结
AI记忆链想做的,不是让AI更聪明,而是让它更懂你。
双轨制解决的是“怎么收费才公平”的问题。盲存解决的是“记忆归谁”的问题。解耦解决的是“存和用怎么放”的问题。
三个问题,一个方向:让AI不再是工具,而是记得你、懂你的伙伴。
粤公网安备44198202000199号