长期记忆

本节定位

短期记忆解决的是：

当前这次任务正在发生什么

长期记忆解决的是：

这个用户、这个项目、这个系统在更长时间尺度上是什么样

很多 Agent 一开始会把长期记忆想成一句话：

把重要信息存起来

但真正落地时，问题会立刻变成：

哪些信息真的值得长期保留，旧信息和新信息冲突时该信谁？

学习目标

理解长期记忆和短期记忆的职责边界
学会区分用户偏好、稳定背景、临时事实三类信息
理解长期记忆写入、更新、冲突处理和读取的基本策略
通过可运行示例掌握一个最小长期记忆存取器

一、什么信息适合进入长期记忆？

1.1 未来大概率还会用到

长期记忆最重要的标准不是“看起来重要”，
而是：

未来还有复用价值

例如：

用户偏好：喜欢简洁回答
用户背景：是初学者
项目背景：当前正在做退款助手

这些信息都可能跨很多轮继续发挥作用。

1.2 相对稳定，而不是瞬时波动

例如：

“今天心情不好”
更像短期上下文
“长期偏好表格总结”
更像长期特征

如果把短期波动也写进长期记忆，
系统很快会学到很多噪声。

1.3 一个类比

长期记忆更像“用户档案”和“项目档案”，
不是聊天记录备份箱。

档案强调：

稳定
可复用
有版本感

二、长期记忆最常见的三类内容

2.1 用户偏好

例如：

喜欢简洁
喜欢中文
输出最好带表格

2.2 稳定背景信息

例如：

用户角色是运营同学
用户正在做 RAG 项目
所属团队主要使用 Python

2.3 长期任务上下文

例如：

本周重点在做退款模块优化
当前项目的成功标准是什么

这类信息不像“最近 3 轮消息”那样短命，
也不像情景记忆那样带具体单次事件。

三、长期记忆最难的不是“存”，而是“更新”

3.1 因为新信息可能会推翻旧信息

例如之前记录：

用户喜欢详细解释

后来用户连续多次说：

以后请尽量简洁

这时系统不能简单同时保留两条，
否则读取时会自相矛盾。

3.2 所以长期记忆通常需要：

时间戳
置信度
更新策略

常见策略包括：

新记录覆盖旧记录
新旧并存，但高置信度优先
保留版本历史，只在读取时选最新

3.3 为什么“置信度”很重要？

因为用户随口一句话，不一定就该被永远写死。
例如：

“这次先不用表格”

未必等于：

“以后永远别用表格”

所以长期记忆最好有：

观察次数
明确度
置信度

四、先跑一个最小长期记忆存取器

这个示例会做四件事：

写入长期记忆
更新已有记忆
用置信度和时间排序读取
按用户隔离记忆

from dataclasses import dataclass


@dataclass
class LongTermFact:
    user_id: str
    key: str
    value: str
    confidence: float
    updated_at: int


class LongTermMemoryStore:
    def __init__(self):
        self.items = []
        self.clock = 0

    def _tick(self):
        self.clock += 1
        return self.clock

    def upsert(self, user_id, key, value, confidence=0.6):
        now = self._tick()

        for item in self.items:
            if item.user_id == user_id and item.key == key:
                # 新值更高置信时，覆盖旧值
                if confidence >= item.confidence:
                    item.value = value
                    item.confidence = confidence
                    item.updated_at = now
                return item

        fact = LongTermFact(
            user_id=user_id,
            key=key,
            value=value,
            confidence=confidence,
            updated_at=now,
        )
        self.items.append(fact)
        return fact

    def get_profile(self, user_id):
        records = [item for item in self.items if item.user_id == user_id]
        records.sort(key=lambda x: (x.confidence, x.updated_at), reverse=True)
        return {item.key: item.value for item in records}


store = LongTermMemoryStore()
store.upsert("u_001", "response_style", "detailed", confidence=0.4)
store.upsert("u_001", "response_style", "concise", confidence=0.9)
store.upsert("u_001", "language", "zh", confidence=0.8)
store.upsert("u_002", "response_style", "table", confidence=0.7)

print("u_001 profile:", store.get_profile("u_001"))
print("u_002 profile:", store.get_profile("u_002"))

4.1 这个例子最值得注意什么？

不是“能不能存进去”，
而是：

同一个 key 会被更新
置信度更高的信息会覆盖旧值
读取时是按用户聚合的 profile

这已经比“往列表 append 一条字符串”更接近真实长期记忆。

4.2 为什么这里用 `key-value` 很合理？

因为长期记忆里很多信息天然就是 profile 型：

response_style
language
project_name

这类信息用键值结构会比纯文本段落更容易控。

4.3 什么时候不适合用这种形式？

如果信息本身更像一段故事或一次经历，
那更适合：

情景记忆

而不是简单 key-value。

五、长期记忆怎么读取才不会“又多又乱”？

5.1 读取时不要把所有东西都塞进上下文

就算长期记忆存了很多条，
回答当前问题时也不一定都相关。

更好的方式是：

先按用户过滤
再按键或主题过滤
最后只抽当前最相关的几条

5.2 一个极简按主题过滤示例

def select_relevant_profile(profile, query):
    selected = {}
    if "回答" in query or "风格" in query:
        if "response_style" in profile:
            selected["response_style"] = profile["response_style"]
    if "中文" in query or "语言" in query:
        if "language" in profile:
            selected["language"] = profile["language"]
    return selected


profile = store.get_profile("u_001")
print(select_relevant_profile(profile, "之后回答风格保持一致"))

这说明长期记忆真正有效，
还取决于读取策略。

六、长期记忆最容易踩的坑

6.1 误区一：用户说过一次就永久写入

这会导致很多偶然偏好被永久固化。

6.2 误区二：长期记忆和短期记忆不分层

结果就是：

当前对话信息和长期档案搅在一起

系统会越来越乱。

6.3 误区三：只管写入，不管更新和冲突

冲突不处理，长期记忆迟早自相矛盾。

小结

这节最重要的不是把长期记忆理解成“存更多信息”，
而是理解它的本质：

长期记忆是在为 Agent 建一个会随时间更新的稳定档案，而不是囤积历史消息。

只要你抓住“稳定、可复用、可更新”这三个关键词，
后面再设计长期档案系统时就不会走偏。

练习

给示例加一个 source 字段，区分“用户显式声明”和“系统推断”，然后让写入策略对两者区别对待。
想一想：这次先简洁一点 为什么不一定适合直接写成长期偏好？
如果用户偏好经常变化，你会用覆盖、版本保留，还是置信度衰减？为什么？
你会如何把长期记忆和短期记忆组合起来服务当前回答？

学习目标​

一、什么信息适合进入长期记忆？​

1.1 未来大概率还会用到​

1.2 相对稳定，而不是瞬时波动​

1.3 一个类比​

二、长期记忆最常见的三类内容​

2.1 用户偏好​

2.2 稳定背景信息​

2.3 长期任务上下文​

三、长期记忆最难的不是“存”，而是“更新”​

3.1 因为新信息可能会推翻旧信息​

3.2 所以长期记忆通常需要：​

3.3 为什么“置信度”很重要？​

四、先跑一个最小长期记忆存取器​

4.1 这个例子最值得注意什么？​

4.2 为什么这里用 key-value 很合理？​

4.3 什么时候不适合用这种形式？​

五、长期记忆怎么读取才不会“又多又乱”？​

5.1 读取时不要把所有东西都塞进上下文​

5.2 一个极简按主题过滤示例​

六、长期记忆最容易踩的坑​

6.1 误区一：用户说过一次就永久写入​

6.2 误区二：长期记忆和短期记忆不分层​

6.3 误区三：只管写入，不管更新和冲突​

小结​

练习​