一、 核心变量:记忆的三变量模型
FSRS 将每一条记忆的状态拆解为三个独立的维度,这构成了其算法的核心依据 [2]:
- 稳定性 (Stability, S):代表记忆的“强度”。指距离上次复习经过 $S$ 天后,用户依然有 90% 的概率记得该内容。$S$ 值越大,遗忘越慢。
- 可提取性 (Retrievability, R):代表即时记忆的“概率”。它是时间 $t$ 与稳定性 $S$ 的函数,反映了此时此刻用户想起单词的可能性。
- 难度 (Difficulty, D):代表单词进入长期记忆的阻力。受用户初次接触单词时的反馈影响(如“简单”或“困难”)。
二、 数学逻辑与公式
1. 遗忘曲线公式
FSRS 4.5 采用了受神经网络启发的指数衰减公式来描述记忆留存率 $R$ 与时间 $t$ 之间的关系 [2]:
$$R(t, S) = \left( 1 + \text{FACTOR} \cdot \frac{t}{S} \right)^{\text{DECAY}}$$
系统通过该公式计算出 $R$ 降低到预设阈值(默认 0.9)的那一天,即为最佳复习日。
2. 19 组权重参数 (Weights) 拆解
这 19 个参数通过机器学习拟合用户的历史数据,分为四个功能模块驱动模型运行 [2]:
A. 初始稳定性模块 (Parameters 0-3)
决定新单词的起步稳定性。系统根据初次反馈(困难、良好、简单)赋予不同的初始 $S$ 值,确保新词在第一时间获得个性化的复习间隔。
B. 稳定性增长模块 (Parameters 4-14)
这是算法最核心的部分,决定了复习成功后 $S$ 如何增量增长。它会考虑间隔效应 (Interval Expansion):如果在快要遗忘时成功回想,算法会判定记忆受刺激程度更强,赋予更大的稳定性增量。
C. 稳定性重置模块 (Parameters 15-16)
当用户点击“忘记 (Again)”时,决定稳定性如何跌落。算法采用“非零重置”逻辑,基于之前的记忆表现计算惩罚后的稳定性,保护已有的记忆积累。
D. 难度动态调整模块 (Parameters 17-18)
控制单词难度值 ($D$) 的实时漂移。如果你连续反馈“困难”,这两个参数会迅速推高该词的 $D$ 值,使其进入更高频的复习循环。
三、 复习反馈与变量互动
当用户在复习时给出评价,算法内部会实时更新该单词的状态:
| 用户评级 | 算法内部逻辑 | 预期的下一次间隔 |
|---|---|---|
| 忘记 (Again) | $S$ 被重置或大幅削减,$D$ 显著增加 | 极短周期(几分钟或 1 天) |
| 困难 (Hard) | $S$ 增长缓慢,$D$ 略微增加 | 较短周期 |
| 良好 (Good) | $S$ 按照标准系数增长 | 符合预期(适中周期) |
| 简单 (Easy) | $S$ 爆发式增长,$D$ 降低 | 远期周期 |
四、 算法优势对比
| 特性指标 | FSRS 4.5 (19 组参数) | 传统 SM-2 (固定参数) |
|---|---|---|
| 拟合逻辑 | 针对个人历史数据动态训练 | 使用通用的经验公式 |
| 预测偏差 (RMSE) | 5% - 10% (极高精准度) | 通常超过 30% |
| 任务负担 | 减少约 20%~30% 无效复习 [4] | 易出现复习任务堆积 |
| 抗干扰性 | 自动校准超前/延迟复习 | 机械执行计划,容错率低 |
五、 在词萦(VocabKeep)中的实践
在词萦 V2 中,系统会通过后台优化器(Optimizer)定期回溯用户所有的复习历史。通过不断调整这 19 个参数,直到公式计算出的“预测遗忘曲线”与用户的“真实表现”达到最高重合。
结语:这 19 个参数构成了你大脑记忆的数字化镜像。你复习得越多,词萦就越懂你的遗忘。