AutoLoop — 进化日志

2026-03-17 洞察

策略智能涌现：让系统自己学会"怎么优化"

大多数优化工具的核心循环是：试一个方案 → 评估好坏 → 再试一个。问题在于，每次优化都从零开始。100 次营销文案优化积累的经验，在第 101 次开始时全部清零。

v0.4.0 的策略智能涌现，解决的就是这个问题。AutoLoop 不再只积累"最优结果"，而是积累因果关系 — 哪个策略在哪种场景下、哪个优化阶段、导致了多大的分数提升。这些因果记录不断叠加，系统的策略选择就从"随机轮换"变成了"有据可依"。

具体来说，策略引擎用四因子复合评分做决策：有效性（40%）看历史接受率和提升幅度；阶段亲和度（30%）看当前是探索期、深挖期还是打磨期；近因回避（15%）防止连续重复同一策略；多样性加成（15%）鼓励尝试数据不足的方向。四个因子加权得分，推荐置信度最高的策略。

学习数据按三级精度组织：场景级（如"每日计划"类任务的策略表现）→ 类型级（如"文本"类任务的策略表现）→ 全局级（跨所有任务的策略表现）。推荐时优先查最具体的一级，数据不足才降级。这意味着系统对"冷邮件"和"技术文档"会给出完全不同的策略建议 — 因为它们的因果规律本来就不同。

更关键的是反模式预警。系统实时检测三种失败信号：低接受率（策略在当前场景根本不管用）、分数回退（策略在让结果变差）、策略耗竭（策略曾经有效但收益递减）。一旦触发，优化过程中就会实时告警，避免在死路上浪费预算。

最终效果：一个用了 500 轮的 AutoLoop 实例，和一个全新安装的实例，面对同一个任务时给出的策略顺序完全不同。前者知道"这类任务先用 content 策略打基础，再用 creative 突破"，后者只能均匀探索。这就是"涌现" — 智能不是被编码进去的，是从使用数据中生长出来的。

别人的系统每次从零开始猜，你的系统每次都站在所有历史经验的肩膀上。用得越多，差距越大。

2026-03-17 里程碑

v0.4.0 深度代码审计：6 项修复，从"能跑"到"可靠"

v0.3.0 和 v0.4.0 功能全部上线后，我们对核心代码做了一次逐文件深度审计。目标不是加功能，而是找到那些"能跑但不够稳"的地方。

审计发现 6 项问题并全部修复：P1 级 — push_event 竞态条件（状态读取在锁外，并发线程可将 completed 回退为 running）；OpenAI client 每次调用重建（应复用闭包）。P2 级 — 缺少 shutdown 钩子（数据库连接未正确关闭）；SSE 每次全量加载事件（改为增量 poll_events）；错误消息不一致。P3 级 — DiffStats 公式文档缺失。

测试从 118 增长到 123，全部通过。每项修复都有对应的回归测试。这是从"功能完整"到"生产可靠"的关键一步。

能跑的代码和可靠的代码之间，隔着一次认真的审计。

2026-03-16 愿景

任务进化策略库：AutoLoop 的终极护城河

每完成一次优化，系统应该沉淀的不是"又做了一次营销文案"，而是一张因果图谱 — 哪个 Context 维度的变化导致了多少分数提升。

100 次这样的记录，就能提炼出"营销文案类任务的 Context 优先级公式"。1000 次就能让系统自动推荐最优起点和路径。这个策略库不能被抄 — 只能被"跑"出来。

积累的不是结果，是因果。知道"为什么好"比知道"什么是好的"值钱一百倍。

别人卖鱼竿，你卖的是"这片水域里每种鱼的最佳钓法" — 而且这本钓法手册每天都在自己变厚。

2026-03-16 洞察

Content 不是 AI 的输出，是决策链的残留物

每一段 Content 里都埋着几十个已经做完的决策：写什么、不写什么、用什么词、假设读者知道什么。这些决策要么是你做的，要么是 AI 用默认值替你做的。

当你给的 Context 不够，AI 就用默认值填满所有决策位。这就是为什么 AI 输出总有一股"正确的废话"味道 — 不是它不会写，是你没告诉它怎么决策。

这个洞察直接改变了产品方向。如果 Content 是决策链的残留物，那么优化 Content 的正确方式不是"改措辞"，而是补全决策链上缺失的 Context 维度。

AutoLoop 的真正工作：识别哪些决策位被 AI 用默认值填了，然后通过迭代优化逐步把这些默认值替换成"正确的决策"。

2026-03-16 决策

定位升级：从 Prompt 优化到 Context → Content 变换链优化

旧叙事：AutoLoop = Prompt 优化工具。新叙事：AutoLoop = Context → Content 自主优化引擎。

从 Context 到 Content 中间有四次变换，每一次都有信号衰减：

① 编码损耗（意图 → Context）— 你脑子里的想法，翻译成文字时丢了多少？
② 压缩损耗（Context → 模型理解）— 模型理解了多少你写的 Context？
③ 选择损耗（决策空间 → 逐步生成）— 模型在几千种可能中选对了多少？
④ 着陆损耗（输出 → 读者理解）— 读者 get 到了输出的几成？

AutoLoop 优化的不是文字，是这条变换链上的信号存活率。

2026-03-16 概念

Context 的 8 个决策维度

Context 不是一坨文字，它有骨架。我们识别出 8 个决策维度，每一个都在"砍掉可能性"：

L0 身份（谁在思考）→ L1 目标（方向）→ L2 约束（合法解空间）→ L3 知识（领域上下文）→ L4 范例（质量基准）→ L5 评估标准（度量"好"）→ L6 格式（输出形态）→ L7 受众（语言和深度校准）

人工优化 Prompt 时，80% 的人只动 L1 和 L6，几乎不触碰 L0、L2、L5。

Context 的作用不是"给信息"，是"砍掉可能性"。

好的 Context 像雕塑 — 不是往上加，是往下减，直到只剩下对的形状。

2026-03-16 决策

产品路径锁定：P0 → P1 → P2 → P3 → P4

P0 优化能用（已完成）→ P1 Context 可见化 → P2 因果数据沉淀 → P3 策略智能涌现 → P4 Context 基础设施。

P1 引入 Context Scanner、Dimension Delta 和 Blueprint，让用户看到"为什么好"。P2 开始积累任务指纹和因果图谱。P3 用积累的数据做智能起点推荐和路径规划。P4 开放 Context API，成为 AI 世界的 Context 层。

任何一步跳过，后面都不成立。没有 P1 的可见化，P2 没有结构化数据可积累。没有 P2 的因果数据，P3 的"智能"就是幻觉。

进化日志

版本更新

产品文章