AutoLoop / Evolution
Evolution Log

进化日志

AutoLoop 不只是一个工具 —— 它自身也在不断进化。这里记录每一次版本更新、每一个关键决策、以及驱动产品前进的深度思考

版本更新

每个版本的核心能力与功能变化。从引擎内核到前端体验,完整记录。

v0.4.0 已上线 2026-03
策略智能涌现
跨任务学习,系统越用越聪明。从"每次从零开始"进化到"站在历史数据的肩膀上"。
  • 任务进化策略库 — 跨任务经验沉淀
  • 智能起点推荐 — 新任务直接跳到 70 分
  • 优化路径规划 — 不盲目探索,有方向感
  • 反模式预警 — 提前拦截已知失败路径
  • Context API 开放 — 成为 AI 的 Context 层
  • 策略效果排行榜 + 社区共享
v0.3.0 已上线 2026-03
Context → Content 引擎
从优化文字到优化整条变换链。引入 Context 的 8 个决策维度,让用户看到"为什么好",而不只是"变好了"。
  • Context Scanner — 决策覆盖率诊断
  • Dimension Delta — 维度变化归因分析
  • Context Blueprint — 可复用的 Context 蓝图
  • 任务类型自动识别与分类
  • 因果图谱静默积累机制
  • Context 结构可视化面板
v0.2.0 已上线 2026-03
Web UI + 可视化体验
从命令行到浏览器 — 优化过程完全可视化。打开浏览器就能启动自进化循环,实时观察每一轮迭代的评分变化与策略切换。
  • Web UI 实时仪表盘 — 评分曲线 + 策略标注
  • BYOK 多模型切换(DeepSeek / OpenAI / Anthropic)
  • REST API + Job 完整生命周期管理
  • 一键复制优化结果 + 移动端适配
  • SSE 实时事件推送,不轮询不等待
  • 官网 + 文档站上线(autoloop.pages.dev)
v0.1.0 已上线 2026-02
自进化优化引擎 — 核心闭环
三个参数启动一个自主优化循环。这是 AutoLoop 的起点:证明任何可度量任务都能被接入一个会持续变好的系统。
  • CLI + Python API + @loop 装饰器三种使用模式
  • LLM-as-Judge 五维评分 + Pairwise A/B 比较
  • 5 种自适应优化策略自动轮换
  • 三阶段温度控制(Explore → Exploit → Polish)
  • SQLite WAL 持久化 + 断点续跑 / 重试
  • 成本与变更幅度双重防线控制

产品文章

不是 changelog,是驱动 AutoLoop 进化的核心思考。每一篇都对应一个关键认知跃迁。

2026-03-17 洞察

策略智能涌现:让系统自己学会"怎么优化"

大多数优化工具的核心循环是:试一个方案 → 评估好坏 → 再试一个。问题在于,每次优化都从零开始。100 次营销文案优化积累的经验,在第 101 次开始时全部清零。

v0.4.0 的策略智能涌现,解决的就是这个问题。AutoLoop 不再只积累"最优结果",而是积累因果关系 — 哪个策略在哪种场景下、哪个优化阶段、导致了多大的分数提升。这些因果记录不断叠加,系统的策略选择就从"随机轮换"变成了"有据可依"。

具体来说,策略引擎用四因子复合评分做决策:有效性(40%)看历史接受率和提升幅度;阶段亲和度(30%)看当前是探索期、深挖期还是打磨期;近因回避(15%)防止连续重复同一策略;多样性加成(15%)鼓励尝试数据不足的方向。四个因子加权得分,推荐置信度最高的策略。

学习数据按三级精度组织:场景级(如"每日计划"类任务的策略表现)→ 类型级(如"文本"类任务的策略表现)→ 全局级(跨所有任务的策略表现)。推荐时优先查最具体的一级,数据不足才降级。这意味着系统对"冷邮件"和"技术文档"会给出完全不同的策略建议 — 因为它们的因果规律本来就不同。

更关键的是反模式预警。系统实时检测三种失败信号:低接受率(策略在当前场景根本不管用)、分数回退(策略在让结果变差)、策略耗竭(策略曾经有效但收益递减)。一旦触发,优化过程中就会实时告警,避免在死路上浪费预算。

最终效果:一个用了 500 轮的 AutoLoop 实例,和一个全新安装的实例,面对同一个任务时给出的策略顺序完全不同。前者知道"这类任务先用 content 策略打基础,再用 creative 突破",后者只能均匀探索。这就是"涌现" — 智能不是被编码进去的,是从使用数据中生长出来的。

别人的系统每次从零开始猜,你的系统每次都站在所有历史经验的肩膀上。用得越多,差距越大。
2026-03-17 里程碑

v0.4.0 深度代码审计:6 项修复,从"能跑"到"可靠"

v0.3.0 和 v0.4.0 功能全部上线后,我们对核心代码做了一次逐文件深度审计。目标不是加功能,而是找到那些"能跑但不够稳"的地方。

审计发现 6 项问题并全部修复:P1 级push_event 竞态条件(状态读取在锁外,并发线程可将 completed 回退为 running);OpenAI client 每次调用重建(应复用闭包)。P2 级 — 缺少 shutdown 钩子(数据库连接未正确关闭);SSE 每次全量加载事件(改为增量 poll_events);错误消息不一致。P3 级 — DiffStats 公式文档缺失。

测试从 118 增长到 123,全部通过。每项修复都有对应的回归测试。这是从"功能完整"到"生产可靠"的关键一步。

能跑的代码和可靠的代码之间,隔着一次认真的审计。
2026-03-16 愿景

任务进化策略库:AutoLoop 的终极护城河

每完成一次优化,系统应该沉淀的不是"又做了一次营销文案",而是一张因果图谱 — 哪个 Context 维度的变化导致了多少分数提升。

100 次这样的记录,就能提炼出"营销文案类任务的 Context 优先级公式"。1000 次就能让系统自动推荐最优起点和路径。这个策略库不能被抄 — 只能被"跑"出来。

积累的不是结果,是因果。知道"为什么好"比知道"什么是好的"值钱一百倍。

别人卖鱼竿,你卖的是"这片水域里每种鱼的最佳钓法" — 而且这本钓法手册每天都在自己变厚。
2026-03-16 洞察

Content 不是 AI 的输出,是决策链的残留物

每一段 Content 里都埋着几十个已经做完的决策:写什么、不写什么、用什么词、假设读者知道什么。这些决策要么是你做的,要么是 AI 用默认值替你做的。

当你给的 Context 不够,AI 就用默认值填满所有决策位。这就是为什么 AI 输出总有一股"正确的废话"味道 — 不是它不会写,是你没告诉它怎么决策。

这个洞察直接改变了产品方向。如果 Content 是决策链的残留物,那么优化 Content 的正确方式不是"改措辞",而是补全决策链上缺失的 Context 维度

AutoLoop 的真正工作:识别哪些决策位被 AI 用默认值填了,然后通过迭代优化逐步把这些默认值替换成"正确的决策"。

2026-03-16 决策

定位升级:从 Prompt 优化到 Context → Content 变换链优化

旧叙事:AutoLoop = Prompt 优化工具。新叙事:AutoLoop = Context → Content 自主优化引擎

从 Context 到 Content 中间有四次变换,每一次都有信号衰减:

① 编码损耗(意图 → Context)— 你脑子里的想法,翻译成文字时丢了多少?
② 压缩损耗(Context → 模型理解)— 模型理解了多少你写的 Context?
③ 选择损耗(决策空间 → 逐步生成)— 模型在几千种可能中选对了多少?
④ 着陆损耗(输出 → 读者理解)— 读者 get 到了输出的几成?

AutoLoop 优化的不是文字,是这条变换链上的信号存活率。

2026-03-16 概念

Context 的 8 个决策维度

Context 不是一坨文字,它有骨架。我们识别出 8 个决策维度,每一个都在"砍掉可能性":

L0 身份(谁在思考)→ L1 目标(方向)→ L2 约束(合法解空间)→ L3 知识(领域上下文)→ L4 范例(质量基准)→ L5 评估标准(度量"好")→ L6 格式(输出形态)→ L7 受众(语言和深度校准)

人工优化 Prompt 时,80% 的人只动 L1 和 L6,几乎不触碰 L0、L2、L5。

Context 的作用不是"给信息",是"砍掉可能性"。

好的 Context 像雕塑 — 不是往上加,是往下减,直到只剩下对的形状。
2026-03-16 决策

产品路径锁定:P0 → P1 → P2 → P3 → P4

P0 优化能用(已完成)→ P1 Context 可见化 → P2 因果数据沉淀 → P3 策略智能涌现 → P4 Context 基础设施。

P1 引入 Context Scanner、Dimension Delta 和 Blueprint,让用户看到"为什么好"。P2 开始积累任务指纹和因果图谱。P3 用积累的数据做智能起点推荐和路径规划。P4 开放 Context API,成为 AI 世界的 Context 层。

任何一步跳过,后面都不成立。没有 P1 的可见化,P2 没有结构化数据可积累。没有 P2 的因果数据,P3 的"智能"就是幻觉。

进化轨迹

按时间线记录每一个洞察、决策与里程碑。产品是怎么一步步进化到今天的。

2026-03-17
深度代码审计 — 6 项修复,测试 118→123
竞态条件、客户端复用、shutdown 钩子、SSE 增量轮询、错误消息一致性、DiffStats 文档。每项修复均有回归测试覆盖。
2026-03-17
v0.4.0 部署上线 — 策略智能涌现
任务进化策略库、智能起点推荐、优化路径规划、反模式预警、Context API。Railway 生产环境部署完成。
2026-03-17
v0.3.0 部署上线 — Context → Content 引擎
Context Scanner、Dimension Delta、Context Blueprint、任务类型自动识别、因果图谱积累。从"优化文字"升级为"优化变换链"。
2026-03-16
提出"任务进化策略库"愿景
积累因果图谱而非优化结果,每次优化让系统整体更聪明。这将成为 AutoLoop 的终极护城河 — 只能被"跑"出来,不能被抄。
2026-03-16
发现 Content = 决策链残留物
认识到 AI 输出里的每个词都是一个决策的结果。Context 不够时,AI 用默认值填满所有决策位 — 这就是"正确废话"的根源。
2026-03-16
定位升级为 Context → Content 引擎
从"Prompt 优化工具"升级为"Context → Content 自主优化引擎"。识别出四次信号衰减:编码、压缩、选择、着陆损耗。
2026-03-16
锁定产品路径 P0 → P4
五阶段递进:优化能用 → Context 可见化 → 因果数据沉淀 → 策略智能涌现 → Context 基础设施。任何一步不能跳。
2026-03-16
提炼 Context 的 8 个决策维度
L0 身份 → L1 目标 → L2 约束 → L3 知识 → L4 范例 → L5 评估标准 → L6 格式 → L7 受众。80% 的人只动 L1 和 L6。
2026-03
v0.2.0 上线 — Web UI + 可视化体验
从命令行到浏览器,优化过程完全可视化。实时仪表盘、BYOK 多模型切换、REST API、官网上线。
2026-02
v0.1.0 上线 — 核心闭环建立
三参数启动自主优化循环。证明了"任何可度量任务都能自主进化"的核心假设。从零到一。

参与进化

AutoLoop 正在从"优化工具"进化为"Context 基础设施"。试用产品、提出反馈,一起推动这件事。