2026-04-18人工智能

递归研发：Agent开始改进自己的三种路径

Q1出现了三条递归研发的路径，都指向同一个信号：Agent已经不只是在执行，它在改进自己执行的方式。探索型，AlphaEvolve——不是调参数，是搜索人类没见过的新算法，Google生产环境跑了一年回收0.7%算力。优化型，Karpathy的Autoresearch——630行代码三个文件，一晚跑50个实验，三周35K星。工程型，Claude Code写Anthropic自己的代码——90%新代码是AI写的。三种路径性质不同，但都面临同一个瓶颈：人脑速度成了系统的限速器。Autoresearch里人类已经退出了执行环节，但定义目标和判断边界的还是人。当Agent一晚跑50轮、一天跑500轮，人类拍脑袋定目标的速度就跟不上了。递归研发的加速是指数的，但前提是每一轮改进必须是真改进——如果评估管线本身有偏差，复利就会变成在错误方向上越跑越快。