人工智能

递归研发:Agent开始改进自己的三种路径

Q1出现了三条递归研发的路径,都指向同一个信号:Agent已经不只是在执行,它在改进自己执行的方式。探索型,AlphaEvolve——不是调参数,是搜索人类没见过的新算法,Google生产环境跑了一年回收0.7%算力。优化型,Karpathy的Autoresearch——630行代码三个文件,一晚跑50个实验,三周35K星。

工程型,Claude Code写Anthropic自己的代码——90%新代码是AI写的。三种路径性质不同,但都面临同一个瓶颈:人脑速度成了系统的限速器。Autoresearch里人类已经退出了执行环节,但定义目标和判断边界的还是人。

当Agent一晚跑50轮、一天跑500轮,人类拍脑袋定目标的速度就跟不上了。递归研发的加速是指数的,但前提是每一轮改进必须是真改进——如果评估管线本身有偏差,复利就会变成在错误方向上越跑越快。