我为自己造了个治理 AI 写代码的小工具

1980 字
10 分钟
我为自己造了个治理 AI 写代码的小工具

现在让 AI 写代码很方便,但项目做久一点就容易乱。

一开始你只是有一个想法,比如想做一个小功能,或者改一个页面。然后你就跟 AI 说,让它先做一点。它做完以后你看着还行,又想起来这里可以加个按钮,那里可以改个接口,顺便再把某个地方优化一下。

这样来几轮以后,问题就出来了。它每次都在回应当前这句话,但前面为什么这么设计、哪些只是临时想法、哪些是必须保留的约束,很容易混在一起。等你发现它写偏了,再让它改回去,它只能从当前上下文里补一个版本。

我自己遇到过几次这种情况。刚开始还觉得是提示词没写好,后来发现核心问题是需求和状态都散在聊天记录里。对话越长,越难判断当前任务到底应该按哪一版执行。

最后代码就越改越不像一开始那个东西。你也说不清是哪一步开始偏的,反正等发现的时候,已经不好收拾了。

先记录#

我一开始想得很简单,就是能不能把需求都写下来。不要全靠聊天记录,因为聊天记录真的很长,而且你回头翻也很烦。

最先想到的是 markdown。这个想法很正常,因为 markdown 好写,也能给人看。比如我可以写一个需求列表,写一下当前在做什么,再写一下哪些文件能改,哪些文件不能乱动。公司里做需求也会有单子、有范围、有验收,那 AI 写代码应该也差不多需要这些东西。

试了一段时间后,问题主要有三个。

一个问题是格式会乱。AI 往 markdown 里加东西的时候,每次写法都不一样。今天写成表格,明天写成列表,后天又多加几个标题。刚开始还能看,后面就像几版需求说明拼在一起,想找个准信都费劲。

还有一个问题是读取不稳定。文档一大,AI 不是每次都能把所有内容看完。它有时候只读一部分,然后按那一部分继续写。

最麻烦的是,markdown 只能写规矩,不能让 AI 一定按规矩办。你在文档里写“动手之前先看任务”,但它有时候还是直接开写。流程只写在文档里,约束力不够。

所以我就想,那不如做一个小工具。

写成工具#

这个工具后来叫 ai-board。

我的想法就是,把要做的事都放到一个看板里。一个需求从开始到结束,都要有状态。现在做哪个,改哪些文件,最后怎么验收,都尽量记下来。

这样至少有一个好处,就是你问 AI “现在在做什么”,它不用去猜聊天记录,而是去看当前任务。它要改文件,也应该先看这个任务说了哪些范围。

数据没有继续用纯 markdown 存,因为前面已经被 markdown 折腾过了。我用了 JSON 存状态,然后再生成 markdown 给人看。人看的是文档,机器读的是固定结构。

写这个的时候我还加了一些基础保护。写状态文件先写临时文件,再替换正式文件,避免写一半坏掉;多进程同时操作时加锁;事件日志写失败时留兜底文件。

一个管任务的小工具,至少不能把自己的任务状态弄丢。这个要求应该不算高。

管不全#

ai-board 管不住 AI 的所有行为。

它有用的地方,是让每次修改都挂在一个任务下面。你能看到这次为什么改,改了哪些范围,最后有没有验收。这个比只靠聊天记录要强一点。

但它也有很多管不到的地方。

比如它可以在提交代码的时候检查一下,看看这次改的文件有没有跑出任务范围。但它拦的是提交,不是 AI 写文件的那个瞬间。AI 写错文件以后,最后提交时才会被发现。

还有,git 本来就可以跳过检查。你真要绕过去,它也拦不住。这个我觉得没必要装作自己能拦住。

再比如 scope 现在主要看路径。路径上没冲突,不代表业务上没冲突。两个文件可能一个改了接口,一个改了调用,工具看不出来里面的关系。

所以它解决的是任务留痕和范围提醒,不是强制权限控制。你绕过流程,它不会替你兜底。

撞车#

我写到一半的时候,看到别人推荐了一个叫 GSD 的项目。说它是给 Claude Code 做治理的工具。

我点进去看了一下,它做的事情和我想的方向很像。也是把任务拆开,也是管理 scope,也是希望 AI 不要想到哪里写到哪里。

而且它已经做得很大了。很多贡献者,好几万 star,还有一堆测试和设计文档。

我忙活半天,最后发现别人已经在同一个方向上做了很久。

我还是装了一下试了试。GSD 确实很完整。它会把事情分成讨论、计划、执行、验证这些阶段,每个阶段都有自己的提示词和 agent。它不是随便写写的项目。

但我用下来觉得它太大了。

命令很多,概念也多,每次带进去的上下文也不少。它能做更多事,但我的需求是让自己的小项目别乱成一团,不一定需要这么大一套东西。

我还拿相近的任务跑过一次。GSD 用的 token 更多,ai-board 少一些。这个数字不能说明 ai-board 更厉害,因为两边干的活不同。一个是工作流系统,一个是本地任务本,直接比不太合适。

继续用#

如果单纯说成熟度,ai-board 肯定比不过 GSD。

这个没什么好装的。

ai-board 现在就是一个单人写的小工具。测试也主要集中在 CLI 那边。多 agent 的事情基本没怎么管,scope 也只是路径级别。跨机器协作这些更是没有。它现在的问题我自己也都知道。

但是我还是会继续用它,因为它刚好够我用。

我现在不需要特别完整的治理框架。我的需求是每次让 AI 改代码之前,先有个任务,能知道改哪里,能留下记录。工具本身不要太复杂,不要让我为了用工具又学一堆工具本身的东西。

GSD 很强,但我怕的是工具太强以后,我自己反而更容易偷懒。AI 改完代码,我还是要看 diff,还是要知道它到底干了什么。如果最后我还是要认真看,那我就更喜欢一个轻一点的东西。

这可能也是我现在对 AI 写代码的态度。工具可以帮忙,但不能替我负责。

先用着#

这次造轮子之后,我至少确认了自己的需求:轻量、能留痕、能约束当前任务范围。

我想要的不是一个很大的系统,而是一个能让我别忘事、别乱改、能回头查的小东西。

如果你现在让 AI 写代码也经常写乱,而且连任务状态都没地方放,那 ai-board 可能能帮你先把记录这件事做起来。

如果你要的是很完整的多 agent 流程,那就应该去看 GSD。

Terminal window
pipx install ai-board
ai-board onboard --init-if-missing

文章分享

如果这篇文章对你有帮助,欢迎分享给更多人!

我为自己造了个治理 AI 写代码的小工具
https://blog.devnu11.cn/posts/我为自己造了个治理ai写代码的小工具/
作者
DevNull
发布于
2026-06-15
许可协议
CC BY-NC-SA 4.0

评论区

文章目录