Agent 编程工具概览
Coding Agent 不是传统意义上的代码补全工具。它更像一个可以阅读项目、理解任务、修改文件、运行命令、解释错误并持续迭代的开发助手。你给它一个目标,它会把目标拆成步骤,然后在你的代码仓库里完成一部分真实开发工作。
这一页先帮你建立全局地图:哪些工具适合日常开发,哪些适合自动化,哪些适合团队流程,安装和命令应该怎么学。
快速结论
如果你刚开始接触 AI 编程,建议从一个主力 Coding Agent 入手,不要一开始同时安装很多套。
| 场景 | 推荐工具 | 原因 |
|---|---|---|
| 想要最完整的终端 Agent 体验 | Claude Code | 交互成熟,命令体系完整,适合重构、排错和长任务 |
| 已经有 ChatGPT / OpenAI 使用习惯 | Codex CLI | 本地终端 Agent,适合和 OpenAI 生态配合 |
| 想试开源、免费额度和大上下文 | Gemini CLI | 开源,安装简单,适合阅读大型仓库和日常问答 |
| 想做多 Agent、自动化和本地编排 | OpenClaw | 更偏自动化平台,命令覆盖面广 |
| 想给 Agent 增加工程流程 | gstack | 强化需求澄清、计划、评审、QA、发布 |
| 想让 Agent 拥有可复用技能 | Superpowers | 用 Skill 机制沉淀工作流和知识 |
| 想用规范驱动开发 | OpenSpec | 先写变更提案和规格,再让 Agent 实施 |
官方入口
| 工具 | 官方入口 |
|---|---|
| Claude Code | https://code.claude.com/docs |
| Codex CLI | https://github.com/openai/codex |
| Gemini CLI | https://github.com/google-gemini/gemini-cli |
| OpenClaw | https://docs.openclaw.ai/ |
| gstack | https://gstack.lol/ |
| Superpowers | https://github.com/obra/superpowers |
| OpenSpec | https://openspec.dev/ |
| everything-claude-code | https://ecc.tools/ |
| oh-my-claudecode | https://ohmyclaudecode.com/ |
Coding Agent 的核心能力
一个可用的 Coding Agent 至少应该具备下面几类能力:
| 能力 | 说明 | 典型用途 |
|---|---|---|
| 项目理解 | 读取文件、搜索代码、理解模块关系 | 接手陌生仓库、解释架构 |
| 代码修改 | 编辑文件、生成补丁、重构局部代码 | 修 bug、加功能、补测试 |
| 命令执行 | 运行测试、构建、格式化、脚本 | 验证修改是否真的可用 |
| 上下文管理 | 记住项目约定、会话历史、工作目录 | 长任务、多轮协作 |
| 权限控制 | 修改文件或执行命令前询问用户 | 降低误操作风险 |
| 工具扩展 | MCP、插件、技能、命令 | 接入浏览器、数据库、设计稿、CI |
真正影响效率的不是“模型会不会写代码”,而是它能不能形成可靠闭环:理解目标、修改代码、运行验证、根据失败继续修正。
主流工具对比
Claude Code
Claude Code 是 Anthropic 官方的终端 Coding Agent。它适合深度项目开发:阅读代码、拆任务、写补丁、运行测试、做代码审查都比较完整。
适合:
- 复杂项目重构
- 长上下文问题排查
- 多文件功能开发
- 需要严格权限控制的本地开发
不适合:
- 只想要 IDE 里的简单补全
- 不想在终端里工作
- 网络或账号环境不稳定的场景
Codex CLI
Codex CLI 是 OpenAI 的本地终端 Coding Agent。它运行在你的机器上,可以读取和修改本地代码,适合和 ChatGPT / OpenAI 模型生态一起使用。
适合:
- 已经使用 OpenAI 账号或 API
- 想在终端里让 Agent 直接改代码
- 想通过审批模式控制执行权限
不适合:
- 完全不能接受本地命令执行审批
- 项目流程还没有测试或构建命令
Gemini CLI
Gemini CLI 是 Google 开源的终端 AI Agent。它的安装方式简单,支持 @ 引用文件、! 执行 shell、/ 管理会话命令,适合用来阅读项目和做轻量开发辅助。
适合:
- 快速了解大型仓库
- 希望使用 Google 账号认证
- 想要开源 CLI 和较低入门成本
不适合:
- 对命令行为需要非常强的企业级管控
- 希望所有能力都围绕某个私有生态闭环
OpenClaw
OpenClaw 更像一个面向本地和自托管的 Agent 自动化平台。它的 CLI 命令覆盖 setup、agent、mcp、gateway、models、sessions、sandbox、cron、plugins 等很多方面。
适合:
- 多 Agent 编排
- 本地网关、任务自动化
- 想把 Agent 接入更多系统
不适合:
- 只想要一个简单的“帮我改代码”工具
- 不想维护本地服务或配置
工具增强生态
主力 Coding Agent 解决“谁来干活”,增强生态解决“怎么把活干得稳定”。
| 工具 | 解决的问题 | 典型命令 |
|---|---|---|
| gstack | 给开发过程加上产品、工程、评审、QA、发布角色 | /office-hours、/review、/qa、/ship |
| Superpowers | 把可复用工作流封装成 Skill | using-superpowers、systematic-debugging |
| OpenSpec | 先写规格和变更提案,再编码 | openspec init、/opsx:new |
| everything-claude-code | Claude Code 的 agents、commands、skills、hooks 集合 | /plugin install |
| oh-my-claudecode | Claude Code 插件化增强包 | /plugin marketplace add、/plugin install |
安装前准备
大多数 Coding Agent 都依赖下面这些基础环境:
| 环境 | 作用 | 检查命令 |
|---|---|---|
| Node.js | 安装 npm 分发的 CLI 工具 | node --version |
| npm | 全局安装 CLI 包 | npm --version |
| Git | 读取仓库状态、生成 diff、管理分支 | git --version |
| 终端 | 运行交互式 Agent | macOS Terminal、iTerm2、Windows Terminal |
| 账号/API Key | 认证模型服务 | 按各工具文档配置 |
安装前建议先确认项目本身能正常运行:
npm install
npm run build
npm test如果项目没有测试或构建命令,Agent 仍然能写代码,但它很难证明自己写得对。
常见命令形态
不同工具命令不完全一样,但通常可以分成几类:
| 类型 | 例子 | 作用 |
|---|---|---|
| 启动交互 | claude、codex、gemini | 进入终端对话界面 |
| 一次性提问 | claude -p "解释这个函数"、gemini -p "总结 README" | 适合脚本和快速查询 |
| 恢复会话 | claude -c、gemini -r "latest" | 继续之前上下文 |
| 指定模型 | claude --model sonnet、gemini -m gemini-2.5-flash | 控制成本、速度和能力 |
| 加载目录 | claude --add-dir ../lib、gemini --include-directories ../docs | 让 Agent 读取更多路径 |
| 输出 JSON | --output-format json | 接入脚本和自动化 |
| 管理 MCP | claude mcp、gemini mcp | 接入外部工具服务器 |
| 插件/扩展 | claude plugin、gemini extensions | 加载命令、技能和插件 |
推荐学习路线
第一步:先选一个主力 Agent
如果你不知道怎么选,优先选 Claude Code 或 Codex CLI。不要同时开三个 Agent 改同一个仓库,否则很容易产生冲突。
学习目标:
- 会启动交互式会话
- 会让它解释项目结构
- 会让它修改一个小 bug
- 会让它运行测试验证
- 会查看
git diff
第二步:学会权限控制
Agent 能执行命令是优势,也是风险。你需要养成三个习惯:
- 先让 Agent 解释计划,再允许修改。
- 文件修改后立刻看 diff。
- 危险命令必须人工确认,比如删除文件、重置 Git、修改系统配置。
第三步:建立项目约定
在项目根目录维护说明文件,例如:
AGENTS.mdCLAUDE.mdGEMINI.md.codex/配置
这些文件可以告诉 Agent:
- 项目怎么启动
- 测试命令是什么
- 代码风格是什么
- 哪些目录不能改
- 提交前要做哪些检查
第四步:引入工作流增强
当你已经能稳定使用主力 Agent 后,再考虑引入 gstack、Superpowers 或 OpenSpec。
推荐顺序:
- gstack:先把评审、QA、发布流程补起来。
- Superpowers:把常用排错和写作流程沉淀成技能。
- OpenSpec:对复杂需求使用规格驱动开发。
安全建议
| 风险 | 建议 |
|---|---|
| Agent 删除文件 | 保持 Git 工作区可追踪,修改前看计划 |
| Agent 执行危险命令 | 不要开启无脑跳过权限的模式 |
| 凭证泄露 | 不要把 API Key、Cookie、生产密码贴进对话 |
| 依赖投毒 | 安装 CLI 时只使用官方包名和官方仓库 |
| 多 Agent 冲突 | 同一时间只让一个 Agent 写同一组文件 |
| 自动化过度 | 发布、数据库变更、生产操作保留人工审批 |
如何读本专栏
建议按这个顺序阅读:
- Claude Code 深度指南
- Codex 深度指南
- Gemini CLI 深度指南
- OpenClaw 深度指南
- gstack 深度指南
- Superpowers 深度指南
- OpenSpec 深度指南
- everything-claude-code 深度指南
- oh-my-claudecode 深度指南
前四篇解决“工具怎么装、命令怎么用”。后五篇解决“怎么把 Agent 用成稳定工程流程”。
总结
Coding Agent 的价值不是替代程序员,而是把重复、机械、上下文密集的开发工作交给机器先跑一轮。你真正要掌握的是三件事:
- 选择适合自己的主力工具。
- 学会用命令控制它的上下文、权限和输出。
- 用工程流程约束它,而不是把生产风险交给它。
当你能让 Agent 按计划工作、按测试验证、按 review 修正时,它才会从“聊天机器人”变成真正的开发搭档。