Skip to content

Agent 编程工具概览

Coding Agent 不是传统意义上的代码补全工具。它更像一个可以阅读项目、理解任务、修改文件、运行命令、解释错误并持续迭代的开发助手。你给它一个目标,它会把目标拆成步骤,然后在你的代码仓库里完成一部分真实开发工作。

这一页先帮你建立全局地图:哪些工具适合日常开发,哪些适合自动化,哪些适合团队流程,安装和命令应该怎么学。

快速结论

如果你刚开始接触 AI 编程,建议从一个主力 Coding Agent 入手,不要一开始同时安装很多套。

场景推荐工具原因
想要最完整的终端 Agent 体验Claude Code交互成熟,命令体系完整,适合重构、排错和长任务
已经有 ChatGPT / OpenAI 使用习惯Codex CLI本地终端 Agent,适合和 OpenAI 生态配合
想试开源、免费额度和大上下文Gemini CLI开源,安装简单,适合阅读大型仓库和日常问答
想做多 Agent、自动化和本地编排OpenClaw更偏自动化平台,命令覆盖面广
想给 Agent 增加工程流程gstack强化需求澄清、计划、评审、QA、发布
想让 Agent 拥有可复用技能Superpowers用 Skill 机制沉淀工作流和知识
想用规范驱动开发OpenSpec先写变更提案和规格,再让 Agent 实施

官方入口

工具官方入口
Claude Codehttps://code.claude.com/docs
Codex CLIhttps://github.com/openai/codex
Gemini CLIhttps://github.com/google-gemini/gemini-cli
OpenClawhttps://docs.openclaw.ai/
gstackhttps://gstack.lol/
Superpowershttps://github.com/obra/superpowers
OpenSpechttps://openspec.dev/
everything-claude-codehttps://ecc.tools/
oh-my-claudecodehttps://ohmyclaudecode.com/

Coding Agent 的核心能力

一个可用的 Coding Agent 至少应该具备下面几类能力:

能力说明典型用途
项目理解读取文件、搜索代码、理解模块关系接手陌生仓库、解释架构
代码修改编辑文件、生成补丁、重构局部代码修 bug、加功能、补测试
命令执行运行测试、构建、格式化、脚本验证修改是否真的可用
上下文管理记住项目约定、会话历史、工作目录长任务、多轮协作
权限控制修改文件或执行命令前询问用户降低误操作风险
工具扩展MCP、插件、技能、命令接入浏览器、数据库、设计稿、CI

真正影响效率的不是“模型会不会写代码”,而是它能不能形成可靠闭环:理解目标、修改代码、运行验证、根据失败继续修正。

主流工具对比

Claude Code

Claude Code 是 Anthropic 官方的终端 Coding Agent。它适合深度项目开发:阅读代码、拆任务、写补丁、运行测试、做代码审查都比较完整。

适合:

  • 复杂项目重构
  • 长上下文问题排查
  • 多文件功能开发
  • 需要严格权限控制的本地开发

不适合:

  • 只想要 IDE 里的简单补全
  • 不想在终端里工作
  • 网络或账号环境不稳定的场景

Codex CLI

Codex CLI 是 OpenAI 的本地终端 Coding Agent。它运行在你的机器上,可以读取和修改本地代码,适合和 ChatGPT / OpenAI 模型生态一起使用。

适合:

  • 已经使用 OpenAI 账号或 API
  • 想在终端里让 Agent 直接改代码
  • 想通过审批模式控制执行权限

不适合:

  • 完全不能接受本地命令执行审批
  • 项目流程还没有测试或构建命令

Gemini CLI

Gemini CLI 是 Google 开源的终端 AI Agent。它的安装方式简单,支持 @ 引用文件、! 执行 shell、/ 管理会话命令,适合用来阅读项目和做轻量开发辅助。

适合:

  • 快速了解大型仓库
  • 希望使用 Google 账号认证
  • 想要开源 CLI 和较低入门成本

不适合:

  • 对命令行为需要非常强的企业级管控
  • 希望所有能力都围绕某个私有生态闭环

OpenClaw

OpenClaw 更像一个面向本地和自托管的 Agent 自动化平台。它的 CLI 命令覆盖 setup、agent、mcp、gateway、models、sessions、sandbox、cron、plugins 等很多方面。

适合:

  • 多 Agent 编排
  • 本地网关、任务自动化
  • 想把 Agent 接入更多系统

不适合:

  • 只想要一个简单的“帮我改代码”工具
  • 不想维护本地服务或配置

工具增强生态

主力 Coding Agent 解决“谁来干活”,增强生态解决“怎么把活干得稳定”。

工具解决的问题典型命令
gstack给开发过程加上产品、工程、评审、QA、发布角色/office-hours/review/qa/ship
Superpowers把可复用工作流封装成 Skillusing-superpowerssystematic-debugging
OpenSpec先写规格和变更提案,再编码openspec init/opsx:new
everything-claude-codeClaude Code 的 agents、commands、skills、hooks 集合/plugin install
oh-my-claudecodeClaude Code 插件化增强包/plugin marketplace add/plugin install

安装前准备

大多数 Coding Agent 都依赖下面这些基础环境:

环境作用检查命令
Node.js安装 npm 分发的 CLI 工具node --version
npm全局安装 CLI 包npm --version
Git读取仓库状态、生成 diff、管理分支git --version
终端运行交互式 AgentmacOS Terminal、iTerm2、Windows Terminal
账号/API Key认证模型服务按各工具文档配置

安装前建议先确认项目本身能正常运行:

bash
npm install
npm run build
npm test

如果项目没有测试或构建命令,Agent 仍然能写代码,但它很难证明自己写得对。

常见命令形态

不同工具命令不完全一样,但通常可以分成几类:

类型例子作用
启动交互claudecodexgemini进入终端对话界面
一次性提问claude -p "解释这个函数"gemini -p "总结 README"适合脚本和快速查询
恢复会话claude -cgemini -r "latest"继续之前上下文
指定模型claude --model sonnetgemini -m gemini-2.5-flash控制成本、速度和能力
加载目录claude --add-dir ../libgemini --include-directories ../docs让 Agent 读取更多路径
输出 JSON--output-format json接入脚本和自动化
管理 MCPclaude mcpgemini mcp接入外部工具服务器
插件/扩展claude plugingemini extensions加载命令、技能和插件

推荐学习路线

第一步:先选一个主力 Agent

如果你不知道怎么选,优先选 Claude Code 或 Codex CLI。不要同时开三个 Agent 改同一个仓库,否则很容易产生冲突。

学习目标:

  • 会启动交互式会话
  • 会让它解释项目结构
  • 会让它修改一个小 bug
  • 会让它运行测试验证
  • 会查看 git diff

第二步:学会权限控制

Agent 能执行命令是优势,也是风险。你需要养成三个习惯:

  1. 先让 Agent 解释计划,再允许修改。
  2. 文件修改后立刻看 diff。
  3. 危险命令必须人工确认,比如删除文件、重置 Git、修改系统配置。

第三步:建立项目约定

在项目根目录维护说明文件,例如:

  • AGENTS.md
  • CLAUDE.md
  • GEMINI.md
  • .codex/ 配置

这些文件可以告诉 Agent:

  • 项目怎么启动
  • 测试命令是什么
  • 代码风格是什么
  • 哪些目录不能改
  • 提交前要做哪些检查

第四步:引入工作流增强

当你已经能稳定使用主力 Agent 后,再考虑引入 gstack、Superpowers 或 OpenSpec。

推荐顺序:

  1. gstack:先把评审、QA、发布流程补起来。
  2. Superpowers:把常用排错和写作流程沉淀成技能。
  3. OpenSpec:对复杂需求使用规格驱动开发。

安全建议

风险建议
Agent 删除文件保持 Git 工作区可追踪,修改前看计划
Agent 执行危险命令不要开启无脑跳过权限的模式
凭证泄露不要把 API Key、Cookie、生产密码贴进对话
依赖投毒安装 CLI 时只使用官方包名和官方仓库
多 Agent 冲突同一时间只让一个 Agent 写同一组文件
自动化过度发布、数据库变更、生产操作保留人工审批

如何读本专栏

建议按这个顺序阅读:

  1. Claude Code 深度指南
  2. Codex 深度指南
  3. Gemini CLI 深度指南
  4. OpenClaw 深度指南
  5. gstack 深度指南
  6. Superpowers 深度指南
  7. OpenSpec 深度指南
  8. everything-claude-code 深度指南
  9. oh-my-claudecode 深度指南

前四篇解决“工具怎么装、命令怎么用”。后五篇解决“怎么把 Agent 用成稳定工程流程”。

总结

Coding Agent 的价值不是替代程序员,而是把重复、机械、上下文密集的开发工作交给机器先跑一轮。你真正要掌握的是三件事:

  1. 选择适合自己的主力工具。
  2. 学会用命令控制它的上下文、权限和输出。
  3. 用工程流程约束它,而不是把生产风险交给它。

当你能让 Agent 按计划工作、按测试验证、按 review 修正时,它才会从“聊天机器人”变成真正的开发搭档。

用心记录代码与生活