Skip to content

Gemini CLI 深度指南

Gemini CLI 是 Google 推出的开源终端 AI 工具,核心特点是“直接在命令行里使用 Gemini”。它支持交互式会话、非交互调用、会话恢复、扩展管理和 MCP 相关能力,适合把 AI 助手嵌入日常开发流程。

如果你已经习惯在终端里做大部分开发工作,Gemini CLI 上手会很自然。

官方地址

类型地址
官方站点https://geminicli.com/
官方 GitHubhttps://github.com/google-gemini/gemini-cli
CLI 文档https://github.com/google-gemini/gemini-cli/blob/main/docs/cli/cli-reference.md

适用场景

Gemini CLI 适合这些常见用途:

  • 读取代码库并快速总结结构
  • 在终端中直接问问题、生成内容或解释代码
  • 批量处理文本、日志、文档
  • 通过脚本方式调用模型完成自动化任务
  • 结合扩展或 MCP 服务器做更复杂的集成

它的设计非常偏“终端优先”,所以特别适合已经把 shell 当主工作台的人。

安装准备

官方文档给出的基础准备包括:

  • Node.js 环境
  • 可用的 Google 账号或对应的认证方式
  • 网络连接
  • 需要时再补充 Google Cloud 项目配置

从安装难度来说,Gemini CLI 相对简单,初学者最容易踩的坑通常不是命令本身,而是认证和账号配置。

安装方式

方式一:npm 全局安装

这是官方 README 和入门文档最常见的安装方式:

bash
npm install -g @google/gemini-cli
gemini

方式二:npx 直接运行

如果你只是想先体验一下,不想立刻全局安装,可以直接运行:

bash
npx @google/gemini-cli

方式三:Homebrew、MacPorts 或 Conda

官方 README 还列出了 Homebrew、MacPorts、Conda 等方式,适合不同平台和环境约束。对于初学者,优先建议 npm 方式,路径和行为更清晰。

首次登录 / 认证

Gemini CLI 的认证通常从首次启动开始。

启动后,选择:

bash
gemini

然后按提示选择 Sign in with Google。官方文档说明:

  • 一般用户可以直接用 Google 账号登录
  • 某些账号类型可能需要配置 Google Cloud 项目
  • 企业或受控环境下,认证方式可能和个人账号不完全一样

对于第一次使用的人,建议先把默认 Google 登录流程跑通,再考虑改模型、改配置或接扩展。

常用命令大全

命令作用示例注意事项
gemini启动交互式 REPLgemini默认从当前目录开始
gemini "query"带初始提示进入交互模式gemini "explain this project"适合先问一个大问题
gemini -p "query"非交互模式gemini -p "summarize README.md"适合脚本和一次性任务
cat file | gemini处理管道输入cat logs.txt | gemini适合日志和文本分析
gemini -i "query"执行后继续交互gemini -i "What is the purpose of this project?"适合连续追问
gemini -r "latest"恢复最近会话gemini -r "latest"便于继续上次任务
gemini -r "latest" "query"恢复最近会话并追加问题gemini -r "latest" "Check for type errors"适合多轮推进
gemini -r "<session-id>" "query"按会话 ID 恢复gemini -r "abc123" "Finish this PR"适合定向恢复
gemini update更新 CLIgemini update建议定期升级
gemini extensions管理扩展gemini extensions用于安装和维护扩展
gemini mcp管理 MCP 服务器gemini mcp做工具集成时会用到
gemini -m <model>指定模型gemini -m gemini-2.5-flash模型名以官方支持为准
gemini --include-directories额外包含目录gemini --include-directories ../lib,../docs适合跨目录分析
gemini --output-format json输出 JSONgemini -p "..." --output-format json适合程序化处理
gemini --output-format stream-json流式 JSON 输出gemini -p "..." --output-format stream-json适合长任务监控

常用工作流

1. 先交互,后批处理

初学者最容易理解的流程是:先运行 gemini 进入交互模式,确认它能看懂你的项目,再把稳定的步骤改写成 -p 命令。

2. 用模型选择控制速度和质量

官方 README 把 flashflash-liteproauto 这些选择都整理出来了。一般来说,简单任务先用更快的模型,复杂推理再切换到更强的模型。

3. 用输出格式对接脚本

如果你要把 Gemini CLI 接进脚本或自动化流程,优先考虑 --output-format jsonstream-json。这样更容易稳定解析结果。

4. 用扩展和 MCP 拓展能力

Gemini CLI 不只是一个问答壳,它还支持扩展和 MCP 服务器。对于需要接入外部工具链的场景,这一层会很有价值。

权限与安全建议

Gemini CLI 既能读文件,也能执行动作,所以要注意控制边界。

  • 不要把敏感信息直接写进提示词
  • 处理本地仓库时,确认当前目录是否正确
  • 在脚本模式下,优先输出结构化结果,减少误判
  • 企业账号和个人账号的认证与权限可能不同,首次配置时要先确认
  • 对扩展和 MCP 服务器来源保持审慎

如果你在团队环境中使用,建议先约定哪些操作可以自动跑,哪些必须人工确认。

排错

1. gemini 启动后无法登录

检查 Google 账号状态,确认是否需要 Google Cloud 项目配置。企业账号或特殊账号类型通常更容易遇到这个问题。

2. 命令执行后没有输出

先确认你使用的是交互模式还是 -p 非交互模式。很多时候只是模式选错了。

3. 结果不好解析

改用 --output-format json,不要直接依赖自然语言输出做自动处理。

4. 扩展或 MCP 不生效

先确认相关命令是否已安装、配置文件是否正确,然后再看当前版本文档里的约束。

总结

Gemini CLI 的优点很明确:安装方式多、命令风格简单、模型选择清晰,而且很适合终端党。对新手来说,最值得先掌握的是 geminigemini -p、会话恢复和认证这几个核心动作。

先跑通基础流程,再去碰扩展、MCP 和结构化输出,会比较稳。

参考来源

用心记录代码与生活