基于 Gemini 2.5 Pro 的免费命令行工具,100万 Token 上下文 + 多模态处理能力

Gemini 命令行界面 (CLI) 是一款开源 AI 智能体,可让您直接在终端中访问 Gemini。Gemini CLI 使用“推理和行动”(ReAct) 循环,结合内置工具和本地或远程 MCP 服务器,完成复杂的用例,例如修复 bug、创建新功能和提高测试覆盖率。虽然 Gemini CLI 在编码方面表现出色,但它也是一款多功能的本地实用程序,可用于执行各种任务,从内容生成和问题解决到深入研究和任务管理。

▲ 在 PowerShell 中直接用自然语言操作文件/生成代码


一、为什么选择 Gemini CLI?

🔥 核心优势

特性传统 CLIGemini CLI
学习成本需记忆命令语法自然语言交互(如:“分析项目架构”)
文件处理依赖 grep/find 组合直接解析代码/图片/PDF(gemini doc report.pdf)
自动化深度需编写复杂脚本内置工具链(Git/Shell/文件操作沙箱)
资源消耗本地 CPU/内存占用云端计算(每日 1000 次免费请求)

二、Windows 安装全流程(10分钟搞定)

步骤 1:安装前置依赖

  1. 下载 Node.js 18+ LTS → 安装时务必勾选 Add to PATH
  2. 验证安装:
node -v  # 输出 v18.x+  
npm -v   # 输出 10.x+

步骤 2:解决网络瓶颈(关键!)

由于访问 Google 服务需代理:

# 临时生效(当前会话)
$env:HTTP_PROXY = "http://127.0.0.1:7890"  # 替换为你的代理端口

# 永久生效(推荐)
[环境变量] → 新建用户变量:  
- 变量名:`HTTPS_PROXY` → 值:`http://127.0.0.1:7890`

步骤 3:安装与认证

# 安装 CLI
npm install -g @google/gemini-cli

# 登录认证(二选一)
gemini auth --login     # 浏览器授权(享受免费额度)
gemini init --api-key=YOUR_KEY  # 使用 API 密钥
⚠️ 避坑提示:若安装报错,请以管理员身份运行 PowerShell

三、常用命令速查表

命令功能示例
gemini query自然语言问答gemini query "用 PowerShell 批量重命名图片"
gemini draft生成代码草稿gemini draft "Python 实现 AES 加密"
gemini analyze项目分析gemini analyze security --dir=./src(检测漏洞)
gemini doc文档生成gemini doc invoice.pdf --output=summary.md
gemini config查看配置gemini config --view

🔍 进阶查询技巧

# 1. 交互模式(多轮对话)
gemini
> 如何优化这个函数? (粘贴代码)
> 加上错误处理逻辑

# 2. 文件直接分析
gemini doc "C:\Project\app.js" --task="添加 JSDoc 注释"

四、深度集成:连接 MCP 扩展工作流

什么是 MCP?

Model Context Protocol:标准化大模型调用外部工具的协议(如论文检索/支付接口),实现:

  • 避免重复开发:将 Dify 工作流转化为 MCP 服务
  • 工具复用:团队共享自定义工具链

添加 MCP 服务器(实战演示)

场景:集成 arXiv 论文检索服务

# 1. 创建 MCP 配置文件 (mcp.json)
{
  "mcpServers": {
    "arxiv": {
      "type": "sse",
      "url": "https://arxiv-mcp.example.com/sse",
      "headers": {"Authorization": "Bearer YOUR_KEY"}
    }
  }
}

# 2. 连接服务器
gemini mcp connect --config=mcp.json

# 3. 调用工具
gemini query "用 arxiv 工具搜索 2024 年 LLM 推理优化论文"

→ 自动返回论文标题/摘要/PDF 链接

常用 MCP 服务推荐

服务名功能
arxiv-mcp学术论文检索
github-analyzer仓库代码质量评估
file-converter跨格式文档转换(Word/PDF/Markdown)

五、Windows 专属效率技巧

1. 与 PowerShell 深度整合

# 定时清理下载文件夹
$task = "识别 C:\Downloads 中超过 30 天的文件并删除"
gemini --non-interactive $task | Invoke-Expression

2. 任务计划程序自动化

  1. 用 Gemini 生成脚本:
    gemini draft "每周一备份 D:\Docs 到 OneDrive 的 PowerShell 脚本" > backup.ps1
  2. 任务计划程序 中设置每周执行

3. 安全沙箱机制

  • 文件操作默认在虚拟环境执行
  • 需用户确认才会写入真实路径:
[确认] 是否允许将修改写入 src/app.py? (Y/n)

六、故障排除手册

问题解决方案
gemini: command not found重装 Node.js 并勾选 Add to PATH
响应超时/ETIMEDOUT检查代理是否生效 → 重启终端
403 Permission Denied开启 Google Cloud Gemini API
MCP 工具无响应检查 URL 是否以 /sse 结尾 → 更新 .env 中的 EXPOSE\_PLUGIN\_DEBUGGING\_HOST

结语:终端智能化的未来

通过 Gemini CLI,Windows 开发者可:
节省 50% CLI 学习时间 → 自然语言代替复杂命令
提升复杂任务效率

  • 代码迁移:gemini query "将 Vue 2 项目升级到 Vue 3"
  • 日志分析:gemini doc error.log --task="归纳常见错误类型"
    构建自定义 AI 工作流:通过 MCP 集成企业内网工具

立即行动

npm install -g @google/gemini-cli
gemini query "为我的 Windows 环境推荐个性化优化方案"
资源扩展

让终端理解你的思考,而非记忆命令的语法 —— 这正是 AI 命令行革命的核心价值。