整理目前可用于开发测试的免费/可白嫖 AI 推理 API 方案。
1️⃣ Qwen 免费 API + ModelScope + 轮询方案
🔹 qwen-free-api
https://github.com/LLM-Red-Team/qwen-free-api
- 可直接调用 Qwen 相关接口
- 适合做中转 API
- 可多账号部署
🔹 ModelScope 官方推理 API
https://www.modelscope.cn/docs/model-service/API-Inference/intro
- 需要绑定阿里云账号
- 有免费额度
- 适合正式项目调试使用
🔹 推荐轮询工具
https://github.com/tbphp/gpt-load
- 多 Key 轮询
- 多平台混合
- 提高稳定性
- 阿里云百炼也可以接入
/gpt-load轮询
2️⃣ GitHub Models 推理 API
https://github.com/marketplace?type=models
GitHub 官方提供模型推理能力:
- 支持 GPT-4.1 等模型
- 通过 GitHub 账号调用
- 适合开发测试
- 额度有限制
优点:
- 官方渠道
- OpenAI 兼容接口
- 集成方便
3️⃣ OpenRouter 免费模型路由
https://openrouter.ai/openrouter/free/providers
特点:
- 自动路由到随机免费模型
- OpenAI 兼容格式
- 不需要自己维护多个模型
- 支持 Qwen / Llama / Mistral 等
适合作为:
- 兜底接口
- 备用模型池
- 开发测试
4️⃣ Qwen / iFlow 转 API + 聚合
🔹 Qwen2API
https://github.com/Rfym21/Qwen2API
- 把 qwen.ai 转换成 API
- 支持多账户
- 可做 Key 池
🔹 iflow2api
https://github.com/cacaview/iflow2api
- 把 iflowcli 转换成 API
- 支持自动调用
🔹 推荐聚合方案
https://github.com/justlovemaki/AIClient-2-API
- 支持多模型统一聚合
- 可统一成 OpenAI 接口格式
- 配置稍微复杂
- 适合做综合 API 网关
5️⃣ Gemini 2.5 Pro 免费 API
https://github.com/su-kaka/gcli2api
- 免费使用 Gemini-2.5-Pro
- 通过 gcli 转 API
- 适合做高质量输出
6️⃣ NVIDIA 免费推理 API
https://build.nvidia.com/models
- 英伟达官方模型推理平台
- 可使用 GLM5 等模型
- 提供免费调用额度
- 适合测试和研究使用
7️⃣ MiniMax 免费 OAuth 调用
参考项目:
https://github.com/openclaw/openclaw/tree/main/extensions/minimax-portal-auth
支持 MiniMax 免费 OAuth 调用。
可以使用自写脚本 minimax-oauth.js 获取 access_key。
📥 下载 minimax-oauth.js
API 示例:
1 | { |
特点:
- 不需要固定 API Key
- 使用 OAuth 获取 access_key
- 可做自动刷新
🔄 推荐组合策略
高可用白嫖方案示例:
1 | OpenRouter Free |
配合 gpt-load 做轮询,实现:
- 多模型负载均衡
- 自动故障切换
- 提高可用性
📌 总结
| 类型 | 推荐指数 | 难度 | 适用场景 |
|---|---|---|---|
| OpenRouter | ⭐⭐⭐⭐ | 简单 | 快速接入 |
| qwen-free-api | ⭐⭐⭐⭐ | 中等 | 稳定自建 |
| GitHub Models | ⭐⭐⭐ | 简单 | 开发测试 |
| Gemini gcli2api | ⭐⭐⭐⭐ | 中等 | 高质量输出 |
| MiniMax OAuth | ⭐⭐⭐⭐ | 中等 | 自动刷新 Key |
| NVIDIA Build | ⭐⭐⭐ | 简单 | 研究测试 |
适合做:
- 聊天机器人
- 自动化脚本
- 插件开发
- 聚合 API 网关
- 低成本生产测试环境