2026年6月4日,本人亲自实测,某些平台的免费模型会随时间变化,以实际为准
1️⃣ DmxAPI (用的人过多,适合使用里面的小参数轻量模型,大参数一般会失败)
接口格式: OpenAI兼容
注册门槛: 邮箱注册即可
实测免费模型(15+款免费,动态变化):
glm-5-free(容易失败)
Qwen3.5-2B-free(小参数容易成功,每分钟5次限制)
限制: 免费版有RPM限制(约5RPM),高峰期可能429限流,充值1元激活20+免费模型,无token限制
特点: 有几款参数多的模型,其他都是小参数模型、并且有时候会限制访问
2️⃣ 硅基流动 SiliconFlow
网址: https://cloud.siliconflow.cn
接口格式: OpenAI兼容
注册门槛: 手机号注册,需要实名认证才能使用
实测免费模型:免费的比较少,平台上的9B及以下参数的小型模型(如 GLM-4-9B-Chat 等)部分免费,可以通过搜索小模型查看是否免费,其他的都收费
限制: 无限制
特点: 国产开源模型最齐全,实名认证有16元认证奖励券
3️⃣ OpenRouter(推荐使用)
接口格式: OpenAI兼容
注册门槛: GitHub/Google账户登录,国内需要魔法
免费模型(20+款,标注:free即可免,左上角搜索输入free):
Nous: Hermes 3 405B Instruct (free)
Google: Gemma 4 31B (free)
MoonshotAI: Kimi K2.6 (free)
Z.ai: GLM 4.5 Air (free)
限制: 未充值用户50次/天;充值$10后1000次/天,速度不快,充值的费用一年后会清零
特点: 全球最全路由平台,登录用魔法,使用API不用,国内可直连,也是全球前几大API中转服务商
4️⃣ 智谱AI BigModel
接口格式: OpenAI兼容
注册门槛: 手机号注册
实测免费模型:以下几款是免费的
glm-4.7-flash、GLM-Z1-Flash、GLM-4-Flash-250414、GLM-4.1V-Thinking-Flash(视觉理解)
限制:免费但所有模型都有并发限制
特点: 低峰期稳定,高峰期会报繁忙
5️⃣ ModelScope 魔搭(推荐使用)
接口格式: OpenAI兼容
注册门槛: 阿里账户
实测免费模型:40+
DeepSeek-V4
Qwen3-235B-A22B
GLM-5.1
限制: 所有模型共享每天2000次免费调用,单模型限制每天约500次,可轮询
特点: 阿里达摩院旗下,多模态支持最好,国内最慷概的平台,文字图片都有免费
6️⃣ NVIDIA NIM
接口格式: OpenAI兼容
注册门槛: NVIDIA账户,注册的时候填写中国手机号可能会失败,要多试几次
免费模型:80+
meta/llama-4-maverick
nvidia/nemotron-3-super-120b
google/gemma-3-27b-it
限制: 实测RPM约1-5,小模型响应快,大参数模型响应速度慢或者直接不能用,但生图模型速度较快
特点: GPU推理速度快,适合对延迟要求高的场景
7️⃣ GitHub Models(推荐使用)
网址: https://github.com/marketplace/models
接口格式: OpenAI兼容
注册门槛: GitHub账户即可,国内需要魔法
免费模型:
Llama 4 Scout 17B 16E Instruct
DeepSeek-V3-0324
限制: 15 RPM / 150 RPD
特点: 开发者最友好,GitHub账户即用无需信用卡,虽然免费模型少,但是速度还是可以的
8️⃣ 七牛云
接口格式: OpenAI兼容
实测免费模型:
GLM 4.5 Air (free)
限制: 新用户300万Token免费资源包,当前时间只有一款免费,
特点: ☁️ 云存储+AI一体化,速度一般(可能调用人数多)
9️⃣ AIHubMix
接口格式: OpenAI兼容
注册门槛: GitHub账户/谷歌账号登录,国内需要魔法
实测免费模型:20+
gpt-5.5-free
gemini-3-flash-preview-free
xiaomi-mimo-v2-pro-free
coding-minimax-m2.7-free
限制: RPM约5,各模型日均提供100万token,目前是需要先充1美金才能用到100万token,没有充值的话只能调用10次一天,充值后可以在限额无次数调用
特点: 免费的模型非常多,测试时,速度都还挺快的
1️⃣0️⃣ ZenMUX(稳定,但免费模型有限)(推荐使用)
接口格式: OpenAI兼容
注册门槛: GitHub账户/谷歌账号登录,国内需要魔法
实测免费模型:
z-ai/glm-4.7-flash-free
z-ai/glm-4.6v-flash-free
⚠️ 重要提醒:免费模型看服务器流量情况,速度还行就是容易繁忙
特点: ⚡ 模型数量少,但稳定可用
1️⃣1️⃣ OpenCode(开源 AI 编程代理数据用于训练模型)(推荐使用)
注册门槛:开源,直接下载APP,内置了模型,只能用于该APP的代码编程
接口格式: OpenAI兼容
免费模型: 支持免费代码模型
minimax-m2.5-free
hy3-preview-free
特点: 只能用于编程场景,数据会被用于模型训练
1️⃣2️⃣ Mistral AI(每月大量免费试用token,但是数据会用于测试模型)(推荐使用)
API 基址: https://api.mistral.ai/v1(很多人在网站中找不到基址)
接口格式: OpenAI兼容
注册门槛: 谷歌账号登录,国内需要魔法
模型: 基本为自研模型/开源模型:ministral-14b-2512、codestral-2508、mistral-large-2512等
限制:API 免费额度: 注册即送免费 API 额度(约25美元/月),支持 Mistral Large 等最新模型
特点: 法国顶级 AI 公司,Le Chat 对话体验优秀,API 免费额度慷慨,速度最快,开源模型社区活跃。部分地区进不了,随缘系列
1️⃣3️⃣ Cloudflare(全球网络 & Workers AI,开发人员接入,普通玩家不建议)(推荐使用)
网址: https://www.cloudflare-cn.com/personal/
接口格式: REST API(OpenAI 兼容需通过 AI Gateway)
注册门槛: 谷歌账号登录,国内需要魔法
免费资源:不仅免费模型,还有其他很多免费服务
个人网站免费计划: CDN全球加速、免费SSL证书、安全DNS、WAF防护、DDOS防范、机器人防护等基础安全与性能服务全部免费
Workers AI: 提供 50+ 开源模型(文本生成、图像分类、对象检测等),免费计划有额度限制,按量付费(serverless GPU)
AI Gateway: 观察和控制 AI 应用,支持缓存、速率限制、请求重试、模型回退
主要 AI 模型:
@cf/meta/llama-3.1-8b-instruct — Meta 开源大模型
@cf/meta/llama-3-8b-instruct — Llama 3 轻量版
@cf/deepseek-ai/deepseek-7b — DeepSeek 开源模型
@cf/qwen/qwen2.5-7b-instruct — 通义千问
@cf/workers/ai-text-embeddings — 文本嵌入模型
特点: 🌐 全球顶尖 CDN + 安全基础设施服务商,Workers AI 提供 serverless GPU 推理,50+ 开源模型可选,免费额度慷慨,适合需要全球加速 + AI 能力的场景,速度快,但要接入挺麻烦的
使用建议
自用场景:免费模型基本上足够支撑零花费进行使用。
高频高并发场景:
- 高频高并发使用各个官方收费的会稳定
