ITIMO创新库

2026实测AI大模型API,教你白嫖顶级模型!

AI资源评分 4.92068 阅读

2026年6月4日,本人亲自实测,某些平台的免费模型会随时间变化,以实际为准


1️⃣ DmxAPI (用的人过多,适合使用里面的小参数轻量模型,大参数一般会失败)

网址https://www.dmxapi.cn

接口格式: OpenAI兼容

注册门槛: 邮箱注册即可

实测免费模型(15+款免费,动态变化)

  • glm-5-free(容易失败)

  • Qwen3.5-2B-free(小参数容易成功,每分钟5次限制)

限制: 免费版有RPM限制(约5RPM),高峰期可能429限流,充值1元激活20+免费模型,无token限制

特点: 有几款参数多的模型,其他都是小参数模型、并且有时候会限制访问


2️⃣ 硅基流动 SiliconFlow

网址https://cloud.siliconflow.cn

接口格式: OpenAI兼容

注册门槛: 手机号注册,需要实名认证才能使用

实测免费模型:免费的比较少,平台上的9B及以下参数的小型模型(如 GLM-4-9B-Chat 等)部分免费,可以通过搜索小模型查看是否免费,其他的都收费

限制: 无限制

特点: 国产开源模型最齐全,实名认证有16元认证奖励券


3️⃣ OpenRouter(推荐使用

网址https://openrouter.ai

接口格式: OpenAI兼容

注册门槛: GitHub/Google账户登录,国内需要魔法

免费模型(20+款,标注:free即可免,左上角搜索输入free

  • Nous: Hermes 3 405B Instruct (free)

  • Google: Gemma 4 31B (free)

  • MoonshotAI: Kimi K2.6 (free)

  • Z.ai: GLM 4.5 Air (free)

限制: 未充值用户50次/天;充值$10后1000次/天,速度不快,充值的费用一年后会清零

特点: 全球最全路由平台,登录用魔法,使用API不用,国内可直连,也是全球前几大API中转服务商


4️⃣ 智谱AI BigModel

网址https://www.bigmodel.cn

接口格式: OpenAI兼容

注册门槛: 手机号注册

实测免费模型:以下几款是免费的

glm-4.7-flash、GLM-Z1-Flash、GLM-4-Flash-250414、GLM-4.1V-Thinking-Flash(视觉理解)

限制:免费但所有模型都有并发限制

特点: 低峰期稳定,高峰期会报繁忙


5️⃣ ModelScope 魔搭(推荐使用

网址https://modelscope.cn

接口格式: OpenAI兼容

注册门槛: 阿里账户

实测免费模型:40+

  • DeepSeek-V4

  • Qwen3-235B-A22B

  • GLM-5.1

限制: 所有模型共享每天2000次免费调用,单模型限制每天约500次,可轮询

特点: 阿里达摩院旗下,多模态支持最好,国内最慷概的平台,文字图片都有免费


6️⃣ NVIDIA NIM

网址https://build.nvidia.com

接口格式: OpenAI兼容

注册门槛: NVIDIA账户,注册的时候填写中国手机号可能会失败,要多试几次

免费模型:80+

  • meta/llama-4-maverick

  • nvidia/nemotron-3-super-120b

  • google/gemma-3-27b-it

限制: 实测RPM约1-5,小模型响应快,大参数模型响应速度慢或者直接不能用,但生图模型速度较快

特点: GPU推理速度快,适合对延迟要求高的场景


7️⃣ GitHub Models(推荐使用

网址https://github.com/marketplace/models

接口格式: OpenAI兼容

注册门槛: GitHub账户即可,国内需要魔法

免费模型

Llama 4 Scout 17B 16E Instruct

DeepSeek-V3-0324

限制: 15 RPM / 150 RPD

特点: 开发者最友好,GitHub账户即用无需信用卡,虽然免费模型少,但是速度还是可以的


8️⃣ 七牛云

网址https://s.qiniu.com

接口格式: OpenAI兼容

实测免费模型

  • GLM 4.5 Air (free)

限制: 新用户300万Token免费资源包,当前时间只有一款免费,

特点: ☁️ 云存储+AI一体化,速度一般(可能调用人数多)


9️⃣ AIHubMix

网址https://aihubmix.com

接口格式: OpenAI兼容

注册门槛: GitHub账户/谷歌账号登录,国内需要魔法

实测免费模型:20+

gpt-5.5-free

gemini-3-flash-preview-free

  • xiaomi-mimo-v2-pro-free

  • coding-minimax-m2.7-free

限制: RPM约5,各模型日均提供100万token,目前是需要先充1美金才能用到100万token,没有充值的话只能调用10次一天,充值后可以在限额无次数调用

特点: 免费的模型非常多,测试时,速度都还挺快的


1️⃣0️⃣ ZenMUX(稳定,但免费模型有限)(推荐使用

网址https://zenmux.ai

接口格式: OpenAI兼容

注册门槛: GitHub账户/谷歌账号登录,国内需要魔法

实测免费模型

  • z-ai/glm-4.7-flash-free

  • z-ai/glm-4.6v-flash-free

⚠️ 重要提醒:免费模型看服务器流量情况,速度还行就是容易繁忙

特点: ⚡ 模型数量少,但稳定可用


1️⃣1️⃣ OpenCode(开源 AI 编程代理数据用于训练模型)(推荐使用

网址https://opencode.ai

注册门槛:开源,直接下载APP,内置了模型,只能用于该APP的代码编程

接口格式: OpenAI兼容

免费模型: 支持免费代码模型

  • minimax-m2.5-free

  • hy3-preview-free

特点: 只能用于编程场景,数据会被用于模型训练


1️⃣2️⃣ Mistral AI(每月大量免费试用token,但是数据会用于测试模型)(推荐使用

网址https://admin.mistral.ai

API 基址https://api.mistral.ai/v1(很多人在网站中找不到基址)

接口格式: OpenAI兼容

注册门槛: 谷歌账号登录,国内需要魔法

  • 模型: 基本为自研模型/开源模型:ministral-14b-2512、codestral-2508、mistral-large-2512等

  • 限制:API 免费额度: 注册即送免费 API 额度(约25美元/月),支持 Mistral Large 等最新模型

特点: 法国顶级 AI 公司,Le Chat 对话体验优秀,API 免费额度慷慨,速度最快,开源模型社区活跃。部分地区进不了,随缘系列


1️⃣3️⃣ Cloudflare(全球网络 & Workers AI,开发人员接入,普通玩家不建议)(推荐使用

网址https://www.cloudflare-cn.com/personal/

接口格式: REST API(OpenAI 兼容需通过 AI Gateway)

注册门槛: 谷歌账号登录,国内需要魔法

免费资源:不仅免费模型,还有其他很多免费服务

  • 个人网站免费计划: CDN全球加速、免费SSL证书、安全DNS、WAF防护、DDOS防范、机器人防护等基础安全与性能服务全部免费

  • Workers AI: 提供 50+ 开源模型(文本生成、图像分类、对象检测等),免费计划有额度限制,按量付费(serverless GPU)

  • AI Gateway: 观察和控制 AI 应用,支持缓存、速率限制、请求重试、模型回退

主要 AI 模型

  • @cf/meta/llama-3.1-8b-instruct — Meta 开源大模型

  • @cf/meta/llama-3-8b-instruct — Llama 3 轻量版

  • @cf/deepseek-ai/deepseek-7b — DeepSeek 开源模型

  • @cf/qwen/qwen2.5-7b-instruct — 通义千问

  • @cf/workers/ai-text-embeddings — 文本嵌入模型

特点: 🌐 全球顶尖 CDN + 安全基础设施服务商,Workers AI 提供 serverless GPU 推理,50+ 开源模型可选,免费额度慷慨,适合需要全球加速 + AI 能力的场景,速度快,但要接入挺麻烦的

使用建议

自用场景:免费模型基本上足够支撑零花费进行使用。

高频高并发场景
 - 高频高并发使用各个官方收费的会稳定