统一模型 API

一个平台，
调用多家主流模型。

通过 TokenFleet 聚合 DeepSeek、Moonshot、MiniMax、智谱等 12 个生产级 LLM 模型。一个 API key，一份发票，国内直连。

12 个生产级模型
统一 API 网关
国内直连


          # 同样的请求体，换 base_url 即接入
curl https://tokenfleet.cn/v1/chat/completions \
  -H "Authorization: Bearer $TOKENFLEET_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v4-pro",
    "messages": [{"role": "user", "content": "用一句话解释 RAG。"}]
  }'


          from openai import OpenAI

client = OpenAI(
    base_url="https://tokenfleet.cn/v1",
    api_key=os.environ["TOKENFLEET_API_KEY"],
)

resp = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role": "user", "content": "用一句话解释 RAG。"}],
)
print(resp.choices[0].message.content)


          import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://tokenfleet.cn/v1",
  apiKey: process.env.TOKENFLEET_API_KEY,
});

const resp = await client.chat.completions.create({
  model: "deepseek-v4-pro",
  messages: [{ role: "user", content: "用一句话解释 RAG。" }],
});
console.log(resp.choices[0].message.content);

已接入的主流模型

模型目录

12 个生产级模型，
一份计费。

全部走同一个 OpenAI 兼容 endpoint 与同一个对公账户。

查看全部模型

DeepSeek LLM

deepseek-v4-pro

DeepSeek 新一代旗舰推理模型

$1.71 / $3.43 per 1M
DeepSeek LLM

DeepSeek-V3.2

高性价比推理与工具调用

$0.286 / $0.429 per 1M
Moonshot LLM

kimi-k2.5

原生视觉智能体引擎

$0.571 / $3 per 1M
Moonshot LLM

kimi-k2.6

国产长文本与办公场景

$0.929 / $3.86 per 1M
MiniMax LLM

MiniMax-M2.7

高效编程与自我迭代

$0.3 / $1.2 per 1M
智谱 LLM

glm-5.1

智谱新一代语言模型

$0.857 / $3.43 per 1M

产品 01

统一 API 网关

生产级模型聚合在同一个 API 网关下。一个 API key，今天接入多家模型。

统一 endpoint 与 API key
同账户、同对账、同发票
国内直连，低延迟

查看支持的模型

12 个生产级模型，一个 endpoint

覆盖 LLM、图像、视频、音频，通过统一 API 网关完成调用、计量与对账。

deepseek-v4-pro DeepSeek
deepseek-v4-flash DeepSeek
DeepSeek-V3.2 DeepSeek
DeepSeek-V3.2-A DeepSeek
deepseek-v3.1 DeepSeek
deepseek-v3.2-exp DeepSeek
kimi-k2.6 Moonshot
kimi-k2.5 Moonshot
MiniMax-M2.7 MiniMax
MiniMax-M2.5 MiniMax
glm-5.1 智谱
deepseek-v3 DeepSeek

+0 更多生产级模型

私有部署 / VPC 直连

用量到达一定规模可申请 VPC 直连 endpoint，请求不离开你的私网边界。

peering: cn-shanghai-2 · cn-beijing-1
encryption: TLS 1.3 + mTLS
egress: 不出私网

统一 endpoint 接入

同一个 API key 调用多家模型，接入路径与用量记录保持一致。

− base_url="https://api.openai.com/v1"
+ base_url="https://tokenfleet.cn/v1"

每月 token 用量、错误率、模型分布 → 控制台一站可见。

国内直连，毫秒级延迟

五大城市平均首字延迟（P50），按真实生产请求样本。

城市	P50	0 800ms
北京	142 ms
上海	128 ms
广州	156 ms
深圳	149 ms
杭州	134 ms
海外直连	≥ 800ms

数据样本 2026-04 · 查看 status

面向生产规模

服务大规模生产用量。

当 token 用量越过自服务的边界，我们与你的工程团队直接对接：单点接入、容量规划、独立路由、定制条款。

SLA
企业级 SLA

按用量等级与团队规模定制承诺，月度可对账。
VPC
私有部署 / VPC 直连

请求不出私网边界。具体形态按规模商谈。
SUPPORT
专属技术对接

7×24 中文工程支持渠道，故障一线响应。

通常 24 小时内回复 · zhangyue@nyuncloud.com

一个平台，
调用多家主流模型。

12 个生产级模型，
一份计费。

一条 endpoint，接入所有模型。

统一 API 网关

为什么选 TokenFleet。

12 个生产级模型，一个 endpoint

私有部署 / VPC 直连

统一 endpoint 接入

国内直连，毫秒级延迟

服务大规模生产用量。

企业级 SLA

私有部署 / VPC 直连

专属技术对接

联系 TokenFleet 销售

联系 TokenFleet 销售

一个平台， 调用多家主流模型。

12 个生产级模型， 一份计费。

一条 endpoint，接入所有模型。

统一 API 网关

为什么选 TokenFleet。

服务大规模生产用量。

企业级 SLA

私有部署 / VPC 直连

专属技术对接

一个平台，
调用多家主流模型。

12 个生产级模型，
一份计费。