统一模型 API

一个平台
调用多家主流模型。

通过 TokenFleet 聚合 DeepSeek、Moonshot、MiniMax、智谱 等 12 个生产级 LLM 模型。一个 API key,一份发票,国内直连。

          # 同样的请求体,换 base_url 即接入
curl https://tokenfleet.cn/default/v1/chat/completions \
  -H "Authorization: Bearer $TOKENFLEET_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v4-pro",
    "messages": [{"role": "user", "content": "用一句话解释 RAG。"}]
  }'
        

已接入的主流模型

  • DeepSeek
  • Kimi · Moonshot
  • MiniMax
  • 智谱 GLM
TokenFleet 产品线

一条 endpoint,接入所有模型。

产品 01

统一 API 网关

生产级模型聚合在同一个 API 网关下。一个 API key,今天接入多家模型。

  • 统一 endpoint 与 API key
  • 同账户、同对账、同发票
  • 国内直连,低延迟
查看支持的模型
为什么选择 TokenFleet

为什么选 TokenFleet。

四件可被验证的事,不是四条形容词。

A

12 个生产级模型,一个 endpoint

覆盖 LLM、图像、视频、音频,通过统一 API 网关完成调用、计量与对账。

  • deepseek-v4-pro DeepSeek
  • deepseek-v4-flash DeepSeek
  • DeepSeek-V3.2 DeepSeek
  • DeepSeek-V3.2-A DeepSeek
  • deepseek-v3.1 DeepSeek
  • deepseek-v3.2-exp DeepSeek
  • kimi-k2.6 Moonshot
  • kimi-k2.5 Moonshot
  • MiniMax-M2.7 MiniMax
  • MiniMax-M2.5 MiniMax
  • glm-5.1 智谱
  • deepseek-v3 DeepSeek
+0 更多生产级模型
B

私有部署 / VPC 直连

用量到达一定规模可申请 VPC 直连 endpoint,请求不离开你的私网边界。

peering
cn-shanghai-2 · cn-beijing-1
encryption
TLS 1.3 + mTLS
egress
不出私网
C

统一 endpoint 接入

同一个 API key 调用多家模型,接入路径与用量记录保持一致。

 base_url="https://api.openai.com/v1"
+ base_url="https://tokenfleet.cn/default/v1"

每月 token 用量、错误率、模型分布 → 控制台一站可见。

D

国内直连,毫秒级延迟

五大城市平均首字延迟(P50),按真实生产请求样本。

城市 P50 0 800ms
北京 142 ms
上海 128 ms
广州 156 ms
深圳 149 ms
杭州 134 ms
海外直连 ≥ 800ms

数据样本 2026-04 · 查看 status

面向生产规模

服务大规模生产用量。

当 token 用量越过自服务的边界,我们与你的工程团队直接对接:单点接入、容量规划、独立路由、定制条款。

  1. SLA

    企业级 SLA

    按用量等级与团队规模定制承诺,月度可对账。

  2. VPC

    私有部署 / VPC 直连

    请求不出私网边界。具体形态按规模商谈。

  3. SUPPORT

    专属技术对接

    7×24 中文工程支持渠道,故障一线响应。

联系 TokenFleet 销售

TokenFleet 微信社群 QR 码

扫码加入微信社群,获取企业用量与接入支持。

通常 24 小时内回复 · zhangyue@nyuncloud.com