SECTION 00 / MANIFESTO

一个 endpoint,
所有模型。

DeepSeek / MiniMax / GLM 的 token 批发通道。 OpenAI 兼容协议,base_url 一行切换, 实付单价 = 官方零售 5 折起。

Python cURL Node.js
# 把 base_url 换成北凑,model 名字照抄官网
from openai import OpenAI

client = OpenAI(
    api_key="sk-bc-xxxxxxxxxxxxxxxx",  # 控制台拿
    base_url="https://token.beicou.com/v1",  # 唯一要改的一行
)

resp = client.chat.completions.create(
    model="deepseek-v4-flash",  # 或 MiniMax-M3 / glm-4-plus
    messages=[{"role": "user", "content": "你好"}],
)
print(resp.choices[0].message.content)
3国产大模型在线
50% 批发实付单价(vs 官方)
OpenAI协议兼容
¥10起充即用
SECTION 01 / MODELS & PRICING

3 个模型 · 5 折批发

价格对比官方 platform.deepseek.com / platform.MiniMax.io pay-as-you-go 实时零售价。 按 token 计费,0 阶梯 0 套娃。

模型 厂商 上下文 输入
¥ / 1M tokens
输出
¥ / 1M tokens
缓存读
¥ / 1M tokens
官方对比
deepseek-v4-flash
日常 / 高并发
DeepSeek 1M ¥0.50 ¥1.00 ¥0.01 ¥1.00 / ¥2.00
deepseek-v4-pro
推理 / 长文 / Agent
DeepSeek 1M ¥1.50 ¥3.00 ¥0.013 ¥3.00 / ¥6.00
MiniMax-M3
Frontier · 多模态 · 1M
MiniMax 1M ¥0.50 ¥2.00 ¥0.10 ¥2.10 / ¥8.40 首周 5 折
MiniMax-M3
输入 > 512k 长文
MiniMax 1M ¥2.00 ¥8.00 ¥0.40 ¥4.20 / ¥16.80 首周 5 折

计费规则:输入 + 输出 token 数 × 单价,0 阶梯 0 套娃,按实际调用结算。 官方价随厂商调整而调整,北凑批发价 = 官方实时零售价 × 0.5(首周 5 折除外,详见表格)。

SECTION 02 / QUICK START

3 分钟接入

从拿到 key 到第一次调通,正常 3 分钟。如果你已经在用 OpenAI 官方或其他中转,迁移只要改 1 行。

01

注册拿 key

控制台 token.beicou.com 邮箱注册,充 ¥10 起自动到账。

https://token.beicou.com
02

改 base_url

任何 OpenAI SDK:把 base_url 改成北凑的 endpoint,model 名照抄官网即可。

https://token.beicou.com/v1
03

照常用

Claude Code / Cursor / Aider / Cline / 自己的脚本——所有 OpenAI 兼容工具都直接接得上。

model = "deepseek-v4-flash"

已实测兼容

OpenAI Python SDK ≥ 1.0 openai-node LangChain LlamaIndex Cursor Claude Code via Anthropic 兼容 Aider Cline / Continue OpenCode
SECTION 03 / WHY CHEAPER

为什么便宜 5 折

一句话:开发者单独用付的是「零售价」,平台打包成大额企业 token 池后拿的是「批发价」。差价的 95% 返还给开发者,5% 留作平台运营。

01

批发价通道

平台聚合开发者调用量,统一从厂商拿企业级 token 配额,享受零售 5 折起的协议价。

02

0 套娃 0 阶梯

按真实 token 数计费,输入输出分开。不搞"套餐包 / 月卡 / 余额过期"——用多少扣多少。

03

明码标价

价格表 100% 公开,跟厂商实时同步。控制台可看每次调用的输入/输出 token 数和扣费明细。

SECTION 04 / BUDGET ESTIMATOR

余额能撑多久

输入你的月用量场景,直观看能跑多久——比"省多少"更直觉。

CNY
主要用于
能跑(输入 + 输出) ~ 100M 按输入:输出 = 3:1 估算
≈ 多少请求 ~ 50,000 按每次 2K tokens
官方零售同量需 ¥200.00 省 50%
SECTION 05 / FAQ

常见问题

支持哪些模型?后续会增加吗?

目前 deepseek-v4-flash / deepseek-v4-pro / MiniMax-M3 3 个模型在线。后续会增加 GLM-4-Plus / Kimi K2 / Qwen3-Max 等国产大模型,按开发者反馈优先级排期。需要哪个先来?告诉我们 →

怎么充值?最低多少?

控制台 token.beicou.com 微信 / 支付宝,¥10 起充,到账即时。余额永不过期,0 月费 0 套餐。

怎么查余额和用量?

控制台首页看实时余额;每次调用返回的 usage 字段就是 token 数(OpenAI 标准协议);控制台「账单」页可按天 / 按模型查看明细。

能开发票吗?

支持。控制台提交开票申请,月累计消费满 ¥100 可开个人 / 企业普票,加 1 个工作日。

余额能退款吗?

未消耗余额可申请原路退款(5% 渠道成本不退)。已消耗部分按实际调用结算,不退。开过发票的订单需先冲红。

这跟厂商账号订阅(如 Cursor Pro)什么关系?

完全无关。北凑是 API 资源中转服务,不销售任何 AI 厂商官方账号,不组织账号共享 / 拼车。所有 token 走平台自有 key 池,调用方与厂商之间不存在订阅 / 账号关系。用户须遵守所调用模型的厂商 ToS。

数据安全吗?厂商会看到我的请求吗?

请求走平台自有 key 池,厂商只看到「平台 key」发出的请求,看不到调用方身份;不进入您的个人厂商账户后台。请求内容仅做计费用,不持久化存储。

有 SLA / 稳定性保证吗?

当前为单节点 4G 内存的轻量部署,月可用性 99%+。突发流量可能限流;正式 SLA 与多区域部署在路线图上。

怎么用 Claude Code / Cursor 这种 IDE 工具?

设置环境变量 OPENAI_BASE_URL=https://token.beicou.com/v1OPENAI_API_KEY=sk-bc-xxx,重启 IDE 即可。Claude Code 走 Anthropic 兼容路径 ANTHROPIC_BASE_URL

FINAL CALL / SHIP IT

改一行 base_url,
从今天开始便宜一半

3 个模型,5 折批发,¥10 起充,3 分钟接入。