🏭 私有化 AI 推理平台

把 GPU 集群
变成 Token 工厂

基于私有 GPU 集群部署 Gemma-4、Qwen3.6 等主流开源大模型，提供 OpenAI 兼容 API，按实际 Token 消耗透明计费。

查看模型价格 ↓

16+

卡 GPU 服务器

主流大模型

99%

可用性

quick_start.py

#86efac">"color:#a78bfa">from openai "color:#a78bfa">import OpenAI
#22d3ee">client = OpenAI(
    api_key=#86efac">"sk-tt-your-key-here",
    base_url=#86efac">"http://36.111.81.189/v1"
)
#22d3ee">resp = client.chat.completions.create(
    model=#86efac">"Qwen3.6-35B-A3B",
    messages=[{#86efac">"role": "user", "content": "你好"}],
    stream=True,
)
#86efac">"color:#a78bfa">for chunk "color:#a78bfa">in resp:
    #86efac">"color:#a78bfa">print(chunk.choices[0].delta.content, "color:#a78bfa">end="")

模型广场

主流开源大模型，一站接入

价格单位：元 / 百万 tokens

Gemma

Gemma-4-31B-it

gemma-4-31B-it

旗舰

输入

¥0.50

输出

¥1.00

Qwen

Qwen3.6-35B-A3B

MoE

输入

¥0.50

输出

¥1.00

Qwen

Qwen3.6-27B

多模态

输入

¥0.50

输出

¥1.00

Qwen

Qwen3.5-35B-A3B

W8A8

输入

¥0.50

输出

¥1.00

快速接入

三步开始，分钟级上手

注册账号

30 秒完成注册，立即获得免费试用额度

创建密钥

在密钥管理页创建 API Key，格式 sk-tt-xxxxx

开始调用

修改 base_url 为铁算子地址，其余代码完全不变

为开发者精心打造

⚡

OpenAI 兼容

无需改代码，修改 base_url 即可迁移，支持流式输出

🏭

私有工厂集群

16 卡 GPU 服务器自建推理集群，数据不出内网

📊

实时用量追踪

Token 用量、费用、调用次数实时统计，精确到每次请求

🔑

多密钥管理

为不同项目创建独立密钥，设置消费限额，独立计费

⚖️

智能调度

按渠道偏好自动路由，多工厂负载均衡，保障稳定

💰

透明计费

按实际 Token 消耗计费，无月费，余额永不过期

立即开启你的 AI Token 工厂

注册即获赠免费额度，无需信用卡，按需充值

把 GPU 集群变成 Token 工厂

主流开源大模型，一站接入

三步开始，分钟级上手

注册账号

创建密钥

开始调用

为开发者精心打造

OpenAI 兼容

私有工厂集群

实时用量追踪

多密钥管理

智能调度

透明计费

立即开启你的 AI Token 工厂

把 GPU 集群
变成 Token 工厂