🏭  私有化 AI 推理平台

把 GPU 集群
变成 Token 工厂

基于私有 GPU 集群部署 Gemma-4、Qwen3.6 等主流开源大模型, 提供 OpenAI 兼容 API,按实际 Token 消耗透明计费。

16+
卡 GPU 服务器
4+
主流大模型
99%
可用性
quick_start.py
#86efac">"color:#a78bfa">from openai "color:#a78bfa">import OpenAI
#22d3ee">client = OpenAI(
api_key=#86efac">"sk-tt-your-key-here",
base_url=#86efac">"http://36.111.81.189/v1"
)
#22d3ee">resp = client.chat.completions.create(
model=#86efac">"Qwen3.6-35B-A3B",
messages=[{#86efac">"role": "user", "content": "你好"}],
stream=True,
)
#86efac">"color:#a78bfa">for chunk "color:#a78bfa">in resp:
#86efac">"color:#a78bfa">print(chunk.choices[0].delta.content, "color:#a78bfa">end="")
模型广场

主流开源大模型,一站接入

价格单位:元 / 百万 tokens

Gemma
Gemma-4-31B-it
gemma-4-31B-it
旗舰
输入
¥0.50
输出
¥1.00
Qwen
Qwen3.6-35B-A3B
Qwen3.6-35B-A3B
MoE
输入
¥0.50
输出
¥1.00
Qwen
Qwen3.6-27B
Qwen3.6-27B
多模态
输入
¥0.50
输出
¥1.00
Qwen
Qwen3.5-35B-A3B
Qwen3.5-35B-A3B
W8A8
输入
¥0.50
输出
¥1.00
快速接入

三步开始,分钟级上手

01

注册账号

30 秒完成注册,立即获得免费试用额度

02

创建密钥

在密钥管理页创建 API Key,格式 sk-tt-xxxxx

03

开始调用

修改 base_url 为铁算子地址,其余代码完全不变

为开发者精心打造

OpenAI 兼容

无需改代码,修改 base_url 即可迁移,支持流式输出

🏭

私有工厂集群

16 卡 GPU 服务器自建推理集群,数据不出内网

📊

实时用量追踪

Token 用量、费用、调用次数实时统计,精确到每次请求

🔑

多密钥管理

为不同项目创建独立密钥,设置消费限额,独立计费

⚖️

智能调度

按渠道偏好自动路由,多工厂负载均衡,保障稳定

💰

透明计费

按实际 Token 消耗计费,无月费,余额永不过期

立即开启你的 AI Token 工厂

注册即获赠免费额度,无需信用卡,按需充值