基于私有 GPU 集群部署 Gemma-4、Qwen3.6 等主流开源大模型, 提供 OpenAI 兼容 API,按实际 Token 消耗透明计费。
价格单位:元 / 百万 tokens
30 秒完成注册,立即获得免费试用额度
在密钥管理页创建 API Key,格式 sk-tt-xxxxx
修改 base_url 为铁算子地址,其余代码完全不变
无需改代码,修改 base_url 即可迁移,支持流式输出
16 卡 GPU 服务器自建推理集群,数据不出内网
Token 用量、费用、调用次数实时统计,精确到每次请求
为不同项目创建独立密钥,设置消费限额,独立计费
按渠道偏好自动路由,多工厂负载均衡,保障稳定
按实际 Token 消耗计费,无月费,余额永不过期