阿里云大模型服务

通义千问、文心一言、智谱GLM等主流大模型API接入，Token计费，灵活充值，稳定合规，支持企业API调用

获取优惠报价 › 测试API ›

产品优势

为什么选择大模型服务

主流大模型全覆盖

Token灵活计费

毫秒级响应

企业级SLA保障

API兼容OpenAI格式

7×24技术支持

模型丰富

整合通义千问、文心一言、智谱GLM、LLaMA2等国内外顶级大模型，一站式接入，按需切换，满足不同业务场景需求。

接入便捷

兼容OpenAI API格式，仅需修改endpoint和Key即可无缝迁移。支持Python、Java、Go等SDK，30分钟快速集成上线。

合规稳定

官方合规渠道，99.9%服务可用性保障，数据安全隔离，支持企业私有化部署，提供正规发票和合同。

套餐方案

大模型推荐套餐

按需选择，灵活计费，企业首选

首购体验

体验版

通义千问Qwen-Turbo

9.9元/月

模型通义千问Qwen-Turbo

额度10万Token/月

立即咨询 ›

热卖推荐

标准版

通义千问Qwen-Plus

99元/月

模型通义千问Qwen-Plus

额度100万Token/月

立即咨询 ›

企业首选

企业版

通义千问Qwen-Max

399元/月

模型通义千问Qwen-Max

额度500万Token/月

立即咨询 ›

高性能

旗舰版

通义千问Qwen-Max+文心一言

799元/月

模型通义千问Qwen-Max+文心一言

额度1000万Token/月

立即咨询 ›

定制方案

私有部署

Llama2/ChatGLM本地部署

面议

模型 Llama2/ChatGLM本地部署

额度按需定制

立即咨询 ›

计费说明

Token计费方案

按量付费，余额可累计，企业可月结

模型	上下文	输入价格	输出价格	QPS限制
通义千问 Qwen-Turbo	8K	0.004元/千Token	0.012元/千Token	1
通义千问 Qwen-Plus	32K	0.012元/千Token	0.036元/千Token	10
通义千问 Qwen-Max	128K	0.04元/千Token	0.12元/千Token	50
通义千问 Qwen-Long	长文档	0.015元/千Token	0.06元/千Token	50
文心一言 ERNIE-4.0	8K	0.04元/千Token	0.12元/千Token	20
文心一言 ERNIE-3.5	8K	0.012元/千Token	0.036元/千Token	30
智谱 GLM-4	128K	0.05元/千Token	0.15元/千Token	20
智谱 GLM-3-Turbo	128K	0.004元/千Token	0.012元/千Token	50

计费说明：输入与输出Token分别计费，按月统计消耗；余额可跨月累计，无时间限制；企业客户可申请月结，对公转账，提供正规增值税发票。

规格参数

大模型服务详细规格

参数项	可选配置
模型类型	通义千问/文心一言/智谱GLM
计费方式	Token预付费
API调用	RESTful API
响应速度	毫秒级
服务保障	99.9%可用性
应用场景	智能客服/内容生成/知识库
支持模型	通义千问Qwen-Turbo/Plus/Max、文心一言ERNIE-4.0/3.5、智谱GLM-4/3.5、LLaMA2、ChatGLM2
上下文长度	最高128K tokens
安全过滤	内置内容安全审核，合规合规调用