400-6800-390

阿里云大模型服务

通义千问、文心一言、智谱GLM等主流大模型API接入,Token计费,灵活充值,稳定合规,支持企业API调用

为什么选择大模型服务

主流大模型全覆盖
Token灵活计费
毫秒级响应
企业级SLA保障
API兼容OpenAI格式
7×24技术支持

模型丰富

整合通义千问、文心一言、智谱GLM、LLaMA2等国内外顶级大模型,一站式接入,按需切换,满足不同业务场景需求。

接入便捷

兼容OpenAI API格式,仅需修改endpoint和Key即可无缝迁移。支持Python、Java、Go等SDK,30分钟快速集成上线。

合规稳定

官方合规渠道,99.9%服务可用性保障,数据安全隔离,支持企业私有化部署,提供正规发票和合同。

大模型推荐套餐

按需选择,灵活计费,企业首选

首购体验

体验版

通义千问Qwen-Turbo
9.9元/月
模型通义千问Qwen-Turbo
额度10万Token/月
立即咨询 ›
热卖推荐

标准版

通义千问Qwen-Plus
99元/月
模型通义千问Qwen-Plus
额度100万Token/月
立即咨询 ›
企业首选

企业版

通义千问Qwen-Max
399元/月
模型通义千问Qwen-Max
额度500万Token/月
立即咨询 ›
高性能

旗舰版

通义千问Qwen-Max+文心一言
799元/月
模型通义千问Qwen-Max+文心一言
额度1000万Token/月
立即咨询 ›
定制方案

私有部署

Llama2/ChatGLM本地部署
面议
模型 Llama2/ChatGLM本地部署
额度按需定制
立即咨询 ›

Token计费方案

按量付费,余额可累计,企业可月结

模型 上下文 输入价格 输出价格 QPS限制
通义千问 Qwen-Turbo 8K 0.004元/千Token 0.012元/千Token 1
通义千问 Qwen-Plus 32K 0.012元/千Token 0.036元/千Token 10
通义千问 Qwen-Max 128K 0.04元/千Token 0.12元/千Token 50
通义千问 Qwen-Long 长文档 0.015元/千Token 0.06元/千Token 50
文心一言 ERNIE-4.0 8K 0.04元/千Token 0.12元/千Token 20
文心一言 ERNIE-3.5 8K 0.012元/千Token 0.036元/千Token 30
智谱 GLM-4 128K 0.05元/千Token 0.15元/千Token 20
智谱 GLM-3-Turbo 128K 0.004元/千Token 0.012元/千Token 50
计费说明:输入与输出Token分别计费,按月统计消耗;余额可跨月累计,无时间限制;企业客户可申请月结,对公转账,提供正规增值税发票。

大模型服务详细规格

参数项可选配置
模型类型通义千问/文心一言/智谱GLM
计费方式Token预付费
API调用RESTful API
响应速度毫秒级
服务保障99.9%可用性
应用场景智能客服/内容生成/知识库
支持模型通义千问Qwen-Turbo/Plus/Max、文心一言ERNIE-4.0/3.5、智谱GLM-4/3.5、LLaMA2、ChatGLM2
上下文长度最高128K tokens
安全过滤内置内容安全审核,合规合规调用

大模型适用场景

智能客服

内容创作

知识问答

代码生成

大模型服务热门问答

支持哪些大模型?
+
支持通义千问(阿里云)、文心一言(百度)、智谱GLM(清华智谱)、Llama2等国内外主流大模型,根据业务场景推荐最优方案。
如何调用API?
+
提供标准RESTful API接口,兼容OpenAI调用格式,只需修改endpoint和API Key即可快速接入,支持Python、Java、Go等主流语言SDK。
Token如何计费?
+
按实际消耗Token数量计费,先充值后使用,余额可累计。支持企业月结、对公转账,提供正规发票。
调用有QPS限制吗?
+
体验版QPS为1,标准版QPS为10,企业版QPS为50,旗舰版不设上限。支持更高QPS定制。

立即咨询,获取最新阿里云优惠

新开、续费、升级,享代理折扣。官方渠道,安全透明,售后无忧

400-6800-390

联系我们

在线客服
点击咨询 ›
全国热线(7×24小时)
400-6800-390
手机/微信(售前咨询)
159-8887-1576
×

扫码添加微信

微信二维码

长按识别二维码