Qwen3 系列模型迎来新第三方部署和价格特惠
阿里巴巴的Qwen3系列模型近期在多个平台获得部署并在官方平台开启了价格特惠。
Cerebras宣布推出Qwen3-235B模型,实现了每秒1500个token的推理速度,目前可进行有限制的免费体验。
阿里云的通义灵码IDE已集成Qwen3-Coder,并去掉了原有的DeepSeek模型。GMI inference cloud也上线了Qwen3 Coder 480B A35B Instruct FP8版本,定价为输入$1.00/M Tokens,输出$2.00/M Tokens。
阿里云百炼平台宣布对Qwen3-Coder-Plus进行为期一个月的限时降价,并进一步对上下文缓存功能进行说明:“上下文缓存的命中概率并不是100%,即使是上下文完全一致的请求,也存在无法命中的概率,命中概率依据系统判断而定。”
Token 数量 | 输入成本 (每千Token) | 输出成本 (每千Token) |
---|---|---|
0-32K | 0.004 元 | 0.016 元 |
32K-128K | 0.0042 元 (原价 0.006 元的 7折) | 0.0168 元 (原价 0.024 元的 7折) |
128K-256K | 0.005 元 (原价 0.01 元的 5折) | 0.02 元 (原价 0.04 元的 5折) |
256K-1M | 0.01 元 (原价 0.02 元的 5折) | 0.1 元 (原价 0.2 元的 5折) |
详情:https://help.aliyun.com/zh/model-studio/qwen3-coder-plus-price-drop

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
谷歌母公司发布 Q2 财报:全年资本支出飙升至 850 亿美元
谷歌母公司Alphabet周三公布季度营收超出华尔街预期,得益于新推出的AI功能以及稳定的数字广告市场。公司还表示,将今年的资本支出计划从原本的大约750亿美元上调至约850亿美元。Alphabet A股美股盘后下跌2.8%,但随后回弹,一度跳涨3.4%。 以下是Alphabet二季度财报要点: 主要财务数据: 营收:Alphabet二季度营收964.3亿美元,同比增长14%,高于分析师预期的939.7亿美元。 调整后营收:剔除合作伙伴分成后的第二季度销售额为817亿美元,高于分析师平均预期796亿美元。 每股收益:Alphabet二季度每股收益2.31美元,同比增长22%,高于分析师预期的2.18美元。 分业务数据: 谷歌云营收:谷歌云营收第二季度为136亿美元,同比增长32%,高于市场预期的131亿美元。 云计算利润:谷歌云计算部门本季度运营利润为28.3亿美元,远超分析师预期的22.5亿美元。 广告总营收:Alphabet广告总营收713亿美元,同比增长10.4%。 搜索业务营收:搜索业务营收第二季度为541亿美元,同比增长11.7%,高于分析师预期的540亿美元。 YouTub...
- 下一篇
GitHub Spark 发布公测预览版,通过自然语言构建全栈应用
GitHub宣布其新产品GitHub Spark已面向Copilot Pro+订阅用户开启公测,该产品旨在让开发者通过自然语言在数分钟内完成从想法到部署的全栈智能应用程序的构建和发布,无需进行环境设置或配置。 Spark的核心功能由Claude Sonnet 4驱动,允许用户通过描述想法来构建包含前端和后端的应用。该平台内置了数据存储、LLM推理、托管、部署和GitHub身份验证等功能。 开发者可以在应用中添加由OpenAI、Meta、DeepSeek、xAI等公司模型驱动的AI功能,而无需管理API密钥。应用可以通过一键点击进行部署,并自动创建一个包含GitHub Actions和Dependabot的GitHub仓库,确保所有内容保持同步。 开发者可以通过自然语言、可视化编辑控件或在集成GitHub Copilot代码补全的编辑器中进行编码来迭代他们的想法。 此外,用户可以直接从Spark中打开一个codespace,以使用Copilot agent模式进行迭代,或将issue分配给Copilot coding agent。Copilot Pro+订阅用户可直接访问Spark,其使...
相关文章
文章评论
共有0条评论来说两句吧...