零一万物发布 Yi 大模型 API 并启动公测,支持上下文 200K
零一万物通过其微信公众号宣布,经过一段时间的开发和内测正式发布Yi大模型API,同时启动邀测。目前,Yi 大模型 API 邀测名额限量开放中,申请成功即送1000万 tokens。
此次邀测提供了两种模型:
- Yi-34B-Chat(0205):支持聊天、问答、对话、写作、翻译等功能。
- Yi-34B-Chat-200K:200K 上下文,多文档阅读理解、超长知识库构建小能手。
模型优势
- 超长上下文
本次重磅出台 Yi-34B-Chat-200K API,加速大模型应用进入“长文本时代”。200K 支持处理约 20~30 万个中英文字符(例如,可以轻松处理整本《哈利•波特与魔法石》小说),适合用于多篇文档内容理解、海量数据分析挖掘和跨领域知识融合等,为各行各业提供了极大的便利。例如,金融分析师可以用它快速阅读报告并预测市场趋势、律师可以用它精准解读法律条文、科研人员可以用它高效提取论文要点、文学爱好者可以用它快速掌握作品精髓等,应用场景非常广泛。
例如,以下是 Yi-34B-Chat-200K 对经典文学作品《呼啸山庄》进行复杂角色和角色关系的归纳总结,该小说篇幅庞大(中文字数约 30 万字),且人物关系错综复杂,但它仍能精准地梳理和总结出人物之间的关系,展示了它在处理超长上下文时出色的复杂内容理解和分析能力。
- 出色的指令遵循和创意内容生成能力
此前,零一万物发布并开源了 Yi-34B-Chat(1123),它的回复风格符合人类偏好,但在指令遵循上结果不够稳定。而此次新发布的 Yi-34B-Chat(0205)经过深度优化,性能得到大幅提升,不仅继承了符合人类偏好的回复风格,很擅长创意性内容创作,而且能够更好地理解复杂的用户需求,遵循多约束指令(指令遵循能力提升了近 30%),稳定生成指定格式的内容。
例如,以下是两个版本在指令遵循方面的测评对比。
Prompt 1: 帮我输出一个俄国作家的书单,以 JSON 格式输出一个的 list,其中每一个 item 都要有两个 key,分别是书名和作家名字,请列出 3 本不同的书
Yi-34B-Chat(1123)输出的 JSON 文件格式略有不足(例如,第 8 行和第 12 行的引号),而 Yi-34B-Chat(0205)输出的 JSON 文件格式全部正确。
Prompt 2: 判断下面这段话的情绪倾向,如果是正面的,回复数字 1;如果是负面的,回复数字 0:
这款手机真是物超所值,性能强大,电池续航长,外观设计也很有档次。我用了几个月,到现在还像新的一样。
Yi-34B-Chat(1123)虽然理解了问题,但是没有完全遵循指令,输出了较多冗余的分析。而 Yi-34B-Chat(0205)理解了问题,且正确遵循了用户指令。
API 优势
- 推理速度快
为了提升 API 性能,团队在 API 侧进行了推理优化,因此 Yi-34B-Chat 系列 API 具备较快的推理速度,这不仅缩短了处理时间,同时也保持了出色的模型效果。此外,优化的 API 接口显著降低了模型回复的延迟,进一步提高了用户体验的流畅性和响应速度。
- 兼容 OpenAI
Yi 大模型 API 与 OpenAI API 完全兼容,你只需修改少量代码,可以平滑迁移,即刻享受 Yi 大模型的超凡魅力。
import openai from openai import OpenAI API_BASE = "https://api.lingyiwanwu.com/v1" API_KEY = "{{your key}}" client = OpenAI( # defaults to os.environ.get("OPENAI_API_KEY") api_key=API_KEY, base_url=API_BASE ) completion = client.chat.completions.create( model="yi-34b-chat-200k", messages=[{"role": "user", "content": "Hi, who are you"}] ) print(completion)

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
WordPress 母公司 Automattic 计划出售数据给 OpenAI 等 AI 公司
404 Media 的一份报告显示,Tumblr和 WordPress.com 的所有者正在与人工智能公司 Midjourney 和 OpenAI 进行谈判,以提供从用户帖子中抓取的训练数据。 这份来自公司内部匿名消息人士的报告称,Automattic 与两家人工智能公司之间的交易“迫在眉睫”。过去一周,Tumblr 上流传着一些模糊的谣言,暗示与 Midjourney 的交易可能会为该网站带来新的收入来源。 根据报告,Automattic 计划在周三推出一项新设置,“允许用户选择不与包括人工智能公司在内的第三方共享数据”。 但它引用的内部帖子表明,该公司抓取了一份“初始数据转储”,其中包含“2014 年至 2023 年间 Tumblr 的所有公开帖子内容”,其中包括不会在博客上公开可见的内容——Automattic 称是错误抓取。目前尚不清楚这些数据做了什么,以及哪些数据已发送到 Midjourney 和 OpenAI。
- 下一篇
从 0 到 1 搭建亿级商品 ES 搜索引擎
建设并维护一个亿级的搜索引擎并非易事,也不存在一劳永逸的最优治理方法。本文是在实践中不断学习和总结的成果,介绍了如何搭建一个可支持从千万级到亿级商品量级的搜索系统,并实现查询总 QPS 从百级增长到千级,写入总 QPS 从百级增加到万级的过程。其中,ES 资源扩容是必不可少的,但除此之外,本文还将重点介绍一些扩容无法解决的 ES 性能问题。希望通过本文大家可以对 ES 的使用场景有更多数据和使用上的参考。由于篇幅有限,关于稳定性治理的部分将在下篇文章中进行介绍。 业务介绍 平台招商管理系统服务于抖音电商平台活动的多实体招商场景,会通过招商平台来进行收品,选品,然后分发品到各 C 端系统。招商的实体也非常的多样化,有达人直播间,商品招商,优惠券招商等等,其中商品招商是我们体量最大的招商实体。 招商平台服务架构 数据中心 数据中心是一个基于 ES 的搜索服务,提供可配置化的、可扩展的、通用的数据获取编排服务,是支持招商平台数据查询的通用服务。 关键概念了解: 指标:指标是被我们用来描述一个实体或者对象的某个属性的元数据,比如商品名称,店铺体验分,达人等级,报名记录 ID,同时它也可以是某个...
相关文章
文章评论
共有0条评论来说两句吧...