零一万物发布 Yi 大模型 API 并启动公测，支持上下文 200K-低调大师

零一万物发布 Yi 大模型 API 并启动公测，支持上下文 200K

2024-02-28 436

零一万物通过其微信公众号宣布，经过一段时间的开发和内测正式发布Yi大模型API，同时启动邀测。目前，Yi 大模型 API 邀测名额限量开放中，申请成功即送1000万 tokens。

此次邀测提供了两种模型：

Yi-34B-Chat（0205）：支持聊天、问答、对话、写作、翻译等功能。
Yi-34B-Chat-200K：200K 上下文，多文档阅读理解、超长知识库构建小能手。

模型优势

超长上下文

本次重磅出台 Yi-34B-Chat-200K API，加速大模型应用进入“长文本时代”。200K 支持处理约 20～30 万个中英文字符（例如，可以轻松处理整本《哈利•波特与魔法石》小说），适合用于多篇文档内容理解、海量数据分析挖掘和跨领域知识融合等，为各行各业提供了极大的便利。例如，金融分析师可以用它快速阅读报告并预测市场趋势、律师可以用它精准解读法律条文、科研人员可以用它高效提取论文要点、文学爱好者可以用它快速掌握作品精髓等，应用场景非常广泛。

例如，以下是 Yi-34B-Chat-200K 对经典文学作品《呼啸山庄》进行复杂角色和角色关系的归纳总结，该小说篇幅庞大（中文字数约 30 万字），且人物关系错综复杂，但它仍能精准地梳理和总结出人物之间的关系，展示了它在处理超长上下文时出色的复杂内容理解和分析能力。

出色的指令遵循和创意内容生成能力

此前，零一万物发布并开源了 Yi-34B-Chat（1123），它的回复风格符合人类偏好，但在指令遵循上结果不够稳定。而此次新发布的 Yi-34B-Chat（0205）经过深度优化，性能得到大幅提升，不仅继承了符合人类偏好的回复风格，很擅长创意性内容创作，而且能够更好地理解复杂的用户需求，遵循多约束指令（指令遵循能力提升了近 30%），稳定生成指定格式的内容。

例如，以下是两个版本在指令遵循方面的测评对比。

Prompt 1: 帮我输出一个俄国作家的书单，以 JSON 格式输出一个的 list，其中每一个 item 都要有两个 key，分别是书名和作家名字，请列出 3 本不同的书

Yi-34B-Chat（1123）输出的 JSON 文件格式略有不足（例如，第 8 行和第 12 行的引号），而 Yi-34B-Chat（0205）输出的 JSON 文件格式全部正确。

Prompt 2: 判断下面这段话的情绪倾向，如果是正面的，回复数字 1；如果是负面的，回复数字 0：

这款手机真是物超所值，性能强大，电池续航长，外观设计也很有档次。我用了几个月，到现在还像新的一样。

Yi-34B-Chat（1123）虽然理解了问题，但是没有完全遵循指令，输出了较多冗余的分析。而 Yi-34B-Chat（0205）理解了问题，且正确遵循了用户指令。

API 优势

推理速度快

为了提升 API 性能，团队在 API 侧进行了推理优化，因此 Yi-34B-Chat 系列 API 具备较快的推理速度，这不仅缩短了处理时间，同时也保持了出色的模型效果。此外，优化的 API 接口显著降低了模型回复的延迟，进一步提高了用户体验的流畅性和响应速度。

兼容 OpenAI

Yi 大模型 API 与 OpenAI API 完全兼容，你只需修改少量代码，可以平滑迁移，即刻享受 Yi 大模型的超凡魅力。


import openai
from openai import OpenAI

API_BASE = "https://api.lingyiwanwu.com/v1"
API_KEY = "{{your key}}"

client = OpenAI(
    # defaults to os.environ.get("OPENAI_API_KEY")
    api_key=API_KEY,
    base_url=API_BASE
)
completion = client.chat.completions.create(
    model="yi-34b-chat-200k",
    messages=[{"role": "user", "content": "Hi, who are you"}]
)
print(completion)

微信关注我们

原文链接：https://www.oschina.net/news/280668

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

WordPress 母公司 Automattic 计划出售数据给 OpenAI 等 AI 公司

404 Media 的一份报告显示，Tumblr和 WordPress.com 的所有者正在与人工智能公司 Midjourney 和 OpenAI 进行谈判，以提供从用户帖子中抓取的训练数据。这份来自公司内部匿名消息人士的报告称，Automattic 与两家人工智能公司之间的交易“迫在眉睫”。过去一周，Tumblr 上流传着一些模糊的谣言，暗示与 Midjourney 的交易可能会为该网站带来新的收入来源。根据报告，Automattic 计划在周三推出一项新设置，“允许用户选择不与包括人工智能公司在内的第三方共享数据”。但它引用的内部帖子表明，该公司抓取了一份“初始数据转储”，其中包含“2014 年至 2023 年间 Tumblr 的所有公开帖子内容”，其中包括不会在博客上公开可见的内容——Automattic 称是错误抓取。目前尚不清楚这些数据做了什么，以及哪些数据已发送到 Midjourney 和 OpenAI。

2024-02-28

386

建设并维护一个亿级的搜索引擎并非易事，也不存在一劳永逸的最优治理方法。本文是在实践中不断学习和总结的成果，介绍了如何搭建一个可支持从千万级到亿级商品量级的搜索系统，并实现查询总 QPS 从百级增长到千级，写入总 QPS 从百级增加到万级的过程。其中，ES 资源扩容是必不可少的，但除此之外，本文还将重点介绍一些扩容无法解决的 ES 性能问题。希望通过本文大家可以对 ES 的使用场景有更多数据和使用上的参考。由于篇幅有限，关于稳定性治理的部分将在下篇文章中进行介绍。业务介绍平台招商管理系统服务于抖音电商平台活动的多实体招商场景，会通过招商平台来进行收品，选品，然后分发品到各 C 端系统。招商的实体也非常的多样化，有达人直播间，商品招商，优惠券招商等等，其中商品招商是我们体量最大的招商实体。招商平台服务架构数据中心数据中心是一个基于 ES 的搜索服务，提供可配置化的、可扩展的、通用的数据获取编排服务，是支持招商平台数据查询的通用服务。关键概念了解：指标：指标是被我们用来描述一个实体或者对象的某个属性的元数据，比如商品名称，店铺体验分，达人等级，报名记录 ID，同时它也可以是某个...

2024-02-28

405

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。