字节跳动被 OpenAI “封号”事件始末-低调大师

字节跳动被 OpenAI “封号”事件始末

2023-12-18 460

12 月 16 日，The Verge 根据获得的内部文件报道称，字节跳动曾秘密使用 OpenAI 的技术来开发自己的大语言模型，在代号为 Project Seed 的项目各阶段，都使用了 Azure 上的 OpenAI API 进行模型的训练和评估，并且频繁触及 API 的最大限额。

来源：https://www.theverge.com/2023/12/15/24003151/bytedance-china-openai-microsoft-competitor-llm

报道还称，相关员工知悉这种做法违反 OpenAI 使用政策，并在内部 Lark 上的对话中提及了「数据脱敏」等说法。但几个月前，字节命令团队在「模型开发的任何阶段」停止使用 GPT 生成的文本。同期，字节的「豆包」服务在国内获批并上线。据称，字节的内部目标是年底达到 GPT-3.5 的水平，明年中达到 GPT-4 的水平。

该报道发出后，OpenAI 声明称，字节的 API 用量很少，但已将其账户暂停使用并做进一步调查。如发现违反使用政策，将要求纠正或关停账户。微软在声明中重述了 Azure OpenAI 服务的政策，但未对报道事实或后续措施置评。

OpenAI 发言人 Niko Felix 确认字节跳动的账户已被暂停，并说道：“所有 API 客户都必须遵守我们的使用政策，以确保我们的技术得到良好利用。虽然字节跳动对我们 API 的使用很少，但我们在进一步调查期间已暂停了他们的帐户。如果我们发现他们的使用不遵守这些政策，我们将要求他们进行必要的更改或终止其帐户。”

就此，字节国外发言人于 16 日对 The Verge 表示，GPT 生成的数据在 Project Seed 项目开发的早期就被用于注释模型，并在今年年中左右从字节跳动的训练数据中删除。GPT 仅在中国以外市场的产品和功能中使用，豆包则是基于自行开发的模型，且仅在中国可用。

字节相关负责人则于 17 日回应媒体称，仅在年初有部分工程师将 OpenAI 服务用于较小模型的实验性项目研究；随着公司在 4 月引入 GPT API 调用规范检查，这种做法已经停止；9 月，内部又进行了一轮检查并采取进一步规范措施；在未来几天里会再次全面检查，以确保严格遵守相关服务的使用条款。

对于 OpenAI 禁止用其服务训练竞争模型的政策，历来存在不同看法。支持的观点认为，OpenAI 为训练模型做了大量前期投入，借助其服务「抄近道」是不正当的。反对的观点则认为，OpenAI 的训练过程得益于当时对 AI 训练无戒备的外部环境，在其之后的模型已不再能轻易获得到同样规模的训练数据，阻止其他公司调用其模型相当于建立事实上的垄断。

微信关注我们

原文链接：https://www.oschina.net/news/271501/bytedance-china-openai-microsoft-competitor-llm

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

字节跳动就“OpenAI 服务被禁”做出澄清

日前有外媒报道称，字节跳动在使用 OpenAI 技术开发自己的大语言模型，违反了服务条款；从而导致被OpenAI 封禁了账号。 OpenAI 发言人 Niko Felix 也发表了回复称，“所有的 API 用户都必须遵循我们的使用政策，以确保我们的技术被正当使用。虽然字节跳动使用我们的 API 不多，我们还是停了他们的账号，同时我们会进一步调查。如果我们发现字节跳动的使用没有遵循这些政策，我们会要求字节跳动做出必要的改变，或者完全终止其账号。” 对此，字节跳动相关负责人向《科创板日报》回应称：今年年初，当技术团队刚开始进行大模型的初期探索时，有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。该模型仅为测试，没有计划上线，也从未对外使用。 4月公司引入GPT API 调用规范检查后，这种做法已经停止。9月，公司采取措施进一步保证对GPT的API 调用符合规范要求。例如分批次抽样检测模型输出结果与GPT的相似度，避免数据标注人员私自使用GPT。“未来几天里，我们会再次全面检查，以确保严格遵守相关服务的使用条款。”

2023-12-18

408

Debian GNU/Linux 团队在最近的 DebConf 会议上决定，其 Linux 内核、Debian 安装器和 Debian 镜像团队未来将不再支持 i386 架构。这意味着用户需要考虑将系统迁移到更现代的架构，以确保系统的长期支持和兼容性。 i386架构是英特尔的32位微处理器，最初被称为80386，后来更名为i386。它是x86架构的一部分，是早期个人电脑和工作站的中央处理单元（CPU）。i386架构具有32位数据宽度和32位地址宽度，支持实模式、保护模式和虚拟模式。虽然i386架构已经过时，但它对后来的x86处理器设计产生了深远影响。i386的后继产品包括i486和P5 Pentium系列处理器，这些处理器都是基于i386设计的后代产品。此后用户可以通过两种方式来运行 i386：作为 amd64 系统上的多架构选项作为其他架构系统上的 i386 chroot Debian 并不打算像 Ubuntu 那样将 i386 作为部分架构，arch:any 仍将包含 i386，因此一切都将默认构建。希望放弃 i386 支持的维护者可以在与软件包的反向（构建）依赖关系协调后...

2023-12-18

341

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。