OpenAI 开源 Transformer Debugger-低调大师

OpenAI 开源 Transformer Debugger

2024-03-12 421

OpenAI 超级对齐负责人 Jan Leike 宣布，推出了一个该公司内部使用的分析 Transformer 内部结构的工具 -- Transformer Debugger (TDB) 。它结合了自动可解释性和稀疏自动编码器，无需编写代码即可快速探索模型。

目前，该项目仓库已在 MIT 协议下开放。Jan Leike 表示，TDB 目前仍然是一个处于早期阶段的研究工具，他们希望通过开源的方式让更多人使用，并在此基础上加以改进。

根据介绍，Transformer Debugger 是 OpenAI 的 Superalignment 团队开发的一款工具，旨在支持对小语言模型的特定行为进行研究。

TDB 可以在编写代码之前进行快速探索，能够干预前向传递并查看它对特定行为的影响。它可以用来回答诸如"为什么模型会输出 token A 而不是 token B"或"为什么 attention head H 会关注 token T"之类的问题。它通过识别对行为有贡献的特定组件（neurons、attention heads、autoencoder latents），显示自动生成的关于导致这些组件激活最强烈的原因的解释，以及追踪组件之间的连接以帮助发现联系。

本次开源发布的内容包括：

Neuron viewer：一个 React 应用程序，托管 TDB 以及包含有关各个模型组件（MLP neurons、attention heads and autoencoder latents for both）信息的页面。
Activation server：对主题模型进行推理，为TDB提供数据的后端服务器。它还从公共 Azure 存储桶读取数据并提供数据。
Models：一个用于 GPT-2 模型及其自动编码器的简单推理库，带有用于捕获激活的 hook。
Collated activation datasets：MLP neurons、attention heads 和 autoencoder latents 的顶级激活数据集示例。

此外， OpenAI 方面还放出了几个概述 TDB 能力的视频，并展示了如何使用它来研究论文“Interpretability in the Wild: a Circuit for Indirect Object Identification in GPT-2 small”。

微信关注我们

原文链接：https://www.oschina.net/news/282711/openai-transformer-debugger

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

酷瓜云课堂（内网版）v1.1.2 发布，局域网在线教育平台

更新内容增加弹幕管理增加图文背景水印增加内容审核开关单元测评增加题型过滤增加post方式传递csrf_token Response增加unauthorized()返回删除chapter中resource_count,consult_count属性删除resource表chapter_id属性删除Article中多余的settings属性重新统计course中resource_count 修正home模块编辑器图片上传修正直播回放获取播放地址参数问题图文和文章增加markdown支持精简CsrfToken白名单拆解优化创建表脚本优化Storage.php 系统介绍酷瓜云课堂内网版，采用C扩展框架Phalcon开发，使用本地基础服务，无营销相关功能，主要适用于公司、集团、机关、学校等内部网络环境使用。系统功能实现了点播、直播、专栏、问答、积分等。友情提示：演示系统配置低，带宽有限，切莫压测课程数据来源于网络（无实质内容）管理后台已禁止数据提交，私密配置已过滤系统演示：前台演示后台演示演示账号：100015@163.com / 123456 ...

2024-03-12

378

谷歌已将向量搜索引入其 MySQL 数据库服务，这一步领先了 MySQL 的所属公司 Oracle，迄今为止，Oracle 尚未给 MySQL 添加任何大型语言模型（LLM）方面的功能。谷歌云数据库副总裁安迪·古特曼斯 (Andi Gutmans) 表示，在过去 12 年里，谷歌在向量方面的创新速度相当快。目前，在多个 Google Cloud 数据库中提供向量搜索预览版，包括 Cloud SQL for MySQL、Memorystore for Redis 以及 Google 的分布式数据库管理和存储服务 Spanner。向量是 LLM 的基本元素，自 2022 年 ChatGPT 推出以来，LLM 已成为大型科技公司、政府和媒体的关注焦点。LLM 依赖于单词或语言的其他组成部分，根据其与其他语言的统计相似性将其表示为向量嵌入。Google 支持 Word2Vec，这是一种 2013 年推出的自然语言处理技术，尽管它已被法学硕士采用的转换器架构所取代。开源数据库服务公司 Percona 的技术传播者 Dave Stokes 表示，Oracle 工程部门近期没有计划向 MySQ...

2024-03-12

341

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。