首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/283280

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Transformer Debugger —— Transformer 内部结构分析工具

Transformer Debugger 是 OpenAI 的 Superalignment 团队开发的一款工具,旨在支持对小语言模型的特定行为进行研究。 TDB 可以在编写代码之前进行快速探索,能够干预前向传递并查看它对特定行为的影响。它可以用来回答诸如 "为什么模型会输出 token A 而不是 token B" 或 "为什么 attention head H 会关注 token T" 之类的问题。它通过识别对行为有贡献的特定组件(neurons、attention heads、autoencoder latents),显示自动生成的关于导致这些组件激活最强烈的原因的解释,以及追踪组件之间的连接以帮助发现联系。 本次开源发布的内容包括: Neuron viewer:一个 React 应用程序,托管 TDB 以及包含有关各个模型组件(MLPneurons、attention heads and autoencoder latents for both)信息的页面。 Activation server:对主题模型进行推理,为 TDB 提供数据的后端服务器。它还从公共 Azure 存储桶...

Krita 2024 规划:更多地关注 GPU 加速和 AI

Krita 项目团队发文对 2023 年的工作进行了回顾;同时透露了项目 2024 年的一些工作规划,其中包含了一些 2023 年未完成的事项以及新的内容。 首先提到了就是在 2024 年需要将 Krita 移植到 Qt6。“这是一个大工程,不仅仅是因为功能的消失,还因为对 GPU 渲染支持的改变。在 Windows 上,OpenGL 驱动程序存在很多错误,正因为如此,Qt5 提供了在使用 OpenGL 的应用程序和用于 GPU 渲染的 native Direct3D 库之间使用 Angle 兼容层的可能性。现在,除非我们重写 GPU 渲染系统,否则就必须将 Angle 放回堆栈中。” 移植到 Qt6 势必会花费大量的时间和精力,但同时也会带来很多新功能。项目团队希望能在 2024 年实现的功能包括有: 实现一个系统来创建灵活的 text balloons 并将其与文本对象集成 为 comic book Frameworks 实现新的图层类型 提供与 Blender 的集成 用更灵活、更易于维护的系统替换当前的 docker 系统 建立一个系统来提供工具预设 创建一个新的用户界面来处理...

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

用户登录
用户注册