彭博推出 BloombergGPT,金融领域的大型语言模型
彭博 (Bloomberg) 发布了一篇研究报告,详细介绍了新型的大规模生成式 AI 模型 BloombergGPT 的开发。这种大型语言模型(LLM)专门针对各种金融数据进行了训练,以支持金融行业内多样化的自然语言处理(NLP)任务。
公告称,基于 LLM 的 AI 的最新进展已经在许多领域展示了令人兴奋的新应用,但金融领域的复杂性和独特术语需要一个特定领域的模型。“BloombergGPT 代表了为金融行业开发和应用这种新技术的第一步”。
该模型将协助彭博改进现有的金融 NLP 任务,如情感分析、命名实体识别、新闻分类和问答等。此外,BloombergGPT 将为彭博终端上的大量数据释放新的机会,将 AI 的全部潜力带入金融领域。
"Bloomberg 支持大量多样的 NLP 任务,这些任务将受益于新的金融感知语言模型。彭博研究人员开创了一种混合方法,将金融数据与通用数据集相结合,以训练一个在金融基准上取得优异成绩的模型,同时在通用 LLM 基准上保持有竞争力的表现。"
彭博的 ML 产品和研究小组与该公司的 AI 工程团队合作,利用其现有的数据创建、收集和管理资源,构建了迄今为止最大的特定领域数据集之一。作为一家金融数据公司,彭博的数据分析师在过去的四十年里一直在收集和维护金融语言文档。得益于此,该团队从这个广泛的金融数据档案中提取数据,创建了一个由英文金融文件组成的 3630 亿标记综合数据集。
根据介绍,该数据集与一个 3450 亿标记的公共数据集相结合,创建了一个超过 7000 亿标记的大型训练语料库。利用该训练语料库的一部分内容,团队训练了一个具有 500 亿参数的仅解码器的因果语言模型。由此生成的模型在现有的针对金融的 NLP 基准、一套彭博内部基准以及来自热门基准的通用 NLP 任务的广泛类别(如 BIG-bench Hard、知识评估、阅读理解和语言任务)上进行了验证。
彭博方面称,在金融任务上,BloombergGPT 模型在很大程度上优于类似规模的现有开放模型,同时在通用 NLP 基准上表现相当或更好。
彭博首席技术官 Shawn Edwards 表示:“出于各种原因,生成式 LLM 非常具有吸引力,譬如小样本学习、文本生成、对话系统等;我们看到了开发首个专注于金融领域的 LLM 的巨大价值。BloombergGPT 将使我们能够处理许多新型应用程序,同时它为每个应用程序提供比定制模型更高的开箱即用性能,并且上市时间更快。”
有关 BloombergGPT 开发的更多详细信息,可查看 arXiv 上的论文。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
GTK 和 Blender 支持 Wayland 分数缩放
Blender 开源 3D 建模软件和 GTK 工具包已增加了对 Wayland 的分数缩放协议的支持。 分数缩放是 175%、225% 等非整数的缩放比例,22 年底, Wayland Protocols 1.31 版本通过新的“wp-fractional-scale-v1”协议添加了分数缩放支持。 Blender 增加了对 Wayland 的分数尺度协议的支持,并宣称对很多 UI 元素来说,分数缩放会比现有的基于整数的缩放更好。Blender 的 Commit 解释说: 以前检测到分数缩放时,Blender 会设置一个整数缓冲区比例,但合成器会缩小它导致输出模糊。 现在,在分数缩放可用时,Blender 会使用分数缩放界面来设置 DPI 和设置内部缓冲区大小和视口转换,以确保从 Blender 到 Wayland 输出的像素为 1:1。 经过测试,该功能可与具有混合分数/非分数比例的多个显示器一起使用。 与此同时, GTK 的合并请求也已打开并已合并,以添加分数比例支持。 Benjamin Otte 在合并中评论道:“分数比例协议只是一种跟踪表面比例的方法,而不是绘制分数内容的方法...
-
下一篇
unity-XCharts v3.6.0 已经发布,基于 UGUI 的数据可视化图表插件
unity-XCharts v3.6.0 已经发布,基于 UGUI 的数据可视化图表插件 此版本更新内容包括: v3.6.0 版本要点: 增加InputSystem支持 (by Bian-Sh) 增加官网在线示例多版本支持 (by SHL-COOL) 完善对VR的支持 (by Ambitroc) 增加UITable,UIStatistic等扩展UI组件 增加ItemStyle的MarkColor 增加通配符{h}的支持 优化Tooltip,Legend,DataZoom,Axis等组件 重构相关API接口,完善回调接口 修复若干问题 升级注意: 部分接口有调整,可根据提示更换下接口即可。 日志详情: (2023.04.01) 发布v3.6.0版本 (2023.03.14) 修复Tooltip的titleFormater设置{b}可能不生效的问题 (2023.03.14) 修复BarChart在数据为0时不绘制柱条背景的问题 (#250) (by Ambitroc) (2023.03.12) 增加LabelStyle的autoRotate可设置有角度的竖版文本的自动旋转 (2023.03...
相关文章
文章评论
共有0条评论来说两句吧...