首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/309608

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

如何让大模型输出 10k+ 字长文?

随着大语言模型的发展,许多模型已经能够处理超过100k+ tokens的输入上下文。然而,这些模型在生成长文本时,普遍存在输出长度受限的问题。 在实际应用中,为了克服这个问题,人们普遍采用「分而治之」的方法,让模型一段一段地写。这种方法在一定程度上似乎能够解决长文本输出的问题,但往往会导致 1)消耗 tokens 量成倍甚至指数增加;2)前后内容不连贯。 如何才能让模型拥有更强的长文本输出能力呢?我们发现,模型输出长度受限的主要原因在于,监督微调(SFT)数据集缺乏足够长的输出样例。 针对这一问题,我们构建了一个 6000 多条2k-20k words 不等的长输出数据集 LongWriter-6k,并在此基础上,对 GLM-4-9B 进行SFT微调和DPO对齐。新的模型拥有了能够生成超过10,000字/词连贯文本的能力。 下面是我们用 LongWriter-9B 模型,以「黑神话 · 悟空」为题撰写的玄幻小说。 > prompt:请帮我撰写一个主题为「黑神话·悟空」玄幻小说,小说以孙悟空为核心,讲述一个桀骜不驯,打怪升级,追逐梦想的玄幻故事,不少于 10000 字 完整视频可查...

开源日报 | Elastic三年前飞出的“回旋镖”;米哈游蔡浩宇新AI公司曝光;FreeBSD讨论使用Rust;国产RISC-V芯崛起;机器“人”走入家庭还有多远?

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。 # 2024.8.30 今日要闻 Elastic被三年前飞出的“回旋镖”打到了 Elastic 公司创始人兼首席技术官 Shay Banon 今日发表官方博客《Elasticsearch is open source, again》,宣布为旗下两大核心产品 ——Elasticsearch 搜索引擎和 Kibana 可视化平台添加 AGPL 作为另一个许可证选项,与 ELv2 和 SSPL 并列。 米哈游蔡浩宇新AI公司曝光,挖Llama 3科学家坐镇大模型 米哈游创始人蔡浩宇,“退休”后新AI创业项目曝光,起因竟是他在网上发的一条“暴论”。AIGC已经彻底改变了游戏开发……大部分从业者可以考虑转行了。 新公司名为Anuttacon,要用AI为游戏玩家创造前所未有的体验,突破互动娱乐的界限。 FreeBSD 社区大讨论:基础系统中使用 Rust FreeBSD 社区正在讨论是否将 Rust 语言纳入基础系统(base system),以改善系统的安全性和可维护性。 与 Linux 不同,FreeBSD 操作系统内核和用户空间...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

用户登录
用户注册