首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://my.oschina.net/u/7819858/blog/15574514

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

社区供稿 | 如何让大模型输出 10k+ 字长文?

随着大语言模型的发展,许多模型已经能够处理超过100k+ tokens的输入上下文。然而,这些模型在生成长文本时,普遍存在输出长度受限的问题。 在实际应用中,为了克服这个问题,人们普遍采用「分而治之」的方法,让模型一段一段地写。这种方法在一定程度上似乎能够解决长文本输出的问题,但往往会导致 1)消耗 tokens 量成倍甚至指数增加;2)前后内容不连贯。 如何才能让模型拥有更强的长文本输出能力呢?我们发现,模型输出长度受限的主要原因在于,监督微调(SFT)数据集缺乏足够长的输出样例。 针对这一问题,我们构建了一个 6000 多条2k-20k words 不等的长输出数据集 LongWriter-6k,并在此基础上,对 GLM-4-9B 进行SFT微调和DPO对齐。新的模型拥有了能够生成超过10,000字/词连贯文本的能力。 下面是我们用 LongWriter-9B 模型,以「黑神话 · 悟空」为题撰写的玄幻小说。 > prompt:请帮我撰写一个主题为「黑神话·悟空」玄幻小说,小说以孙悟空为核心,讲述一个桀骜不驯,打怪升级,追逐梦想的玄幻故事,不少于 10000 字 完整视频可查...

IntelliJ IDEA 2024.2.1 发布

IntelliJ IDEA 2024.2.1 现已发布。此版本支持多种Java 23 语言特性,包括模块导入声明,基本 Markdown 注释,patterns、instanceof和switch中的原始类型,以及其他次要的 JEP。 一些值得注意的更新: 在 macOS 上打开终端时,IDE 不再崩溃。[IJPL-157074] 当安装路径中存在non-ASCII字符时,IDE 不再无法启动。[IJPL-156417,IJPL-35364] IDE 现在可以正确识别java-test-fixtures生成的测试源。[IDEA-353172] IDE 现在可以在关闭时更快地保存项目,从而解决偶尔出现延迟的问题。[IJPL-148614] 对于 Spring 项目中@ModelAttribute的 MVC 路径变量,检查又能正常工作了。[IDEA-347097] 启用 GitLab 插件后,用户可以在合并来自同一分支的先前请求后再次打开新的合并请求。[IJPL-81309] JPA Buddy 工具栏中的 Actions 再次正常工作。[IDEA-356485] 数字和字母动态变量现在可...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Apache Tomcat

Apache Tomcat

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Eclipse

Eclipse

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。

JDK

JDK

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。