腾讯公布大语言模型训练专利:可提高模型的准确性
天眼查App显示,腾讯科技(深圳)有限公司申请的“大语言模型的训练方法、装置、计算机设备及存储介质”专利正式公布。
摘要显示,在该方法中,通过在大语言模型的训练过程中引入第一摘要文本和第二摘要文本,为模型训练提供了更多可学习信息,同时由于第一摘要文本和第二摘要文本包含的信息量不同,且第一摘要文本中包含正确语句和错误语句,通过对同一样本文本的两个不同摘要文本进行对比学习,并区分学习第一摘要文本中的正确语句和错误语句,避免了由于摘要文本单一而导致的模型过拟合和生成不准确等问题,不仅提高了模型的泛化性能,还提高了模型的准确性。
有媒体分析称,腾讯的专利通过多样化摘要文本及对比机制,为模型提供了更贴近真实应用的学习环境,尤其对智能客服、内容生成等需高精度输出的领域具有直接意义。此外,该技术或能加速大模型落地进程。例如,在短文本对话场景中,腾讯曾推出基于混合注意力机制的对话模型专利,若结合新训练方法,有望进一步提升回复的相关性与丰富性。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
马斯克团队被曝用 AI 技术调查美联邦部门开支
据央视新闻报道,美国《华盛顿邮报》援引两名知情人士的消息报道,埃隆·马斯克领导的政府效率部团队已在使用人工智能(AI)软件,对美国教育部敏感数据进行梳理,以调查该部门开支情况。 这些数据包括可辨别管理拨款人员身份的信息以及教育部内部敏感财务数据。 政府效率部团队正用微软Azure云服务平台提供的人工智能软件审核教育部拨发的每一笔钱,包括合同、拨款和差旅费。Azure提供多家公司研发的AI软件,暂不确定政府效率部使用哪一款软件。 值得注意的是,该局副局长泰德・卡斯滕森拒绝接受马斯克团队为联邦雇员提供的“买断计划”延迟辞职方案,选择直接辞职。 特朗普政府于1月28日启动该计划,承诺向自愿离职的联邦雇员提供相当于8个月薪资的补偿(薪酬与福利持续至9月30日),并要求参与者在2月6日前提交申请。 截至2月6日,已有超6万名联邦雇员接受补偿方案,约占230万文职雇员的3%,远低于马斯克设定的10%减员目标。
- 下一篇
DeepSeek 官网全球日访问量超越谷歌 Gemini
据 SimilarWeb 数据显示,DeepSeek.com 的日访问量已经超过了谷歌的 Gemini 和 Character.AI。 报告显示 DeepSeek 的 V3 模型在第三方基准测试中表现优于 Meta 的 Llama 3.1、OpenAI 的 GPT-4o 以及阿里巴巴的 Qwen 2.5,且成本显著更低,这使得 DeepSeek 的热度急剧攀升。 SimilarWeb 的数据显示,DeepSeek.com 在上周二(1 月 27 日)创下了 4900 万次访问量的纪录,与前一周相比增长了 614%。 这一数字不包括基于应用的流量,足以凸显 DeepSeek 的迅猛发展势头。一个月前,该网站的日均访问量仅为 30 万次,而到了 1 月 27 日,这一数字飙升至 3340 万次,并引发了美国科技股的波动。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS7设置SWAP分区,小内存服务器的救世主
- Mario游戏-低调大师作品
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- 2048小游戏-低调大师作品
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题