腾讯公布大语言模型训练专利：可提高模型的准确性-低调大师

腾讯公布大语言模型训练专利：可提高模型的准确性

2025-02-08 300

天眼查App显示，腾讯科技（深圳）有限公司申请的“大语言模型的训练方法、装置、计算机设备及存储介质”专利正式公布。

摘要显示，在该方法中，通过在大语言模型的训练过程中引入第一摘要文本和第二摘要文本，为模型训练提供了更多可学习信息，同时由于第一摘要文本和第二摘要文本包含的信息量不同，且第一摘要文本中包含正确语句和错误语句，通过对同一样本文本的两个不同摘要文本进行对比学习，并区分学习第一摘要文本中的正确语句和错误语句，避免了由于摘要文本单一而导致的模型过拟合和生成不准确等问题，不仅提高了模型的泛化性能，还提高了模型的准确性。

有媒体分析称，腾讯的专利通过多样化摘要文本及对比机制，为模型提供了更贴近真实应用的学习环境，尤其对智能客服、内容生成等需高精度输出的领域具有直接意义。此外，该技术或能加速大模型落地进程。例如，在短文本对话场景中，腾讯曾推出基于混合注意力机制的对话模型专利，若结合新训练方法，有望进一步提升回复的相关性与丰富性。

微信关注我们

原文链接：https://www.oschina.net/news/332678

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

马斯克团队被曝用 AI 技术调查美联邦部门开支

据央视新闻报道，美国《华盛顿邮报》援引两名知情人士的消息报道，埃隆·马斯克领导的政府效率部团队已在使用人工智能（AI）软件，对美国教育部敏感数据进行梳理，以调查该部门开支情况。这些数据包括可辨别管理拨款人员身份的信息以及教育部内部敏感财务数据。政府效率部团队正用微软Azure云服务平台提供的人工智能软件审核教育部拨发的每一笔钱，包括合同、拨款和差旅费。Azure提供多家公司研发的AI软件，暂不确定政府效率部使用哪一款软件。值得注意的是，该局副局长泰德・卡斯滕森拒绝接受马斯克团队为联邦雇员提供的“买断计划”延迟辞职方案，选择直接辞职。特朗普政府于1月28日启动该计划，承诺向自愿离职的联邦雇员提供相当于8个月薪资的补偿（薪酬与福利持续至9月30日），并要求参与者在2月6日前提交申请。截至2月6日，已有超6万名联邦雇员接受补偿方案，约占230万文职雇员的3%，远低于马斯克设定的10%减员目标。

2025-02-08

316

据 SimilarWeb 数据显示，DeepSeek.com 的日访问量已经超过了谷歌的 Gemini 和 Character.AI。报告显示 DeepSeek 的 V3 模型在第三方基准测试中表现优于 Meta 的 Llama 3.1、OpenAI 的 GPT-4o 以及阿里巴巴的 Qwen 2.5，且成本显著更低，这使得 DeepSeek 的热度急剧攀升。 SimilarWeb 的数据显示，DeepSeek.com 在上周二（1 月 27 日）创下了 4900 万次访问量的纪录，与前一周相比增长了 614%。这一数字不包括基于应用的流量，足以凸显 DeepSeek 的迅猛发展势头。一个月前，该网站的日均访问量仅为 30 万次，而到了 1 月 27 日，这一数字飙升至 3340 万次，并引发了美国科技股的波动。

2025-02-08

255

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。