首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/366219

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

英伟达发布包含 300 万条高质量样本的视觉语言模型训练数据集

英伟达发布了一个包含300万高质量样本的视觉语言模型训练数据集,以支持OCR、VQA和图像字幕生成等多种应用。 数据集构成 67.0% 视觉问答(VQA)样本 28.4% OCR 样本 4.6% 图像描述(Captioning)样本 主要用途 文档理解:支持复杂版面、表格、图文混排的 OCR 与内容提取。 企业级 AI 开发:数据已清除版权限制,可直接商用。 模型训练支持:配套 NVIDIA NeMo Curator 工具,便于进一步清洗和定制。 数据来源与构建方式 基于开源数据集重新标注,确保可商用; 使用 NVIDIA 自研模型进行增强,如加入链式思考(Chain-of-Thought)解释、模板化问答生成、答案扩展等; 提供中英双语的 OCR 数据,涵盖字符级、词级、页面级标注。 模型配套 该数据集是 Llama 3.1 Nemotron Nano VL 8B 模型的训练基础,该模型在 OCRBench V2、DocVQA、ChartQA 等基准测试中表现领先,已作为 NVIDIA NIM API 和 Hugging Face 模型库的一部分开放使用。 如需获取数据集,可直接访问...

马斯克必须面对 OpenAI 提出的骚扰指控

OpenAI 此前在诉状中指称,埃隆·马斯克(Elon Musk)在法庭内外对公司展开了“长达数年的骚扰行动”。一名联邦法官已裁定,马斯克必须面对这一指控。 当地时间本周二,美国地方法院法官伊冯·冈萨雷斯·罗杰斯(Yvonne Gonzalez Rogers)驳回了马斯克的一项请求。OpenAI指控马斯克利用法律诉讼、社交媒体发文及媒体言论等手段意图打压公司,从而为他自己创办的生成式人工智能公司xAI争取竞争优势,而马斯克请求法官驳回的正是这些指控。 此项裁决为双方始于去年的法律战带来了最新转折。当时,马斯克指控OpenAI背弃非营利组织的创立初衷,2019年也就是马斯克离开OpenAI董事会的次年,开始从微软接受数十亿美元的投资。马斯克本人则在2023年创立了xAI公司。 罗杰斯法官并未就OpenAI反诉状中“马斯克试图持续打压公司”的指控本身作出实质性评判,但她裁定,OpenAI于今年4月份提交的反诉在法律上理由充分,可以继续推进。此外,罗杰斯法官还驳回了马斯克针对OpenAI和微软的部分指控。 法官指出,双方都互相指责对方虚伪。她在裁决书中写道:“双方的博弈伎俩昭然若揭,各自都出...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。