首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/386825

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

《北京人工智能产业白皮书(2025)》发布:全年核心产值预计突破 4500 亿元

北京市科学技术委员会、中关村科技园区管理委员会正式发布《北京人工智能产业白皮书(2025)》。数据显示,2025年上半年,本市人工智能核心产业规模达2152.2亿元,同比增长25.3%。据初步估算,全年产业规模有望超过4500亿元,产业发展实现量质齐升。 《白皮书》显示,北京人工智能产业生态日趋完善。截至目前,全市人工智能企业数量超过2500家,已备案大模型达183款,持续保持全国领先。 在创新方面,清华大学戴琼海院士团队、北京邮电大学徐坤教授团队、中国科学院自动化所李国齐教授团队等取得重大原创性突破。北京智源人工智能研究院、北京通用人工智能研究院等机构也发布了多项前沿成果。豆包、文心一言等大模型在权威测评中表现优异。 市科委、中关村管委会相关负责人表示,北京将持续推进教育、科技、人才一体化发展,致力于强化策源能力、拓展应用范围、打造产业集群,全面巩固和提升其作为“人工智能第一城”的引领地位。

字节跳动发布 Vidi2:120 亿参数,让视频编辑彻底自动化

字节跳动发布了其最新的多模态大语言模型 Vidi2,一个拥有120亿参数、专用于视频理解的AI模型。该模型能够处理数小时长的原始素材,理解其中的故事脉络,并根据简单提示生成完整的TikTok短视频或电影片段,被视为对现有视频编辑行业的重大颠覆。 Vidi2的关键在于其视频理解能力。新模型新增了精细的时空定位(STG)功能,能够同时识别视频中的时间戳和目标对象的边界框。给定文本查询,Vidi2不仅能找到对应的时间段,还能在这些时间范围内准确标记出具体物体的位置。 在技术细节上: 时空定位:模型返回“管道”(时间索引边界框),以一秒粒度跟踪指定对象和人物,直接支持编辑,例如在人群中跟踪特定人物。 技术架构:Vidi2升级使用Gemma-3作为主干网络,并辅以重新设计的自适应标记压缩技术,确保在处理长视频时保持效率而不丢失关键细节。 在用于开放式时间检索的 VUE-TR-V2基准上,Vidi2 总体 IoU 达到48.75,尤其在超长视频(超过1小时)上的表现比商业模型领先17.5个百分点。在定位任务(VUE-STG)上,模型也取得了vIoU32.57和tIoU53.19的最佳性能。 字节跳...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Oracle

Oracle

Oracle Database,又名Oracle RDBMS,或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。