首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/334678/seniors-working-on-a-legacy-project

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Grok 3 是否意味着大力出奇迹的大模型法则仍然成立?

本文转载自:https://zhuanlan.zhihu.com/p/24609799526 作者:张俊林​​(中科院软件所 博士) 媒体风向变化太快,让人目不暇接。早上还在夸Deepseek成本低,性价比高,预训练Scaling Law死了,不需要太多机器和GPU卡,性价比优先,英伟达休矣;中午Grok 3一出来,说是用了10万张英伟达H100卡,效果力压OpenAIo3 mini和Deepseek R1,就转向说Scaling law还成立,还需要大量的卡,英伟达股价有救了,还是要大力出奇迹…… 这两个观点明显对立,有一真必有一假,那事实的真相到底是啥呢?我们来推一推。 一、预训练阶段的Scaling Law是否仍然成立 -预训练阶段的Scaling Law成立吗?当然是成立的,所谓“Scaling Law撞墙”,大家普遍遇到的问题是数据不够了,没有大量新数据,导致预训练阶段的Scaling Law走势趋缓,注意是趋缓但不是停顿,预训练阶段的Scaling Law并没到天花板。按照Chinchilla Scaling Law推断,即使没有新数据,也并不意味着模型效果提不上去了,很简...

没有所谓的 1875 纪元,美国 150 多岁老人领社保福利不是 COBOL 语言的锅

近期,一位美国政府官员曾宣称:“我们这里有些人看起来都已经150岁了”,并指出这些人正在领取社会保障福利。由此,有人开始流传这样一种说法:社会保障局(SSA)在存储日期时使用了一个1875年的纪元,把那些未知出生年份的记录存为0,从而默认显示为1875年。 这种观点的起源可以追溯到某个帖子,帖子中有人调侃道: “看起来埃隆那群天才程序员根本就不懂COBOL的工作原理。社会保障系统正是运行在COBOL上,而COBOL并没有专门的日期或时间类型。于是日期就以数字形式存储,按照ISO 8601标准计算,纪元定在了150年前(1875年)——也就是米制标准的开始。结果如果不知道某个日期,就会存储成0,而在COBOL中这就会默认解析为1875年,也就是150年前。” 然而,笔者对此并不认同,主要基于以下几点理由: 数据库中存在1875年前的出生年份 2007年,社会保障局曾发布过一份数据集,该数据集包含了在2007年1月之前发放的社会保障号码持有者的收入记录(约占全部数据的1%)。在这份数据集中,他们明确说明: 移除了出生年份早于1870年的5,935条记录 移除了出生年份等于2007的1,09...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。