-
DeepSeek 开源周回顾「GitHub 热点速览」
上周,DeepSeek 发布的开源项目用一个词形容就是:**榨干性能!**由于篇幅有限,这里仅列出项目名称和简介,感兴趣的同学可以前往 DeepSeek 的开源组织页面,深入探索每个项目的精彩之处! 第一天 FlashMLA:基于 Hopper GPU 的高效 MLA 解码内核 第二天 DeepEP:专为 MoE 和 EP 设计的高效通信库 第三天 Deep...
时间:2025-03-04点击:128收藏
-
谁动了我的SunEC?——记深夜排查SSL握手失败的惊魂一小时
文章首发公众号『风象南』 问题初现 某日下午,正在进行一个项目沟通会,团队A同学找到我 "昨天说的那个功能做好了,验证了下基本流程没问题,但是测试过程发现个问题,就是调用完我新加的那个方法后再次访问界面就失败了,服务端口、进程资源啥的都正常,我分析了下,暂时没找到问题,但是重启服务后再访问界面就没有问题。" 又说道:"新增的那个方法不是经常调用,也就配置初始...
时间:2025-03-04点击:95收藏
-
数据同步写Oracle表耗时25分钟缩短到23秒——SeaTunnel性能优化
本文主要给大家介绍JDBC Source批处理任务动态切分优化,希望大家批评指正 JDBC Source 如果配置了table_path 和 partition_column,引擎会对数据进行动态切分,可以通过分析样本数据优化切分区间,规避数据倾斜问题。 目前发现任务即使配置了where_condition,动态切分算法仍然会把数据进行全表切分,在从大表中读...
时间:2025-03-03点击:82收藏
-
IBM 完成 64 亿美元收购 HashiCorp 交易
IBM 公司近日完成了对基础设施自动化供应商 HashiCorp 公司 64 亿美元的收购。 两家公司最初预计将在 2024 年底前完成交易。延迟可能与反垄断监管机构对该交易的审查有关。去年,美国联邦贸易委员会 (FTC) 和英国竞争和市场管理局 (CMA) 都对这项收购进行了审查。 CMA 在周二批准了 IBM 收购 HashiCorp。据 TechCru...
时间:2025-03-03点击:60收藏
-
谷歌联合创始人督促员工一周工作 60 小时
谷歌联合创始人 Sergey Brin 在一份内部备忘录中督促从事 Gemini AI 产品相关工作的员工至少每个工作日都去办公室工作,并建议每周工作 60 小时,称这是生产力的最佳时间点。 Brin 警告,AI 的竞争在加速,而 AGI 的终赛即将到来。AGI 指 AI 将达到或超越人类智能。Brin 在备忘录中说,谷歌拥有赢得这场竞赛的所有要素,但必须加...
时间:2025-03-03点击:70收藏
-
软件供应链安全的研究方向
01 摘要 可复用的软件库、框架和组件(如开源生态系统和第三方供应商提供的)加速了数字创新。但近年来,攻击者利用这些软件制品发起软件供应链攻击的数量呈指数增长,比如**SolarWinds、log4j 和 xz utils**等知名攻击事件。 软件供应链攻击主要有三个途径:利用开源和第三方依赖组件漏洞注入恶意内容;在构建和部署过程中渗透构建基础架构;通过社会...
时间:2025-03-03点击:61收藏
-
百川智能在深圳以 3000 万元成立科技公司
天眼查资料显示,深圳百方智能科技有限公司于近日成立,法定代表人为谢剑;注册资本3000万人民币,超过了 98% 的广东省同行。 企业经营范围含计算机系统服务、人工智能应用软件开发、人工智能双创服务平台、人工智能理论与算法软件开发、人工智能基础软件开发、人工智能通用应用系统等。 股东信息显示,该公司由北京百川智能科技有限公司全资持股。
时间:2025-03-03点击:59收藏
-
verl —— HybridFlow 论文的开源实现
verl 是一个灵活、高效且可用于生产的 RL 训练库,适用于大型语言模型 (LLM)。 verl 是HybridFlow:一种灵活高效的 RLHF 框架论文的开源实现。 verl 灵活且易于使用: 轻松扩展各种 RL 算法:混合编程模型结合了单控制器和多控制器范式的优势,能够灵活地表示和高效执行复杂的训练后数据流。允许用户用几行代码构建 RL 数据流。 现...
时间:2025-03-03点击:139收藏
-
RWKV 社区 2 月动态:10 篇新学术论文!
欢迎大家收看《RWKV 社区最新动态》,本期内容收录了 RWKV 社区 2025 年 2 月的最新动态。 只需 3 分钟,快速了解 RWKV 社区 2 月都有哪些新鲜事! 2 月动态省流版(TL;DR) RWKV 学术研究动态 新论文:Activation Sparsity in Recurrent LLMs(RWKV 能效神经形态计算) 新论文:SNAP(...
时间:2025-03-03点击:76收藏
-
北京人工智能公共算力平台扩容,智算规模突破 10000P
“北京发布”公众号发文称,北京人工智能公共算力平台近日再次实现扩容,智算规模突破10000P,成为北京最大、国内领先的超大规模高性能单体智算集群,将有力支撑各类创新主体万亿参数级通用基础大模型一体化训练和推理。
时间:2025-03-03点击:59收藏
-
Worker模块源码实战:万字长文解析DolphinScheduler如何实现亿级任务调度
Apache DolphinScheduler的Worker模块是其分布式调度系统的核心组件之一,负责任务执行、资源管理及集群动态调度。本文将通过源码剖析,揭示其设计思想与实现细节. 1、Worker接收Master RPC请求架构图 Worker服务的Netty提供和Master JDK动态代理接口调用,请参考Dolphinscheduler告警模块解说,...
时间:2025-03-03点击:84收藏
-
DeepSeek 公布利润率——引发两家国产 AI Infra 公司创始人隔空互呛
3月1日,在“开源五连发”后,DeepSeek又来了一个“One More Thing”为开源周收官——首次披露了其模型推理系统DeepSeek-V3 / R1的技术细节及成本利润率。 根据DeepSeek公开的信息计算,它理论上一天的总收入为562027美元,成本利润率高达545%。 此次DeepSeek盈利数据公布后瞬间成为行业焦点,引发广泛讨论,尤其是...
时间:2025-03-03点击:78收藏