-
探索 Snowflake 与 Databend 的云原生数仓技术与应用实践 | Data Infra NO.21 回顾(含资料发布)
上周六,第二十一期「Data Infra 研究社」在线上与大家相见。活动邀请到了西门子数据分析师陈砚林与 Databend 联合创始人王吟,为我们带来了一场关于 Snowflake 和 Databend 的技术探索。Snowflake,这个市值曾超过 700 亿美元的云原生数据仓库巨头,以其独特的存储与计算分离架构,正在改变传统数据仓库的面貌。尽管进入中国比...
时间:2024-09-26点击:76收藏
-
🔥 追随 HarmonyOS NEXT,Solon v3.0 将在 10 月 8 日发布
Solon (开放原子开源基金会,孵化项目)原计划10月1日发布 v3.0 正式版。看到 HarmonyOS NEXT 将在 10月8日启用公测,现改为10月8日发布以示庆贺。另外,Solon 将在2025年启动“仓颉”版开发(届时,将会有 Solon-Java 和 Solon-CJ 两个版本)。 在架构上,Solon 不依赖于 Java-EE 接口:有效避...
时间:2024-09-26点击:91收藏
-
Mozilla 被控未经同意在 Firefox 中跟踪用户
欧洲知名隐私倡导组织 NOYB(None Of Your Business)向奥地利数据保护监管机构(DSB)对 Mozilla 提起了隐私投诉,指控该公司使用 Firefox 隐私功能(未经同意启用)来跟踪用户的在线行为。 该功能名为“隐私保护归因”(Privacy Preserving Attribution,PPA),由 Firefox 与 Meta ...
时间:2024-09-26点击:97收藏
-
Elasticsearch:使用 ES|QL 进行地理空间搜索
作者:来自 ElasticCraig Taverner 多年来,Elasticsearch 一直具有强大的地理空间搜索和分析功能,但其 API 与典型的 GIS 用户习惯的 API 截然不同。在过去的一年中,我们添加了 ES|QL 查询语言,这是一种管道查询语言,与 SQL 一样简单,甚至更简单。它特别适合 Elastic 擅长的搜索、安全性和可观察性用例。...
时间:2024-09-26点击:131收藏
-
巧用时间换空间:解读 ArcGraph 如何灵活应对有限内存下的图分析
导读:ArcGraph 是一款云原生架构、存查分析一体化的分布式图数据库。本文将详细解读 ArcGraph 如何灵活应对有限内存下的图分析。 01 引言 在图分析技术广泛应用的当下,学术界和各大图数据库厂商热衷于提升图分析技术的高性能指标。然而,追求高性能计算的过程中,常采用"以空间换时间"的方式,即通过增大内存使用量来加速计算。但现阶段外存图计算尚不成熟,...
时间:2024-09-26点击:75收藏
-
老牌经典音乐播放器 Winamp 正式开源
多媒体播放器 Winamp 兑现了在今年 5 月份的承诺,于近日正式在 GitHub 上发布了其Windows 端的源代码,允许开发人员改进和更新播放器以满足当前用户的需求。 “Winamp 将开放其代码供 Windows 播放器使用,让整个社区都能参与其开发......Winamp 已不仅仅是一个音乐播放器。它体现了独特的数字文化、美学和用户体验。通过开源...
时间:2024-09-26点击:127收藏
-
IntelliJ IDEA 2024.2.3 发布
IntelliJ IDEA 2024.2.3 现已发布,一些值得注意的更新包括: 通过工具设置添加的远程工具在 IDE 重启时再次可见。[IJPL-161201] 设置中的 JSON Schema Mappings 现在可按预期加载。[IJPL-160634] 对于 Windows 上的 remote interpreter users 来说,安装了 Pyt...
时间:2024-09-26点击:106收藏
-
真正智慧的 ORM 框架 sqltoy-orm 5.6.24 发版
开源地址: github:https://github.com/sagframe/sagacity-sqltoy gitee:https://gitee.com/sagacity/sagacity-sqltoy idea 插件 (可直接在 idea 中检索安装):https://github.com/imyuyu/sqltoy-idea-plugin sql...
时间:2024-09-26点击:106收藏
-
智源研究院发布中文互联网语料库 CCI3.0
近日,智源研究院正式发布中文互联网语料库 CCI 3.0 (Chinese Corpora Internet,简称 CCI),包括 1000GB 的数据集以及 498GB 的高质量子集 CCI 3.0-HQ。 智源研究院于 2023 年 11 月首次开源 CCI 1.0,并在 2024 年 4 月发布 CCI 2.0。目前,CCI 系列数据集下载量已超过 4...
时间:2024-09-26点击:91收藏
-
袋鼠云数据资产平台:数据模型标准化建表重构升级
数据模型是什么?简单来说,数据模型是用来组织和管理数据的一种方式。它为构建高效且可靠的信息系统提供了基础,不仅决定了如何存储和管理数据,还直接影响系统的性能和可扩展性。 想要建立一个良好的数据模型,设计时需要优先考虑数据的关系和规范化,避免出现数据冗余和不一致的问题,减少数据维护的难度。 正是基于这样的需求,袋鼠云数据资产平台中的数据模型提供了一种标准化建表...
时间:2024-09-26点击:67收藏
-
数据资产管理实施路径盘点,一文读懂如何建设企业数据资产管理体系
完备的企业数据资产管理体系,首先依赖于数据资产管理规划及机制等上层设计,其次基于数据资产管理职能,使用有效的数据资产管理工具,将数据转化为数据资产,从而把数据价值真正发挥出来。数据资产管理架构如下图所示: 具体而言,数据资产管理包括数据开发、数据标准管理、数据质量管理、数据治理、数据资产评估、数据资产流通、数据资产运营、数据安全管理和数据消费九大版块,贯穿数...
时间:2024-09-26点击:88收藏
-
百度搜索结果波动的极致治理
作者 | ZZ 导读 本文讲述百度搜索系统面临搜索结果一致性的挑战,如何准确衡量并消除不一致因素成为关键问题。本文介绍了百度搜索系统针对结果波动问题的创新解决方案,通过设计数据打平技术,将问题量化至服务与特征层面,并利用fake流量与动态debug机制进行大量实验与数据收集。同时,采用多实验统筹与自动巡检机制提高实验效率与分析自动化,最终成功捕获所有对结果波...
时间:2024-09-26点击:89收藏