为什么亚马逊云数据库不讲 HTAP-低调大师

为什么亚马逊云数据库不讲 HTAP

2023-12-04 349

在 AWS re:Invent 2023 掌门人 Adam Selipsky 的 Keynote 上，数据库方面最重磅的主题是 Zero-ETL，从 TP 数据库 (RDS, Aurora, DynamoDB) 同步数据到 AP 数据库 (Redshift)。

Zero-ETL 是 AWS 在去年 re:invent 2022 上推出的概念，今年则继续增强。这里 AWS 没有选择另一条路线 HTAP （Hybrid Transactional/Analytical Processing)。如果搜索 AWS 官网，反倒是 TiDB 的 HTAP 方案更显眼。

而 TiDB, OceanBase 还是阿里云官网上的 HTAP 内容则要多得多

TiDB 更进一步，还主办了 HTAP Summit

AWS HTAP 的不选择

假设 AWS 要讲 HTAP 故事的话，首先会面临一个问题，到底是在 Aurora 里讲，还是在 Redshift 里讲。我们先来看一下 AWS 里数据库产品相关的组织架构。

大主管是 Swami 博士，统管了数据库，大数据以及AI/机器学习

数据库部门负责人 1，主要负责 Aurora + Redshift

数据库部门负责人 2，主要负责 RDS + DynamoDB

大数据部门负责人

AI / 机器学习部门负责人

Aurora 和 Redshift 两个产品都由同一个 VP 负责。但 Aurora 和 Redshift 都是 AWS 的拳头产品，可能也是 AWS 所有产品线里，综合营收和利润排在前五的两大产品。所以无论把 HTAP 放哪个，可能都会对另一个产生很大负面影响。

另外不仅是对于 Aurora 或者 Redshift 的影响，对于其他数据库产品也会有影响。如果讲了 HTAP，像 RDS, DynamoDB 这两个核心产品，它们同步到数仓的故事该怎么讲呢。

所以，综合下来，AWS 选择推出 zero-ETL 这个概念，打造一个连接器的品牌，这样让所有的数据库产品线都能获益。

TiDB, OceanBase HTAP 的选择

对于像 TiDB, OceanBase 这样的单一数据库厂商，推出一个 all-in-one 的 HTAP 方案也是比较合理的。毕竟手上就一个数据库产品，把它的能力做大做强。

像 OceanBase 在前不久发布会上讲的一体化数据库，一个数据库，解决 80% 问题。国外对标这块的有 SingleStore

SingleStore 之前的名字叫 MemSQL，2020 年改名的时候号称是全球第一款云原生 HTAP 数据库。

顺便提一嘴，当下很火的数据库 Neon 也是由 SingleStore 的联合创始人/CTO 创立的。

阿里云 HTAP 的选择

阿里云在许多方面都借鉴了 AWS，但在 HTAP 这个点上，看起来是选择了和 AWS 相反的道路。

对标 AWS Aurora 的 PolarDB 讲 HTAP

对标 AWS Redshift 的 ADB 也讲 HTAP

之前还推出过一个 HybridDB，专门讲 HTAP，现在已经下线了。

还有 RDS + ClickHouse 构建一站式 HTAP 的解决方案

南橘北枳

HTAP (Hybrid Transactional/Analytical Processing) 这个概念，其实国内远比国外要流行。可能这也确实和市场有关，国内大家想要一个大而全的东西，而国外大家更喜欢各自做好一块事情，然后连接起来。就像国内的飞书做成了 all-in-one 的庞然大物，国外 Slack 还是专注于 IM，Email/文档有 Google Workspace，HR 则有 Workday。

而即使是底层的数据库系统也不能免俗吧。

💡 更多资讯，请关注 Bytebase 公号：Bytebase

微信关注我们

原文链接：https://my.oschina.net/u/6148470/blog/10315956

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

深入理解HarmonyOS UIAbility：生命周期、WindowStage与启动模式探析

本文分享自华为云社区《深入理解HarmonyOS UIAbility：生命周期、WindowStage与启动模式探析》，作者：柠檬味拥抱。 UIAbility组件概述 UIAbility组件是HarmonyOS中一种包含UI界面的应用组件，主要用于与用户进行交互。每个UIAbility组件实例对应最近任务列表中的一个任务，可以包含多个页面来实现不同功能模块。声明配置为了使用UIAbility，首先需要在module.json5配置文件的abilities标签中声明UIAbility的相关信息，包括名称、入口、描述、图标等。 { "module": { // ... "abilities": [ { "name": "EntryAbility", // UIAbility组件的名称 "srcEntrance": "./ets/entryability/EntryAbility.ts", // UIAbility组件的代码路径 "description": "$string:EntryAbility_desc", // UIAbility组件的描述信息 "icon": ...

2023-12-04

357

本文深入探讨了机器学习中的混淆矩阵概念，包括其数学原理、Python实现，以及在实际应用中的重要性。我们通过一个肺癌诊断的实例来演示如何使用混淆矩阵进行模型评估，并提出了多个独特的技术洞见。文章旨在为读者提供全面而深入的理解，从基础到高级应用。关注TechLead，分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验，同济本复旦硕，复旦机器人智能实验室成员，阿里云认证的资深架构师，项目管理专业人士，上亿营收AI产品研发负责人。一、引言机器学习和数据科学中一个经常被忽视，但至关重要的概念是模型评估。你可能已经建立了一个非常先进的模型，但如果没有合适的评估机制，你就无法了解模型的效能和局限性。这就是混淆矩阵（Confusion Matrix）派上用场的地方。 1.1 什么是混淆矩阵？混淆矩阵是一种特定的表格布局，用于可视化监督学习算法的性能，特别是分类算法。在这个矩阵中，每一行代表实际类别，每一列代表预测类别。矩阵的每个单元格则包含了在该实际类别和预测类别下的样本数量。通过混淆矩阵，我们不仅可以计算出诸如准确度、精确度和召回率等评估指标，还可以更全面地...

2023-12-04

395

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。