HSE —— 美光开源存储引擎-低调大师

HSE —— 美光开源存储引擎

2022-11-29 630

HSE 是一个快速可嵌入的键值存储，专为 SSD 和持久化内存设计。HSE 通过协调跨 DRAM 和多类固态存储的数据放置，优化了性能和耐久性。

HSE 是支持数据库、软件定义存储（SDS）、高性能计算（HPC）、物联网（IoT）和机器学习（ML）的理想选择。

主要特征：

丰富的键值运算符集
用于优化单个数据存储中的混合用例工作负载的数据模型
键值压缩
灵活的耐久性控制
可配置的数据编排方案
可以嵌入任何应用程序的本地 C 库

优势：

每个存储可扩展到数 TB 的数据和数千亿个密钥
高效处理数千个并发操作
显着改善吞吐量、延迟、写放大、和读取放大
可选地组合多种固态存储类别，以优化性能和耐久性

构建 HSE

克隆 hse仓库并 checkout 最新的发布标签。此标签必须适用于 HSE 2.0 或更高版本。

例如

git clone https://github.com/hse-project/hse.git
cd hse
git checkout <release tag>

使用 Meson 和 Ninja 构建和安装。

可以在 meson.build 目录中找到构建 HSE 所需的最低版本的 Meson。在那里，你会在文件开头发现一个 meson_version 关键字参数的 project()函数。

如果你的系统没有提供足够新的 Meson 版本来构建 HSE，请参阅安装说明。

meson setup build
meson compile -C build
meson install -C build

微信关注我们

原文链接：https://www.oschina.net/p/hse

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

每日一博 | 字节跳动基于 Iceberg 的海量特征存储实践

背景字节跳动特征存储痛点当前行业内的特征存储整体流程主要分为以下四步：特征存储的整体流程业务在线进行特征模块抽取；抽取后的特征以行的格式存储在 HDFS，考虑到成本，此时不存储原始特征，只存抽取后的特征；字节跳动自研的分布式框架会将存储的特征并发读取并解码发送给训练器；训练器负责高速训练。字节跳动特征存储总量为EB级别，每天的增量达到 PB 级别，并且每天用于训练的资源也达到了百万核心，所以整体上字节的存储和计算的体量都是非常大的。在如此的体量之下，我们遇到了以下三大痛点：特征抽取周期长。在特征抽取上，当前采用的是在线抽取的方式。大量的算法工程师，每天都在进行大量的特征相关的试验。在当前的在线抽取模式下，如果有算法工程师想要调研一个新的特征，那么他首先需要定义特征的计算方式，等待在线模块的统一上线，然后需要等在线抽取的特征积累到一定的量级后才可以进行训练，从而判断这个特征是否有效果。这个过程通常需要2周甚至更长的时间。并且，如果发现特征的计算逻辑写错或想要更改计算逻辑，则需重复上述过程。在线特征抽取导致当前字节特征调研的效率非常低。基于当前的架构，离线特征调研的成本又...

2022-11-29

521

IEEE 发布了一项最新的调查结果，主要研究技术对 2023 及未来发展的影响。该调查基于来自美国、英国、中国、印度和巴西的 350 名首席技术官、首席信息官和 IT 主管等全球技术领导者的反馈。调查指出，云计算 (40%)、5G (38%)、元宇宙 (37%)、电动汽车 (EV) (35%) 和工业物联网 (IIoT) (33%) 将成为 2023 年最重要的五个技术领域。其中，元宇宙尚处于起步阶段；71% 的受访者认为“5G 和无处不在的连接”对推动元宇宙发展非常重要，还有 58% 的认为 VR 耳机和 AR 眼镜也同样重要。 2023 年受技术影响最大的行业部门有： (40%) 电信 (39%) 汽车和运输 (33%) 能源 (33%) 银行和金融服务另一方面，2023 年的网络安全问题也依旧是各方关注的重点。数据表明，2022 年上半年，全球共发生 28 亿次恶意软件攻击和 2.361 亿次勒索软件攻击。截至 2022 年底，预计将发起 60 亿次网络钓鱼攻击。技术领导者们对网络安全的关注更甚于往年，51% 的受访者将云漏洞列为头等大事 (高于 2022 年的 35%)，还...

2022-11-29

737

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。