HSE —— 美光开源存储引擎
HSE 是一个快速可嵌入的键值存储,专为 SSD 和持久化内存设计。HSE 通过协调跨 DRAM 和多类固态存储的数据放置,优化了性能和耐久性。
HSE 是支持数据库、软件定义存储(SDS)、高性能计算(HPC)、物联网(IoT)和机器学习(ML)的理想选择。
主要特征:
- 丰富的键值运算符集
- 用于优化单个数据存储中的混合用例工作负载的数据模型
- 键值压缩
- 灵活的耐久性控制
- 可配置的数据编排方案
- 可以嵌入任何应用程序的本地 C 库
优势:
- 每个存储可扩展到数 TB 的数据和数千亿个密钥
- 高效处理数千个并发操作
- 显着改善吞吐量、延迟、写放大、 和读取放大
- 可选地组合多种固态存储类别,以优化性能和耐久性
构建 HSE
克隆 hse
仓库并 checkout 最新的发布标签。 此标签必须适用于 HSE 2.0 或更高版本。
例如
git clone https://github.com/hse-project/hse.git cd hse git checkout <release tag>
使用 Meson 和 Ninja 构建和安装。
可以在 meson.build 目录中找到构建 HSE 所需的最低版本的 Meson。 在那里,你会在文件开头发现一个 meson_version
关键字参数的 project()
函数。
如果你的系统没有提供足够新的 Meson 版本来构建 HSE,请参阅安装说明 。
meson setup build meson compile -C build meson install -C build

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
每日一博 | 字节跳动基于 Iceberg 的海量特征存储实践
背景 字节跳动特征存储痛点 当前行业内的特征存储整体流程主要分为以下四步: 特征存储的整体流程 业务在线进行特征模块抽取; 抽取后的特征以行的格式存储在 HDFS,考虑到成本,此时不存储原始特征,只存抽取后的特征; 字节跳动自研的分布式框架会将存储的特征并发读取并解码发送给训练器; 训练器负责高速训练。 字节跳动特征存储总量为EB级别,每天的增量达到 PB 级别,并且每天用于训练的资源也达到了百万核心,所以整体上字节的存储和计算的体量都是非常大的。在如此的体量之下,我们遇到了以下三大痛点: 特征抽取周期长。在特征抽取上,当前采用的是在线抽取的方式。大量的算法工程师,每天都在进行大量的特征相关的试验。在当前的在线抽取模式下,如果有算法工程师想要调研一个新的特征,那么他首先需要定义特征的计算方式,等待在线模块的统一上线,然后需要等在线抽取的特征积累到一定的量级后才可以进行训练,从而判断这个特征是否有效果。这个过程通常需要2周甚至更长的时间。并且,如果发现特征的计算逻辑写错或想要更改计算逻辑,则需重复上述过程。在线特征抽取导致当前字节特征调研的效率非常低。基于当前的架构,离线特征调研的成本又...
- 下一篇
IEEE:2023 网络安全威胁不断,云计算/5G /元宇宙是最重要的技术领域
IEEE 发布了一项最新的调查结果,主要研究技术对 2023 及未来发展的影响。该调查基于来自美国、英国、中国、印度和巴西的 350 名首席技术官、首席信息官和 IT 主管等全球技术领导者的反馈。 调查指出,云计算 (40%)、5G (38%)、元宇宙 (37%)、电动汽车 (EV) (35%) 和工业物联网 (IIoT) (33%) 将成为 2023 年最重要的五个技术领域。其中,元宇宙尚处于起步阶段;71% 的受访者认为“5G 和无处不在的连接”对推动元宇宙发展非常重要,还有 58% 的认为 VR 耳机和 AR 眼镜也同样重要。 2023 年受技术影响最大的行业部门有: (40%) 电信 (39%) 汽车和运输 (33%) 能源 (33%) 银行和金融服务 另一方面,2023 年的网络安全问题也依旧是各方关注的重点。数据表明,2022 年上半年,全球共发生 28 亿次恶意软件攻击和 2.361 亿次勒索软件攻击。截至 2022 年底,预计将发起 60 亿次网络钓鱼攻击。技术领导者们对网络安全的关注更甚于往年,51% 的受访者将云漏洞列为头等大事 (高于 2022 年的 35%),还...
相关文章
文章评论
共有0条评论来说两句吧...