Redis 存储对象信息是用 Hash 还是 String-低调大师

Redis 存储对象信息是用 Hash 还是 String

2021-05-20 577

Redis 内部使用一个 RedisObject 对象来表示所有的 key 和 value，RedisObject 中的 type，则是代表一个 value 对象具体是何种数据类型，它包含字符串（String）、链表（List）、哈希结构（Hash）、集合（Set）、有序集合（Sorted set）。

日常工作中我们存储对象信息的时候，一般有两种做法，一种是用 Hash 存储，另一种是 String 存储。但好像并没有所谓的最佳实践，那么实际上到底用什么数据结构存储更好呢？

首先简单回顾下，Redis 的 Hash 和 String 结构。

String

String 数据结构是简单的 key-value 类型，value 其实不仅是 String，也可以是数字。Redis 中的 String 可以表示很多语义：

字符串（bits）
整数
浮点数

这三种类型，Redis 会根据具体的场景完成自动转换，并且根据需要选取底层的承载方式。String 在Redis 内部存储默认就是一个字符串，被 RedisObject 所引用，当遇到 incr、decr 等操作时会转成数值型进行计算，此时 RedisObject 的 encoding 字段为int。

在存储过程中，我们可以将用户信息使用 Json 序列化成字符串，然后将序列化后的字符串存入 Redis 进行缓存。

由于 Redis 的字符串是动态字符串，可以修改，内部结构类似于 Java 的 ArrayList，采用预分配冗余空间的方式来减少内存的频繁分配。如上图所示，内部为当前字符串实际分配的空间 capacity，一般高于实际字符串长度 len。

假设我们要存储的结构是：

{
  "name": "xiaowang",
  "age": "35"
}

如果此时将此用户信息的 name 改为“xiaoli”，再存到 Redis 中，Redis 是不需要重新分配空间的。而且我们在读取和存储数据的时候只需要对做 Json 序列化与反序列化，比较方便。

Hash

Hash 在很多编程语言中都有着很广泛的应用，而在 Redis 中也是如此。在 Redis 中，Hash 常常用来缓存一些对象信息，如用户信息、商品信息、配置信息等，因此也被称为字典（dictionary），Redis 的字典使用 Hash table 作为底层实现，一个 Hash table 里面可以有多个哈希表节点，而每个哈希表节点保存了字典中的一个键值对。实际上，Redis 数据库底层也是采用 Hash table 来存储键值对的。

Redis 的 Hash 相当于 Java 的 HashMap，内部结构实现与 HashMap 一致，即数组+链表结构。只是 reHash 方式不一样。

前面说到 String 适合存储用户信息，而 Hash 结构也可以存储用户信息，不过是对每个字段单独存储，因此可以在查询时获取部分字段的信息，节省网络流量。不过 Redis 的 Hash 的值只能是字符串，存储上面的那个例子还好，如果存储的用户信息变为：

{
  "name": "xiaowang",
  "age": 25,
  "clothes": {
    "shirt": "gray",
    "pants": "read"
  }
}

那么该如何存储"clothes"属性又变成了该用 String 还是 Hash 的问题。

String 和 Hash 占用内存的比较

既然两种数据结构都可以存储结构体信息。到底哪种更加合适呢？

首先我们用代码先插入 10000 条数据，然后用可视化工具来看看内存的占用情况。

const Redis = require("ioRedis");
const Redis0 = new Redis({port: 6370});
const Redis1 = new Redis({port: 6371});


const user = {
  name: 'name12345',
  age: 16,
  avatar: 'https://dss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=256767015,24101428&fm=26&gp=0.jpg',
  phone: '13111111111',
  email: '1111111@11.email',
  lastLogon: '2021-04-28 10:00:00',
}


async function main() {
  for (let i = 0; i < 10000; i++) {
    await Redis0.set(`String:user:${i}`, Json.Stringify(user));
    await Redis1.hmset(`Hash:user:${i}`, user);
  }
}

main().then(process.exit);

先看 Redis0：

再来看看 Redis1：

可以看到还是有点差距的，但是差距并不明显。

网友讨论

网上的用户也有同样的疑问，因为值的长度是不确定的，所以不知道采用 String 还是 Hash 存储更有效率。

这里我主要给大家翻译下该问题下优质的答案：

适合用 String 存储的情况：

每次需要访问大量的字段
存储的结构具有多层嵌套的时候

适合用 Hash 存储的情况：

在大多数情况中只需要访问少量字段
自己始终知道哪些字段可用，防止使用 mget 时获取不到想要的数据

总结

本文主要介绍了Redis 存储对象信息是用 Hash 还是 String，建议是大部分情况下使用 String 存储就好，毕竟在存储具有多层嵌套的对象时方便很多，占用的空间也比 Hash 小。当我们需要存储一个特别大的对象时，而且在大多数情况中只需要访问该对象少量的字段时，可以考虑使用 Hash。

浅谈前端异常监控平台实现方案

异常捕获是改善软件质量的跟踪手段之一，常见的方式是记录日志，从日志分析异常问题进而跟进。对于前端项目来说，异常可能是后端接口数据导致，可能是前端本身业务逻辑问题导致，不管是什么导致的异常，只要能够精准的捕获到就能够分析出问题所在。可能有小伙说有测试阶段，全面的测试机制的确能够降低异常的出现，但是测试大部份情况是在非生产环境上进行的，覆盖面有限。日志是收集异常的最佳方式，一个异常监控平台就需要包括异常采集、异常存储、异常统计与分析、异常报告、异常告警，而对于一个通用平台来说，就需要项目管理、版本管理、团队管理、仓库管理等等。本文主要介绍一下异常采集需要考虑的问题，并跟大家分享两种现成的解决方案。异常介绍异常，是每种编程语言都需要考虑的一种结构，如何友好的跟踪异常而不影响生产环境上的业务，这就需要从项目开发到上线整个过程做一定的规范。下面就来谈谈前端的异常及处理方式。异常分类先来说说JavaScript的错误类型，ECMA-262 定义了 7 种错误类型，说明如下： Error：普通异常，通常与throw语句和try/catch语句一起使用，利用属性name可以声明或了解异常的类...

2021-05-19

607

摘要：想要对OCR进行性能优化，首先要了解清楚待优化的OCR网络的结构，本文从动机的角度来推演下基于Seq2Seq结构的OCR网络是如何一步步搭建起来的。本文分享自华为云社区《OCR性能优化系列（一）：BiLSTM网络结构概览》，原文作者：HW007。 OCR是指对图片中的印刷体文字进行识别，最近在做OCR模型的性能优化，用Cuda C将基于TensorFlow编写的OCR网络重写了一遍，最终做到了5倍的性能提升。通过这次优化工作对OCR网络的通用网络结构和相关的优化方法有较深的认识，计划在此通过系列博文记录下来，也作为对自己最近工作的一个总结和学习笔记。想要对OCR进行性能优化，首先要了解清楚待优化的OCR网络的结构，在本文中我将尝试着从动机的角度来推演下基于Seq2Seq结构的OCR网络是如何一步步搭建起来的。读懂此文的前提只需要了解在矩阵乘法中矩阵的维度变化规律，即n*p的矩阵乘以p*m的矩阵等于n*m的矩阵。如果知道CNN和RNN网络的结构，对机器学习模型的构造套路有点了解的话更好。首先给出从本文要剖析的OCR BILSTM网络总体结构如下图：接下来我将从这张图的右上...

2021-05-20

636

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。