HSF/Dubbo序列化时的LocalDateTime, Instant的性能问题-低调大师

HSF/Dubbo序列化时的LocalDateTime, Instant的性能问题

2019-06-13 650

来源

在对Dubbo新版本做性能压测时，无意中发现对用例中某个TO（Transfer Object）类的一属性字段稍作修改，由Date变成LocalDateTime，结果是吞吐量由近5w变成了2w，RT由9ms升指90ms。

在线的系统，拼的从来不仅仅是吞吐量，
而是在保证一定的RT基础上，再去做其他文章的，也就是说应用的RT是我们服务能力的基石所在，拿压测来说，我们能出的qps/tps容量，必须是应用能接受的RT下的容量，而不是纯理论的数据，在集团云化的过程中计算过，底层服务的RT每增加0.1ms，在应用层就会被放大，

整体的成本就会上升10%以上。

要走向异地，首先要面对的阿喀琉斯之踵：延时，长距离来说每一百公里延时差不多在1ms左右，杭州和上海来回的延迟就在5ms以上，上海到深圳的延迟无疑会更大，延时带来的直接影响也是响应RT变大，
用户体验下降，成本直线上升。如果一个请求在不同单元对同一行记录进行修改，即使假定我们能做到一致性和完整性，那么为此付出的代价也是非常高的，想象一下如果一次请求需要访问
10 次以上的异地 HSF 服务或 10 次以上的异地 DB调用, 服务再被服务调用，延时就形成雪球，越滚越大了。

普遍性

关于时间的处理应该是无处不在，可以说离开了时间属性，99.99%的业务应用都无法支持其意义，特别是像监控类的系统中更是面向时间做针对性的定制处理。

在JDK8以前，基本是通过java.util.Date来描述日期和时刻，java.util.Calendar来做时间相关的计算处理。JDK8引入了更加方便的时间类，包括Instant，LocalDateTime、OffsetDateTime、ZonedDateTime等等，总的说来，时间处理因为这些类的引入而更加直接方便。

Instant存的是UTC的时间戳，提供面向机器时间视图，适合用于数据库存储、业务逻辑、数据交换、序列化。LocalDateTime、OffsetDateTime、ZonedDateTime等类结合了时区或时令信息，提供了面向人类的时间视图，用于向用户输入输出，同一个时间面向不同用户时，其值是不同的。比如说订单的支付、发货时间买卖双方都用本地时区显示。可以把这3个类看作是一个面向外部的工具类，而不是应用程序内部的工作部分。

简单说来，Instant适用于后端服务和数据库存储，而LocalDateTime等等适用于前台门面系统和前端展示，二者可以自由转换。这方面，国际化业务的同学有相当多的体感和经验。

在HSF/Dubbo的服务集成中，无论是Date属性还是Instant属性肯定是普遍的一种场景。

问题复现

Instant等类的性能优势

以常见的格式化场景举例

    @Benchmark
    @BenchmarkMode(Mode.Throughput)
    public String date_format() {
        Date date = new Date();
        return new SimpleDateFormat("yyyyMMddhhmmss").format(date);
    }

    @Benchmark
    @BenchmarkMode(Mode.Throughput)
    public String instant_format() {
        return Instant.now().atZone(ZoneId.systemDefault()).format(DateTimeFormatter.ofPattern(
                "yyyyMMddhhmmss"));
    }

在本地通过4个线程来并发运行30秒做压测，结果如下。

Benchmark                            Mode  Cnt        Score   Error  Units
DateBenchmark.date_format           thrpt       4101298.589          ops/s
DateBenchmark.instant_format        thrpt       6816922.578          ops/s

可见，Instant在format时性能方面是有优势的，事实上在其他操作方面（包括日期时间相加减等）都是有性能优势，大家可以自行搜索或写代码测试来求解。

Instant等类在序列化时的陷阱

针对Java自带，Hessian(淘宝优化版本)两种序列化方案，压测序列化和反序列化的处理性能。

Hessian是集团内应用的HSF2.2和开源的Dubbo中默认的序列化方案。

    @Benchmark
    @BenchmarkMode(Mode.Throughput)
    public Date date_Hessian() throws Exception {
        Date date = new Date();
        byte[] bytes = dateSerializer.serialize(date);
        return dateSerializer.deserialize(bytes);
    }

    @Benchmark
    @BenchmarkMode(Mode.Throughput)
    public Instant instant_Hessian() throws Exception {
        Instant instant = Instant.now();
        byte[] bytes = instantSerializer.serialize(instant);
        return instantSerializer.deserialize(bytes);
    }

    @Benchmark
    @BenchmarkMode(Mode.Throughput)
    public LocalDateTime localDate_Hessian() throws Exception {
        LocalDateTime date = LocalDateTime.now();
        byte[] bytes = localDateTimeSerializer.serialize(date);
        return localDateTimeSerializer.deserialize(bytes);
    }

结果如下。可以看出，在Hessian方案下，无论还是Instant还是LocalDateTime，吞吐量相比较Date，都出现“大跌眼镜”的下滑，相差100多倍；通过通过分析，每一次把Date序列化为字节流是6个字节，而LocalDateTime则是256个字节，这个放到网络带宽中的传输代价也是会被放大。在Java内置的序列化方案下，有稍微下滑，但没有本质区别。

Benchmark                         Mode  Cnt        Score   Error  Units
DateBenchmark.date_Hessian       thrpt       2084363.861          ops/s
DateBenchmark.localDate_Hessian  thrpt         17827.662          ops/s
DateBenchmark.instant_Hessian    thrpt         22492.539          ops/s
DateBenchmark.instant_Java       thrpt       1484884.452          ops/s
DateBenchmark.date_Java          thrpt       1500580.192          ops/s
DateBenchmark.localDate_Java     thrpt       1389041.578          ops/s

分析解释

Hession中其实是有针对Date类做特殊处理，遇到Date属性，都是直接获取long类型的相对来做处理。

通过分析Hessian对Instant类的处理，无论是序列化还是反序列化，都需要Class.forName这个耗时的过程。。。，怪不得throughput急剧下降。

延展思考

1）可以通过扩展实现Instant等类的com.alibaba.com.caucho.hessian.io.Serializer，并注册到SerializerFactory，来升级优化Hessian。但会有前后兼容性上，这个是大问题，在集团内这种上下游依赖比较复杂的场景下，极高的风险也会让此不可行。从这个角度看，只有建议大家都用Date来做个TO类的首选的时间属性。

2） HSF的RPC协议从严格意义上讲是 Session握手层的协议定义，其中的版本识别也是这个层面的行为，而业务数据的presentation展示层是通过Hessian等自描述的序列化框架来实现，这一层其实是缺少版本识别，从而导致升级起来就异常困难。

微信关注我们

原文链接：https://yq.aliyun.com/articles/705413

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

JavaScript的Proxy可以做哪些有意思的事儿

摘要：神奇而有趣的Proxy。原文：拿Proxy可以做哪些有意思的事儿作者：贾顺名 Fundebug经授权转载，版权归原作者所有。 Proxy是什么首先，我们要清楚，Proxy是什么意思，这个单词翻译过来，就是代理。可以理解为，有一个很火的明星，开通了一个微博账号，这个账号非常活跃，回复粉丝、到处点赞之类的，但可能并不是真的由本人在维护的。而是在背后有一个其他人 or 团队来运营，我们就可以称他们为代理人，因为他们发表的微博就代表了明星本人的意思。 P.S. 强行举例子，因为本人不追星，只是猜测可能会有这样的运营团队这个代入到JavaScript当中来，就可以理解为对对象或者函数的代理操作。 JavaScript中的Proxy Proxy是ES6中提供的新的API，可以用来定义对象各种基本操作的自定义行为（在文档中被称为traps，我觉得可以理解为一个针对对象各种行为的钩子），拿它可以做很多有意思的事情，在我们需要对一些对象的行为进行控制时将变得非常有效。 Proxy的语法创建一个Proxy的实例需要传入两个参数 target 要被代理的对象，可以是一个object...

2019-06-13

615

本文主要通过平常常用的go的一个函数，深入源码，了解其底层到底是如何实现的。 Println Println函数接受参数a，其类型为…interface{}。用过Java的对这个应该比较熟悉，Java中也有…的用法。其作用是传入可变的参数，而interface{}类似于Java中的Object，代表任何类型。所以，…interface{}转换成Java的概念，就是Object args ...。 Println函数中没有什么实现，只是return了Fprintln函数。 func Println(a ...interface{}) (n int, err error) { return Fprintln(os.Stdout, a...) } 而在此处的…放在了参数的后面。我们知道...interface{}是代表可变参数，即函数可接收任意数量的参数，而且参数参数分开写的。当我们再调用这个函数的时候，我们就没有必要再将参数一个一个传给被调用函数了，直接使用a…就可以达到相同的效果。 Fprintln 该函数接收参数os.Stdout.write，和需要打印的数据作为参数。 func ...

2019-06-13

670

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。