前端开发进阶：前端开发中如何高效渲染大数据量？

2023-08-23 788

在日常工作中，有时会遇到一次性往页面中插入大量数据的场景，在数栈的离线开发（以下简称离线）产品中，就有类似的场景。本文将通过分享一个实际场景中的前端开发思路，介绍当遇到大量数据时，如何实现高效的数据渲染，以达到提升页面性能和用户体验的目的。

渲染大数据量时遇到的问题

在离线的数据开发模块，用户可以在 SQL 编辑器中编写 SQL，再通过整段运行/分段运行来执行 SQL。在点击整段运行后，从运行成功日志打印后到展示结果的过程中，有一段时间页面会很卡顿，主要表现为编辑器编写卡顿。

我们是在解决 SQL 最大运行行数问题时，发现了上述需要进行性能优化的场景。

先来梳理下当前代码的设计逻辑：

· 前端将选中的 SQL 传递给服务端，服务端返回一个调度运行的 jobId

· 前端接着以该 jobId 轮询服务端，查询任务的执行状态

· 当轮询到任务已完成时，选中的 SQL 中如果有查询语句，服务端则会按 select 语句的顺序返回一个 sqlId 的数组集合

· 前端基于n个 sqlId 的集合，并发 n个 selectData 的请求

· 所有的 selectData 请求完成后渲染数据

为了保证结果最终的展示顺序和 select 语句顺序一致，我们为单纯的 sqlIdList 循环方法加上了 Promise.allsettled 的方法，使得n个 selectData 的请求顺序和 select 语句顺序一致。

由上述逻辑可以看出，问题可能出现在如果选中的 SQL 中有大量 select 语句的话，会在「整段运行」完成后大批量请求 selectData 接口，再等待所有 selectData 请求完成后，集中进行渲染。此时，就会出现一次性往页面中插入大量数据的场景，导致卡顿。那么，我们怎么解决上述问题呢？

解决思路

可以看出，上述逻辑主要有两个问题：大批量请求 selectData 接口和集中性数据渲染。我们通过如下所示的解决思路去处理这些问题。

任务分组

依旧通过 Promise.allsettled 拿到所有 selectData 接口返回的结果，将原先集中渲染看作是一个大任务，我们将任务拆分成单个的 selectData 结果渲染任务。再根据实际情况，对单个任务进行分组，比如两个一组，渲染完一组再渲染下一组。

拆分完任务，就涉及到了任务的优先级问题，优先级决定了哪个任务先执行。这里采用最原始的“抢占式轮转”，按 sqlIdList 的顺序保留编辑器中的 SQL 顺序。

Promise.allSettled(promiseList).then((results = []) => {
    const renderOnce = 2; // 每组渲染的结果 tab 数量
    const loop = (idx) => {
        if (promiseList.length <= idx) return;
        results.slice(idx, idx + renderOnce).forEach((item, idx) => {
            if (item.status === 'fulfilled') {
                handleResultData(item?.value || {}, sqlIdList[idx]?.sqlId);
            } else {
                console.error(
                    'selectExecResultDataList Promise.allSettled rejected',
                    item.reason
                );
            }
        });
        setTimeout(() => {
            loop(idx + renderOnce);
        }, 100);
    };
    loop(0);
});

请求分组 + 任务分组

问题中的大批量请求 selectData 接口，也是一个突破点。我们可以将请求进行分组，每次以固定数量的 sqlId 去请求 selectData 接口，比如每组请求 6 个 sqlId 的结果，当前组的请求全部结束后再进行渲染。为了保证效果最优，这里也引入任务分组的思路。

const requestOnce = 6; // 每组请求的数量
// 将一维数组转换成二维数组
const sqlIdList2D = convertTo2DArray(sqlIdList, requestOnce);
const idx2D = 0; // sqlIdList2D 的索引

const requestLoop = (index) => {
    if (!sqlIdList2D[index]) return;
    const promiseList = sqlIdList2D[index].map((item) =>
        selectExecResultData(item?.sqlId)
                                              );
    Promise.allSettled(promiseList)
        .then((results = []) => {
            const renderOnce = 2; // 每组渲染的结果 tab 数量

            const loop = (idx) => {
                if (promiseList.length <= idx) return;
                results.slice(idx, idx + renderOnce).forEach((item, idx) => {
                    if (item.status === 'fulfilled') {
                        handleResultData(item?.value || {}, sqlIdList[idx]?.sqlId);
                    } else {
                        console.error(
                            'selectExecResultDataList Promise.allSettled rejected',
                            item.reason
                        );
                    }
                });
                setTimeout(() => {
                    loop(idx + renderOnce);
                }, 100);
            };
            loop(0);
        })
        .finally(() => {
            requestLoop(index + 1);
        });
};
requestLoop(idx2D);

请求分组

上一种方案的代码相对来说又些难以理解，属于上午写，下午忘的逻辑，注释也不好写，不利于维护。基于实际情况，我们尝试下仅对请求作分组处理，看看效果。

const requestOnce = 3; // 每组请求的数量
// 将一维数组转换成二维数组
const sqlIdList2D = convertTo2DArray(sqlIdList, requestOnce);
const idx2D = 0; // sqlIdList2D 的索引

const requestLoop = (index) => {
    if (!sqlIdList2D[index]) return;
    const promiseList = sqlIdList2D[index].map((item) =>
        selectExecResultData(item?.sqlId)
                                              );
    Promise.allSettled(promiseList)
        .then((results = []) => {
            results.forEach((item, idx) => {
                if (item.status === 'fulfilled') {
                    handleResultData(item?.value || {}, sqlIdList[idx]?.sqlId);
                } else {
                    console.error(
                        'selectExecResultDataList Promise.allSettled rejected',
                        item.reason
                    );
                }
            });
        })
        .finally(() => {
            requestLoop(index + 1);
        });
};
requestLoop(idx2D);

解决思路解析

· 解决大数据量渲染的问题，常见方法有：时间分片、虚拟列表等

· 解决同步阻塞的问题，常见方法有：任务分解、异步等

· 如果某个任务执行时间较长的话，从优化的角度，我们通常会考虑将该任务分解成一系列的子任务

在任务分组一节，我们将 setTimeout 的时间间隔设置为 100ms，也就是我认为最快在 100ms 内能完成渲染。但假设不到 100ms 就完成了渲染，那么就需要白白等待一段时间，这是没有必要的，这时可以考虑 window.requestAnimationFrame 方法。

- setTimeout(() => {
+ window.requestAnimationFrame(() => {
      loop(idx + renderOnce);
- }, 100);
+ });

第三节的请求分组，实际上已经达到了渲染任务分组的效果。本文更多的是提供一个解决思路，上述方式也是基于对时间分片的理解实践。

在软件开发中，性能优化是一个重要的方面，但并不是唯一追求，往往还需要考虑多个因素，包括功能需求、可维护性、安全性等等。根据具体情况，综合使用多种技术和策略，找到最佳的解决方案，才是最终目的。

《数栈产品白皮书》：https://www.dtstack.com/resources/1004?src=szsm

《数据治理行业实践白皮书》下载地址：https://www.dtstack.com/resources/1001?src=szsm 想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友，浏览袋鼠云官网：https://www.dtstack.com/?src=szkyzg

同时，欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术qun」，交流最新开源技术信息，qun号码：30537511，项目地址：https://github.com/DTStack

微信关注我们

原文链接：https://my.oschina.net/u/3869098/blog/10101572

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

OceanBase：谁动了我得参数？

作者：郑增权爱可生南区数据库工程师，爱可生 DBA 团队成员，负责数据库相关技术支持。爱好：桌球、羽毛球、咖啡、电影。本文来源：原创投稿爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。背景客户想在业务上线前记录现有 OceanBase 集群的 Parameters、Variables、ProxyCofnig 参数值。然后，将其与“默认值”或“DBA 主动刷的调优参数”进行对比，若是“默认值”或“DBA 主动刷的调优参数”则符合预期，否则认为其是不符合预期的值。最后，生成一份报表文件，标记出非预期的值，再由人工确认其合理性。客户所用的 OceanBase 版本还没有提供追溯所有参数修改记录的方法，作者提供了利用 Shell 脚本 + Excel VLOOKUP 函数，快速采集 OB 参数，并生成参数存档文件的方法来实现该需求。下面将展示该方法的实现步骤。实现 2.1 准备脚本和模板文件测试环境安装同版本的 OBServer、OBproxy，编写 Shell 脚本用于获取默认的 Parameters、Variables、ProxyCofnig...

2023-08-23

799

There is no compression algorithm for experience.-- Andy Jassy, CEO of AWS 一、缘起共识协议，对于从事分布式系统研发的同学们来说真可谓是最熟悉的陌生人。一方面，共识协议面向有状态分布式系统的数据一致性与服务容错性这两大难题提供了近乎完美的解决方案，绝大部分同学或多或少听说过/研究过/使用过/实现过Paxos/Raft等经典共识协议；另一方面，共识协议的确很复杂，事实上，学习并弄懂共识协议原理倒是没有那么难，但是要在实际系统中用好用正确共识协议绝非易事，共识领域里面的“双主脑裂”，“幽灵复现”等传说，也让很多同学望而生畏。这篇文章与读者朋友们好好聊一聊共识这个技术领域，期望能够让大伙儿对共识协议的前世今生以及这些年的技术演进有个大体了解。虽说经验这种东西没有压缩算法，得自身一点一点实践过才真正算数，但是认知学习是可以加速的，所谓：今日格一物，明日又格一物，豁然贯通，终知天理。我们知道，分布式系统最朴实的目标是把一堆普通机器的计算/存储等能力整合到一起，然后整体上能够像一台超级机器一样对外提供可扩展的读写服务，设...

2023-08-23

762

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。