在表格开发中,如何选择适合自己的处理工具?
引言
GcExcel和EasyExcel都是卓越的高性能Excel处理库。GcExcel是由葡萄城公司开发,可用于Java和.Net平台;而EasyExcel是阿里巴巴开发的基于Java的开源Excel处理库。 在本文中,我们将对GcExcel和EasyExcel进行比较,帮助读者在实际场景中做出明智选择。
EasyExcel与GcExcel的区别
每个产品背后都有其设计初衷,EasyExcel的主要目标是解决POI在读写Excel文件时遇到的一些问题,例如内存占用过大、经常出现OOM(内存溢出)错误以及性能不够优越,无法轻松处理大型文件的限制。因此,EasyExcel旨在提供更高效、更稳定的Excel读写解决方案,以满足处理大文件时的需求。
与EasyExcel不同,GcExcel的API设计初衷独具特色。EasyExcel注重于快速、简便地读写Excel文件,而GcExcel则更加专注于提升读写性能、公式计算性能以及高级Excel功能的支持,如图表、透视表、数据校验、条件格式等等。
GcExcel在超越Excel功能的基础上,积极投入于提升性能,并为开发人员提供丰富多样的高级Excel功能。无论是数据分析、报表制作还是复杂公式运算,GcExcel都以出色的性能和功能展现了其独特的价值。
EasyExcel与GcExcel的应用场景
由于解决问题的差异,这两个组件库都具备极高的性能,但它们将性能优势应用于不同的场景中。
对于EasyExcel而言,Excel更像是数据的承载方式。当用户需要处理高并发量且对内存要求较高时,EasyExcel展现出更适合的性能表现。
然而,Excel经过微软多年的发展,衍生出许多不同的应用场景,如公式计算、数据填报、打印报送等。在这些场景中,通常需要组件库能够覆盖足够多的Excel功能。因此,在这些情况下,GcExcel更为适用。
例如,基金、保险、财税等行业通常需要进行Excel公式计算。通过使用GcExcel,可以实现服务端自动化公式计算的解决方案。
另外,对于计量检测、实验室管理等领域,对导出功能需求较高。通过GcExcel可以实现自动化导出PDF以及定时报送等功能。
同时,葡萄城还提供了纯前端Excel组件库产品SpreadJS。如果场景需要前后端协作进行Excel处理,选择GcExcel显然更加合适。
总之,根据不同的需求场景,选择合适的组件库能够充分发挥其性能优势,提供更好的Excel处理解决方案。
EasyExcel与GcExcel的API设计风格
EasyExcel的API采用流式读写和事件驱动的方式,这种设计理念使得在操作Excel时,性能和内存之间的平衡可达到极致。同时,其标注式的设计理念将代码逻辑与Excel文件解耦,使开发人员只需要更好地思考模型的设计,而不必担心繁琐的Excel操作。综上所述,EasyExcel的API提供了高性能、高效率的Excel操作解决方案,让您能够更加专注于业务逻辑的实现。
// 摘自EasyExcel官方文档 // 有个很重要的点 DemoDataListener 不能被spring管理,要每次读取excel都要new,然后里面用到spring可以构造方法传进去 @Slf4j public class DemoDataListener implements ReadListener<DemoData> { /** * 每隔5条存储数据库,实际使用中可以100条,然后清理list ,方便内存回收 */ private static final int BATCH_COUNT = 100; /** * 缓存的数据 */ private List<DemoData> cachedDataList = ListUtils.newArrayListWithExpectedSize(BATCH_COUNT); /** * 假设这个是一个DAO,当然有业务逻辑这个也可以是一个service。当然如果不用存储这个对象没用。 */ private DemoDAO demoDAO; public DemoDataListener() { // 这里是demo,所以随便new一个。实际使用如果到了spring,请使用下面的有参构造函数 demoDAO = new DemoDAO(); } /** * 如果使用了spring,请使用这个构造方法。每次创建Listener的时候需要把spring管理的类传进来 * * @param demoDAO */ public DemoDataListener(DemoDAO demoDAO) { this.demoDAO = demoDAO; } /** \* 这个每一条数据解析都会来调用 * * @param data one row value. Is is same as {@link AnalysisContext#readRowHolder()} * @param context */ @Override public void invoke(DemoData data, AnalysisContext context) { log.info("解析到一条数据:{}", JSON.toJSONString(data)); cachedDataList.add(data); // 达到BATCH_COUNT了,需要去存储一次数据库,防止数据几万条数据在内存,容易OOM if (cachedDataList.size() >= BATCH_COUNT) { saveData(); // 存储完成清理 list cachedDataList = ListUtils.newArrayListWithExpectedSize(BATCH_COUNT); } } /** * 所有数据解析完成了 都会被调用 * * @param context */ @Override public void doAfterAllAnalysed(AnalysisContext context) { // 这里也要保存数据,确保最后遗留的数据也存储到数据库 saveData(); log.info("所有数据解析完成!"); } /** * 加上存储数据库 */ private void saveData() { log.info("{}条数据,开始存储数据库!", cachedDataList.size()); demoDAO.save(cachedDataList); log.info("存储数据库成功!"); } }
GcExcel的API则以Excel为蓝本,采用工作簿(workbook)、工作表(worksheet)和区域(range)等概念,使整个组件库能够完美支持Excel的各种功能。如果您对Excel非常熟悉,那么使用GcExcel时会感到非常亲切和自然。
这两种设计方式就像解决不同场景的两个产品一样,它们都适合不同风格的开发人员。
对于那些追求极致技术的开发人员来说,EasyExcel的灵活性非常合适。而对于那些更注重快速解决业务需求、务实的开发人员来说,GcExcel提供了多样化的API选择,并且与Excel高度兼容,能够高效赋能于这种场景。
Workbook wb = new Workbook(); IWorksheet sheet1 = wb.getWorksheets().get(0); Object[][] values = (Object[][]) sheet1.getRange("A1:Z26").getValue();
最后
通过上述的对比,EasyExcel和GcExcel分别适用于不同的情况。
在选择时,您可以根据不同的维度思考,选择更适合自身场景的Excel处理库。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Tomcat目录结构 | 京东云技术团队
Tomcat目录结构图如下: 1、bin目录 存放一些可执行的二进制文件,****.sh 结尾的为linux下执行命令,****.bat 结尾的为windows下执行命令。 catalina.sh:真正启动tomcat文件,可以在里面设置jvm参数。 startup.sh:启动tomcat(需事先配置好JAVA_HOME环境变量才可启动,该命令源码实际执行的为catalina.sh start)。 shutdown.sh:关闭tomcat。 version.sh:查看tomcat版本相关信息。 2、conf目录 存放tomcat相关配置文件的。 2.1、catalina.policy 项目安全文件,用来防止欺骗代码或JSP执行带有像System.exit(0)这样的命令,可能影响容器的破坏。 只有当Tomcat用-security命令行参数启动时这个文件才会被使用,即启动tomcat时, startup.sh -security 。 2.2、catalina.proterties 配置tomcat启动相关信息文件 2.3、context.xml 监视并加载资源文件,当监视文件发生变化时...
- 下一篇
WhaleStudio 分钟级构建 AI 模型,强大 Ops 能力简化模型调度与部署
什么是机器学习(ML)? 它有什么作用 机器学习(ML)是人工智能(AI)的一个子集,通过算法发现数据中的通用模式,并根据持续不断的训练来优化调整最终结果。ML模型从过去的经验中学习,并根据已有的经验进行预测。例如,现在的电商已不再会使用普遍性降价或优惠券等手段吸引客户,取而代之的是根据每个客户的历史购买模式构建个性化优惠,并将这些数据与客户PII信息,网络搜索、当前地理位置、移动应用程序中的活动等实时信息相结合。这样,就可以构建ML模型来预测客户购买特定产品的倾向。所有的营销活动开始由数据和模型进行驱动,并通过在正确的时间向正确的客户提供正确的产品和优惠,来提升成交量和利润率,以实现更高的投资回报率。 ML使企业能够根据数据和模型作出决策,而不是通过经验或者直觉做出决策。同时,随着海量的新数据的不断供给和训练,ML模型会变得更加智能和准确,比如现在非常流行的ChatGPT等LLM就是这样诞生的。 MLOps如何为AI/ML项目提供价值 随着结构化和非结构化数据的快速增长,各类企业都希望从数据中获取价值,以获得竞争优势和提升服务能力。但现实情况是,许多生产性ML应用在现实环境中并未达到...
相关文章
文章评论
共有0条评论来说两句吧...