搜索[文档处理]结果-低调大师优秀个人博客

精选列表

搜索[文档处理]，共10000篇文章

事务处理不当，线上接口又双叒内存泄漏了！（附图解问题全过程）

情景项目上线了一个接口，先灰度一台机器观察调用情况；接口不断的调用，过了一段时间，发现机器上的接口调用开始报OOM异常！当天就是上线deadline了，刺激。。发现问题第一步，使用jps命令获取出问题jvm进程的进程ID 使用jps -l -m获取到当前jvm进程的pid，通过上述命令获取到了服务的进程号：427726 （此处假设为这个） jps命令 jps(JVM Process Status Tool)：显示指定系统内所有的HotSpot虚拟机进程 jps -l -m ：参数-l列出机器上所有jvm进程，-m显示出JVM启动时传递给main()的参数第二步，使用jstat观察jvm状态，发现问题因为是OOM异常，所以我们首先重启机器观察了JVM的运行情况；我们使用jstat -gc pid time命令观察GC，发现GC在YGC后，GC掉的内存并不多，每次YGC后都有一部分内存未回收，导致在多次YGC后回收不掉的内存被挪到堆的old区，old满了之后FGC发现也是回收不掉；这里基本可以确定是内存泄漏的问题了，下面我们有简单看了下机器的cpu、内存、磁盘状态 jstat命令： jstat(JVM statistics Monitoring)是用于监视虚拟机运行时状态信息的命令，它可以显示出虚拟机进程中的类装载、内存、垃圾收集、JIT编译等运行数据。 jstat -gc pid time ： -gc 监控jvm的gc信息，pid 监控的jvm进程id，time每个多少毫秒刷新一次 jstat -gccause pid time ： -gccause 监控gc信息并显示上次gc原因，pid 监控的jvm进程id，time每个多少毫秒刷新一次 jstat -class pid time： -class 监控jvm的类加载信息，pid 监控的jvm进程id，time每个多少毫秒刷新一次在这里先简单说一下，堆的GC：在GC开始的时候，对象只会存在于Eden区和名为“From”的Survivor区，Survivor区“To”是空的。紧接着进行GC，Eden区中所有存活的对象都会被复制到“To”，而在“From”区中，仍存活的对象会根据他们的年龄值来决定去向。年龄达到一定值(年龄阈值，可以通过-XX:MaxTenuringThreshold来设置)的对象会被移动到年老代中，没有达到阈值的对象会被复制到“To”区域。经过这次GC后，Eden区和From区已经被清空。这个时候，“From”和“To”会交换他们的角色，也就是新的“To”就是上次GC前的“From”，新的“From”就是上次GC前的“To”。不管怎样，都会保证名为To的Survivor区域是空的，minor GC会一直重复这样的过程。第三步，观察机器状态，确认问题使用top -p pid获取进程的cpu和内存使用率；查看RES 和 %CPU %MEM三个指标：在这里先简单说一下，top命令展示的内容： VIRT：virtual memory usage 虚拟内存 1、进程“需要的”虚拟内存大小，包括进程使用的库、代码、数据等 2、假如进程申请100m的内存，但实际只使用了10m，那么它会增长100m，而不是实际的使用量 RES：resident memory usage 常驻内存 1、进程当前使用的内存大小，但不包括swap out 2、包含其他进程的共享 3、如果申请100m的内存，实际使用10m，它只增长10m，与VIRT相反 4、关于库占用内存的情况，它只统计加载的库文件所占内存大小 SHR：shared memory 共享内存 1、除了自身进程的共享内存，也包括其他进程的共享内存 2、虽然进程只使用了几个共享库的函数，但它包含了整个共享库的大小 3、计算某个进程所占的物理内存大小公式：RES – SHR 4、swap out后，它将会降下来 DATA 1、数据占用的内存。如果top没有显示，按f键可以显示出来。 2、真正的该程序要求的数据空间，是真正在运行中要使用的。 ps : 如果程序占用实存比较多，说明程序申请内存多，实际使用的空间也多。如果程序占用虚存比较多，说明程序申请来很多空间，但是没有使用。发现机器的自身状态不存在问题， so毋庸置疑，发现问题了，典型的内存泄漏。。第四步，使用jmap获取jvm进程dump文件我们使用jmap -dump:format=b,file=dump_file_name pid 命令，将当前机器的jvm的状态dump下来或缺的一份dump文件，用做下面的分析 jmap命令： jmap(JVM Memory Map)命令用于生成heap dump文件，还可以查询finalize执行队列、Java堆和永久代的详细信息，如当前使用率、当前使用的是哪种收集器等。 jmap -dump:format=b,file=dump_file_name pid ： file=指定输出数据文件名， pid jvm进程号接下来，回滚灰度的机器，开始解决问题=.= 解决问题第一步，dump文件分析在这里，我们分析dump文件，使用的Jprofiler软件，就是下面这个东东：具体的使用方法，在这就不再赘述了，下面将dump文件导入到Jprofiler中：选择Heap Walker 中的Current Object Set，这里面显示的是当前的类的占用资源，从占用空间从大到小排序；从上图中，没有观察出什么问题，我们点击Biggest Objects，查看哪个对象的占用的内存高：从上图中，我们发现org.janusgraph.graphdb.database.StandardJanusGraph这个对象居然占用了高达724M的内存！看来内存泄漏八九不离十就是这个对象的问题了！再点开看看，如下图，可以发现是一个openTransactions的类型为ConcurrentHashMap的数据结构：第二步，源码查找定位代码这到底是什么对象呢，去项目中查找一下，打开idea-打开项目-双击shift键-打开全局类查找-输入StandardJanusGraph，如下图：发现是我们项目使用的图数据库janusgraph的一个类，找到对应的数据结构：类型定义： private Set<StandardJanusGraphTx> openTransactions; 初始化为一个ConcurrentHashMap： openTransactions = Collections.newSetFromMap(new ConcurrentHashMap<StandardJanusGraphTx, Boolean>(100, 0.75f, 1)); 观察上述代码，我们可以看到，里面的存储的StandardJanusGraphTx从字面意义上理解是janusgraph框架中的事务对象，下面往上追一下代码，看看什么时候会往这个Map中赋值： // 找到执行openTransactions.add()的方法 public StandardJanusGraphTx newTransaction(final TransactionConfiguration configuration) { if (!isOpen) ExceptionFactory.graphShutdown(); try { StandardJanusGraphTx tx = new StandardJanusGraphTx(this, configuration); tx.setBackendTransaction(openBackendTransaction(tx)); openTransactions.add(tx); // 注意！此处对上述的map对象进行了add return tx; } catch (BackendException e) { throw new JanusGraphException("Could not start new transaction", e); } } // 上述发现，是一个newTransaction，创建事务的一个方法，为确保起见，再往上跟找到调用上述方法的类： public JanusGraphTransaction start() { TransactionConfiguration immutable = new ImmutableTxCfg(isReadOnly, hasEnabledBatchLoading, assignIDsImmediately, preloadedData, forceIndexUsage, verifyExternalVertexExistence, verifyInternalVertexExistence, acquireLocks, verifyUniqueness, propertyPrefetching, singleThreaded, threadBound, getTimestampProvider(), userCommitTime, indexCacheWeight, getVertexCacheSize(), getDirtyVertexSize(), logIdentifier, restrictedPartitions, groupName, defaultSchemaMaker, customOptions); return graph.newTransaction(immutable); // 注意！此处调用了上述的newTransaction方法 } // 接着找上层调用，发现了最上层的方法 public JanusGraphTransaction newTransaction() { return buildTransaction().start(); // 此处调用了上述的start方法 } 在我们对图数据库中图数据操作的过程中，采用的是手动创建事务的方式，在每次查询图数据库之前，我们都会调用类似于dataDao.begin()代码，其中就是调用的 public JanusGraphTransaction newTransaction()这个方法；最后，我们简单的看下源码可以发现，从上述内存泄漏的map中去除数据的逻辑就是commit事务的接口，调用链如下： public void closeTransaction(StandardJanusGraphTx tx) { openTransactions.remove(tx); // 从map中删除StandardJanusGraphTx对象 } private void releaseTransaction() { isOpen = false; graph.closeTransaction(this); // 调用上述closeTransaction方法 vertexCache.close(); } public synchronized void commit() { Preconditions.checkArgument(isOpen(), "The transaction has already been closed"); boolean success = false; if (null != config.getGroupName()) { MetricManager.INSTANCE.getCounter(config.getGroupName(), "tx", "commit").inc(); } try { if (hasModifications()) { graph.commit(addedRelations.getAll(), deletedRelations.values(), this); } else { txHandle.commit(); // 这个commit方法中释放事务也是调用releaseTransaction } success = true; } catch (Exception e) { try { txHandle.rollback(); } catch (BackendException e1) { throw new JanusGraphException("Could not rollback after a failed commit", e); } throw new JanusGraphException("Could not commit transaction due to exception during persistence", e); } finally { releaseTransaction(); // // 调用releaseTransaction if (null != config.getGroupName() && !success) { MetricManager.INSTANCE.getCounter(config.getGroupName(), "tx", "commit.exceptions").inc(); } } } 终于，我们找到了内存泄漏的根源所在：项目代码中存在调用了事务begin但是没有commit的代码! 第三步，修复问题验证解决问题：找到内存泄漏接口的代码，并发现了没有commit()的位置，try-catch-finally中添加上了commit()代码；提交-部署-发布-灰度一台机器后观察内存泄漏的现象消失，GC回收正常；内存泄漏问题解决，项目如期上线~ 最后大家，有没有遇到过内存泄漏的情况，欢迎在评论区说出你的故事=.= 写这篇文章耗费的时间超出了我的预料，预计2个小时写完，结果花了一下午的时间... 原创不易，如果大家有所收获，希望大家可以点赞评论支持一下~ 也欢迎大家关注我的oschina和微信搜索公众号[匠心Java]支持一下作者，作者定期分享工作中的所见所得~

2020-04-17

机器学习在高德用户反馈信息处理中的实践| 1月8号云栖号夜读

阿里专家原创好文 1.机器学习在高德用户反馈信息处理中的实践作为国内领先的出行大数据公司，高德地图拥有众多的用户和合作厂商，这为高德带来了海量的出行数据，同时通过各个渠道，这些用户也在主动地为我们提供大量的反馈信息

2020-01-07

Red Hat 敦促英特尔处理器用户尽快打上 ZombieLoad v2 安全补丁

目前仅知漏洞会影响英特尔公司的处理器，但因缺陷存在于硬件层面，因此需要实施内核级的修复更新。此问题会影响 Red Hat Enterprise Linux 8 和更早的所有发行版。

2019-11-14

一篇文章看懂自然语言处理——word表示技术的变迁(从bool模型到BERT)

一、背景自然语言处理就是要让计算机理解人类的语言，至于到目前为止，计算机是否真的理解的人类的语言，这是一个未知之数，我的理解是目前为止并没有懂得人类语言，只是查表给出一个最大概率的回应而已。

2019-09-24

揭秘|每秒千万级的实时数据处理是怎么实现的？ | 6月21号云栖夜读

阿里专家原创好文 1.揭秘|每秒千万级的实时数据处理是怎么实现的？闲鱼目前实际生产部署环境越来越复杂，横向依赖各种服务盘宗错节，纵向依赖的运行环境也越来越复杂。

2019-06-20

手把手教程：用Python开发一个自然语言处理模型，并用Flask进行部署

今天我们来创建一个用于文档分类、垃圾过滤的自然语言处理模型，使用机器学习来检测垃圾短信文本消息。我们的ML系统工作流程如下：离线训练->将模型作为服务提供->在线预测。

2019-04-05

深入Python与日志服务，玩转大规模数据分析处理实战系列直播第四讲

Python并发编程与实时大数据处理监控直播时间：3月20日（周三）20:00—21:00 直播介绍： Python多线程、多进程编程该如何做？如何避开GIL？

2019-03-17

一文读懂物联网硬件接入难点与破解（内含智慧养殖、水处理案例详解）|MVP时间

想了解国内物联网发展历史与现状？物联网落地时遇到“接口多、协议多”“接入多、对接难”等困境，如何破解？物联网能给传统行业带来哪些改变？未来的IOT会是什么样？想要知道这些问题的答案，【MVP时间】刘洪峰为你讲述物联网落地的那些事。读完本文你能收获什么： 1、物联网部署实战； 2、物联网实践技术； 3、物联网系列部署知识与实践经验。【讲师介绍】叶帆科技创始人兼CEO、阿里云MVP刘洪峰。前微软（中国）.NET MF开发团队成员，CSDN十大MVB。以微软.NET MF系统为核心，研发了物联网智能网关、YFIOs和YFHMI等物联网中间件软硬件平台。【课程】视频课程链接：5节课助你破解物联网硬件接入难点 https://mvp.aliyun.com/topic/9 【课程讲义】 1.物联网现状及落地难点 https://yq.aliyun.

2018-12-03

[译]介绍Spark2.4的用于处理复杂数据类型的新内置函数与高阶函数

[译]介绍Spark2.4的用于处理复杂数据类型的新内置函数与高阶函数本文翻译自databricks的介绍spark2.4新特性的blog，英文原文参考原文链接 Apache Spark2.4总共支持了

2018-11-19

ASP.NET Core 异常和错误处理 - ASP.NET Core 基础教程 - 简单教程，简单编程

原文:ASP.NET Core 异常和错误处理 - ASP.NET Core 基础教程 - 简单教程，简单编程 ASP.NET Core 异常和错误处理上一章节中，我们学习了 ASP.NET Core

2018-09-28

VS中C#连接SQLite数据库处理器架构“x86”不匹配的问题

_IsRunTrans = false; 157 } 158 } 159 160 161 } 162 } 此时运行会报错，警告所生成项目的处理器架构“MSIL”与引用“System.Data.SQLite

2018-06-20

这本读者期待的芯片书《手把手教你设计CPU——RISC-V处理器》终于出版！

作者以RISC-V处理器为出发点，言简意赅地对CPU基础知识、指令集架构，软件工具链等核心技术做了原理阐述，并以他自己开发的开源RISC-V处理器（蜂鸟E200）为例，深入浅出地介绍了该处理器微架构以及具体硬件实现

2018-05-13

Win8 Metro(C#)数字图像处理--2.57一维最大熵法图像二值化

原文: Win8 Metro(C#)数字图像处理--2.57一维最大熵法图像二值化 [函数名称] 一维最大熵法图像二值化WriteableBitmapEntropymaxThSegment(WriteableBitmapsrc

2018-03-12

开启人工智能新时代，首款神经网络处理器“寒武纪”即将上市

我国自主研发的世界首款模拟人类神经元和突触进行深度学习的处理器正在走产业化道路，预计还有一年半左右就会进入市场。

2018-03-01

【阿里聚安全·安全周刊】Intel处理器安全漏洞事件跟踪|星巴克挖矿事件分析

关键词：阿里云Intel漏洞公告丨星巴克挖矿丨阿里工程师丨杭特丨苹果更新丨iOS内核调试丨WPA3 Wifi标准|平昌奥运会|比特币钱包|PHP 7.2.1 本周资讯top3 【安全漏洞公告】Intel处理器

2018-01-11

重磅译制 | 视频更新：牛津大学xDeepMind自然语言处理课程第5讲（下）文本分类

试看时长10分钟，观看完整视频请点击文末阅读原文按钮牛津大学Deep NLP是一门关于自然语言处理（NLP）的高阶课程。

2017-12-10

重磅译制 | 视频更新：牛津大学xDeepMind自然语言处理课程第4讲（下）RNN语言建模

牛津大学Deep NLP是一门关于自然语言处理（NLP）的高阶课程。课程由牛津大学和谷歌DeepMind（AlphaGo的开发机构）联合开设，是牛津大学计算机系2017年春季学期最新课程。

2017-11-26

【首发】阿里巴巴夺中文语法大赛全球冠军，iDST自然语言处理团队解读技术细节

参赛机构比赛成绩公布 CGED是自然语言处理领域的权威赛事，由IJCNLP联办，今年已是第四届。比赛的背景是：学习中文的外国人数不断增加，由于中文的博大精深，外国友人在中文写作中会出现各式错误。

2017-11-23

ECS云服务器通过SAP HANA认证，海量数据处理技术助力企业数字化转型

2017年10月12日，杭州云栖大会上，阿里云副总裁李津做了“云之深处”的重磅发布，宣布了阿里云ECS云服务器通过SAP HANA认证。这标志着阿里云弹性计算产品与SAP产品相结合，利用双方在大数据、人工智能方面的优势，一起让企业解决方案更加“智能”，创造出更有前景的价值。 SAP HANA 是一款支持企业预置型部署和云部署模式的内存计算平台，能够帮助客户加速业务流程，实现更智能的业务运营，并简化 IT 环境。通过为客户的一切数据需求提供基础平台，SAP HANA 消除了企业维护独立的旧系统和孤立数据的负担。这样，客户就能在全新的数字经济时代激发活力，制定更明智的业务决策。通过SAP HANA认证，标志着企业用户可以在阿里云上放心部署和运行基于SAP HANA平台的关键业务系统。 SAP HANA认证是云服务器领域最困难的认证之一，关

2017-10-12

ASP.NET Core应用的错误处理[3]：ExceptionHandlerMiddleware中间件如何呈现“定制化错误页面”

ExceptionHandlerMiddleware中间件处理请求的本质就是在后续请求处理过程中出现异常的情况下采用注册的异常处理器来处理并响应请求，这个异常处理器就是我们再熟悉不过的RequestDelegate

2017-10-08

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。