相信很多程序员对于Linux系统都不陌生,报告老板即使自己的心执行日常开发机器不是Linux,那么线上服务器也大部分都是报告老板的,所以,心执行掌握常用的报告老板 Linux 命令也是程序员必备的技能。 图片来自 Pexels 但是心执行,怕就怕很多人对于部分命令只是报告老板一知半解,使用不当就能导致线上故障。心执行 前段时间,报告老板我们的心执行线上应用报警,频繁 FGC,报告老板需要紧急处理问题,心执行于是报告老板有同事去线上重启机器(正常程序应该是先采集堆 dump,然后再重启,心执行方便排查是报告老板否存在内存泄露等问题)。 但是在重启过程中,同事发现正常的重启命令应用无反应,然后尝试使用 kill 命令"杀"掉 Java 进程,但是亿华云仍然无效。于是他私自决定使用 "kill -9"结束了进程的生命。 虽然应用进程被干掉了,但是随之而来带来了很多问题,首先是上游系统突然发生大量报警,对应开发找过来说调用我们的 RPC 服务无响应,频繁超时。 后来,我们又发现系统中存在部分脏数据,有些在同一个事务中需要完整更新的数据,只更新了一半… 为什么正常的 kill 无法"杀掉"进程,而 kill -9 就可以?为什么 kill -9 会引发这一连串连锁反应?正常的 kill 执行时,JVM 会如何处理的呢? 要搞清楚这些问题,我们要先从 kill 命令说起。 kill 命令 我们都知道,想要在 Linux 中终止一个进程有两种方式,如果是前台进程可以使用 Ctrl+C 键进行终止;如果是后台进程,那么需要使用kill命令来终止。(其实 Ctrl+C 也是 kill 命令) kill 命令的格式是: 其中[参数]是云服务器可选的,进程号可以通过 jps/ps/pidof/pstree/top 等工具获取。 kill 的命令参数有以下几种: 通常情况下,我们使用的 -l(信号)的时候比较多,如我们前文提到的 kill -9 中的 9 就是信号。 信号如果没有指定的话,默认会发出终止信号(15)。常用的信号如下: 比较常用的就是强制终止信号:9 和终止信号:15,另外,中断信号:2 其实就是我们前文提到的 Ctrl+C 结束前台进程。 那么,服务器托管kill -9 和 kill -15 到底有什么区别呢?该如何选择呢? kill -9 和 kill -15 的区别 kill 命令默认的信号就是 15,首先来说一下这个默认的 kill -15 信号。 当使用 kill -15 时,系统会发送一个 SIGTERM 的信号给对应的程序。当程序接收到该信号后,具体要如何处理是自己可以决定的。 这时候,应用程序可以选择: 因为 kill -15 信号只是通知对应的进程要进行"安全、干净的退出",程序接到信号之后,退出前一般会进行一些"准备工作",如资源释放、临时文件清理等等,如果准备工作做完了,再进行程序的终止。 但是,如果在"准备工作"进行过程中,遇到阻塞或者其他问题导致无法成功,那么应用程序可以选择忽略该终止信号。 这也就是为什么我们有的时候使用 kill 命令是没办法"杀死"应用的原因,因为默认的 kill 信号是 SIGTERM(15),而 SIGTERM(15) 的信号是可以被阻塞和忽略的。 和 kill -15 相比,kill -9 就相对强硬一点,系统会发出 SIGKILL 信号,他要求接收到该信号的程序应该立即结束运行,不能被阻塞或者忽略。 所以,相比于 kill -15 命令,kill -9 在执行时,应用程序是没有时间进行"准备工作"的,所以这通常会带来一些副作用,数据丢失或者终端无法恢复到正常状态等。 Java 是如何处理 SIGTERM(15) 的 我们都知道,在 Linux 中,Java 应用是作为一个独立进程运行的,Java程序的终止运行是基于 JVM 的关闭实现的。 JVM 关闭方式分为三种: JVM 进程在接收到 kill -15 信号通知的时候,是可以做一些清理动作的,比如删除临时文件等。 当然,开发者也是可以自定义做一些额外的事情的,比如让 Tomcat 容器停止,让 Dubbo 服务下线等。 而这种自定义 JVM 清理动作的方式,是通过 JDK 中提供的 shutdown hook 实现的。 JDK 提供了 Java.Runtime.addShutdownHook(Thread hook) 方法,可以注册一个 JVM 关闭的钩子。 例子如下: 执行命令: 控制台输出内容: 可以看到,当我们使用 kill(默认 kill -15)关闭进程的时候,程序会先执行我注册的 shutdownHook,然后再退出,并且会给出一个提示:interrupted by signal 15: SIGTERM。 如果我们执行命令 kill -9: 控制台输出内容: 可以看到,当我们使用 kill -9 强制关闭进程的时候,程序并没有执行 shutdownHook,而是直接退出了,并且会给出一个提示:interrupted by signal 9: SIGKILL。 总结 kill 命令用于终止 Linux 进程,默认情况下,如果不指定信号,kill 等价于 kill -15。 kill -15 执行时,系统向对应的程序发送 SIGTERM(15) 信号,该信号是可以被执行、阻塞和忽略的,所以应用程序接收到信号后,可以做一些准备工作,再进行程序终止。 有的时候,kill -15 无法终止程序,因为他可能被忽略,这时候可以使用 kill -9,系统会发出 SIGKILL(9) 信号,该信号不允许忽略和阻塞,所以应用程序会立即终止。 这也会带来很多副作用,如数据丢失等,所以,在非必要时,不要使用 kill -9 命令,尤其是那些 Web 应用、提供 RPC 服务、执行定时任务、包含长事务等应用中。 因为 kill -9 没给 Spring 容器、Tomcat 服务器、Dubbo 服务、流程引擎、状态机等足够的时间进行收尾。 作者:Hollis 简介:一个对 Coding 有着独特追求的人,现任阿里巴巴技术专家,个人技术博主,技术文章全网阅读量数千万,《程序员的三门课》联合作者。 编辑:陶家龙 出处:转载自微信公众号 Hollis(ID:hollischuang)