PerfSpace

记一次meterSpherev1.20.9参数不当导致DB连接占满

引言 本文用于记录作者在centos7.9 Linux上安装meterSpherev1.20.9后,导致的MySQL连接数占满造成所有后端服务不可用的定位与修复过程。 问题现象 meterSpherev1.20.9 tls搭建参考上一篇。 安装完成meterSphere后,启动成功,所有服务状态全部

Administrator Administrator 发布于 2025-05-01

MySQL优化实战--去掉不必要的join

引言 本文用于记录作者在一个后台管理系统项目中,遇到的页面查询join太多不必要的表导致慢SQL问题,以及优化过程。 问题现象 北美的某个客户公司的后台管理系统,设备列表查询较慢,影响用户体验

Administrator Administrator 发布于 2025-04-27

MySQL性能优化实战--增加强制索引

引言 本文用于记录作者在一个后台管理系统项目中,遇到的页面查询未走索引导致慢SQL问题,以及优化过程。 问题现象 如下图,某个IoT系统的后台管理页面,查询已绑定的设备列表,20万设备量级,耗时12.64s 性能分析

Administrator Administrator 发布于 2025-04-27

MySQL性能优化实战--索引区分度不高引发的慢SQL

引言 本文用于记录作者在一个后台管理系统项目中遇到的页面查询慢SQL问题,以及优化过程。 问题现象 一个IoT设备后台管理系统的页面,查询用户列表比较慢,20万用户量级、10万设备量级,第一页10条数据查询耗时38s, 如下图, 性能分析 从业务上看,这只是一个后台查询页面,并无复杂的业务

Administrator Administrator 发布于 2025-04-27

记一次线程无限增加导致OutOfDirectMomery直接内存溢出

引言 记一次IoT项目中由于线程使用不当,无限增加导致OOM的事故,记录整个分析和调优过程。 问题现象 某次线上事故,生产环境某个服务突然发生实例重启,如下图,研发提供了日志、服务名称,除此之外未提供任何信息。

Administrator Administrator 发布于 2025-04-25

记一次log打印导致的OOM

引言 记一次IoT项目中由于日志打印不当导致的OOM,记录整个分析和调优过程。 问题现象 压测某个设备IoT接口,不到1min出现TPS卡顿现象,长时间没响应。如下图: 定位思路 照例三板斧,监控、日志、工具,观察docker容器监控、jvm监控 如下图,使用jstat -gcutil 1

Administrator Administrator 发布于 2025-04-25