有同学咨询,他们公司的一台服务器,是一台Linux用作负载均衡的服务器,最近在使用过程中,随着连接数的增加,服务器突然挂掉了,这是怎么回事呢?今天丁老师就这个问题做一下解答。
故障分析
服务器:Linux
用途:负载均衡服务
故障情况:用户连接数增加,服务器挂掉。
故障排查:
1.应用程序故障:通过测试,无Bug报错,应用程序正常。
2.系统故障:无,系统无报错,仅用户连接增加到一定程度后才会崩溃。
猜测与分析:
在确定不是系统本身和部署的程序故障而导致的问题后,丁老师心里已大概有了方向,估计就是哪个地方的配置引起的故障,意思就是某个地方配置的连接数量达到了实际连接数量的峰值而导致的系统崩溃。
故障修复
在确定了大概方向后,丁老师对相关的系统文件进行了逐一排查。
1.首先,分别查看系统CPU负载情况、内存是否爆满、load是否异常。
top
htop
uptime2.一切正常,其次查看系统连接数。
netstat -an | wc -l
ulimit -n此时发现,系统连接数非常高,并且文件句柄返回1024,此时丁老师判断该问题大致是由高并发引起的故障。
3.查看Nginx服务器日志,检查报错信息。
tail -f /var/log/nginx/error.log在错误日志中,查看到返回too many open files信息,再查看系统日志。
/var/log/messages
dmesg返回socket: too many open files。这时丁老师已经可以判断,这基本上是由高并发引起文件句柄被耗尽而引发的故障。
4.查看limits.conf
/etc/security/limits.conf5.增加连接数
soft nofile 65535
hard nofile 655356.修改系统配置
/etc/systemd/system.conf
/etc/systemd/user.conf
DefaultLimitNOFILE=65535
DefaultLimitNPROC=655357.给Nginx加大文件句柄。
vi /usr/lib/systemd/system/nginx.service
LimitNOFILE=655358.重启服务器,故障解决。
全文总结
通过该问题发现,该故障引起的核心是Linux服务器在高并发情况下,因文件句柄上限过低(默认设置为1024),导致连接耗尽,服务崩溃,同时相关配置是未持久化的,因此每次重启后,都会恢复默认值从而再次引起故障。
这种故障出现时通常表现为:
1.网站突然打不开、请求超时。
2.并发一高服务器就崩溃宕机。
3.服务器重启后会短暂恢复,但很快就再次崩溃。
常见错误日志:
too many open files
EMFILE
socket: too many open files针对该故障,丁老师先是通过查看系统负载、连接数以及错误日志,快速定位是由文件句柄耗尽引起的故障。然后在解决时,通过修改Nginx的limits.conf、调整systemd的LimitNOFILE等配置文件参数,提升系统的文件句柄数配置,避免因高并发导致处罚文件句柄上限而引起崩溃的问题。
phpmyadmin使用正常,但是在sql文件时,提示500 internal Server error/nginx,查看了下nginx的日志,提示"open() "/usr/local/nginx/client_b...
以下是mysql常用的日期时间查询语句,其中,时间字段名是默认以datetime格式的,如果是int时间戳格式的时间,则需要在时间字段名字段上,加上from_unixtime(时间字段名)。查询当天的数据:#时间字段为y-m-d格式,如...
在上一篇文章中,我们介绍了如何在宝塔的网站中设置禁止在指定目录中读取运行php文件(见:《宝塔网站安全增强 - 禁止在指定目录执行PHP等脚本文件》),在本篇中,我们将会介绍如何在包头的网站中设置,禁止蜘蛛、爬虫、黑客扫描探针等恶意程序...
经常有同学提问,公众号绑定的域名链接,访问时提示“无法确认该网页的安全性,请谨慎访问”,这是怎么回事?如何解决呢?如图:这是一个被问及比较多的问题,也是一个比较普遍的情况,今天丁老师就这个问题的原因,以及解决方法,来进行分析和解答。问:...
今天有同学在群里提问,在使用photoshop编辑文字时,经常会弹出一个文字选择的面板如图:这时文字也无法输入,也无法取消和关闭,很是烦人,怎么取消这个功能呢?经过丁老师研究,方法很简单:1.打开photoshop菜单-编辑2.选择首选项-...
普通账号个人认证号企业认证号蓝色认证标识薯条推广聚光平台效果广告普通应商业合作以KOL/KOC身份和品牌合作以品牌方身份发起起合作开设店铺个人店铺或个体户(不支持港澳台公司申请)旗舰店店或专卖店(支持港澳台公司申请)主动私信每天10位陌生用...
这几年AI技术的发展已经达到新的高度,从提高个人生产力到企业操作效率的各个方面,AI都扮演着不可或缺的角色。无论是进行语言交流、内容创作、或是任务管理,都有相应的AI工具可以帮助我们更加轻松地完成工作。以下是丁老师觉得不错的AI工具推荐,希...
最近要在某单位内网部署项目,使用了lnmp来配置环境,软件安装成功,可安装后不管是打开ip地址还是默认站点,都提示nginx 403 forbidden,这是怎么回事呢?首先,已经出现了nginx 403提示,说明nginx是安装正常的。其...