机器坏了,大家都着急,但处理事故的运维过程中,我们还是要冷静下来,分析分析到底是不是系统的问题,或者是系统的问题,那到底是什么地方出了问题:
1、服务刚启动就关闭了:这个时候除了服务本身的问题,我们需要检查一下你的磁盘是不是满了
2、服务慢,时断时续,队列堆积:还是除了服务本身的问题,需要检查一下网络链路是不是畅通
3、连接不上服务器:这个除了你服务器有问题,也可能是网络改造或者网关配置的问题
目前就想了这么多,这是我经常碰到的问题,抛砖引玉吧,希望大家碰上问题别怕,静下心来思考。
原创文章,转载请注明: 转载自混沌
本文链接地址: 运维中最容易忽略的问题