老wu自从搭建了博客网站之后,每天早上起来和晚上睡觉之前都要做一件事,便是拜访一下网站的页面,看看有没有挂掉 正所谓没有不被黑的网站,仅仅时间的问题,能及时发现网站被进犯能够下降形成的丢失,老wu的服务器运用阿里云的主动快照功用,每天都有主动备份,出现问题就先直接康复到前一天正常的网站再说。
但更多时分网站莫名挂掉是因为服务器资源耗尽了,比方突发的网络拜访量暴升,内存爆掉了等等。究竟阿里云服务器太贵,服务器的装备老wu都是依照刚好够用的准则,依照实践的拜访负载压力来装备的,阿里云服务器都是能够随时改变装备的,发现资源缺乏时就暂时把服务器的装备上调一个档,然后再测验几天看看。
现在阿里云后台监测功用做的还算蛮完善的,有不错的后台功能监测器,还能够装置他家的手机APP随时随地监测服务器的资源压力,还能够设置预警值,比方磁盘占用率到达必定份额后主动给你发短信告诉,像CPU占用率、内存、带宽等等常用的监测目标都能够设置短信告警值。
但这些目标都是一些比较粗粒度的监测值,你能经过这些目标发现服务器存在问题,但具体什么问题,还欠好判别,比方你收到一个CPU占用率长期都处于100%的告警,但具体是什么原因形成这么高的CPU运用率,是不是中毒了,或许服务器被当成肉鸡帮别人算比特率了,你就得进入linux体系的shell经过各种指令去查看相关的功能监测目标,比方经过ps指令查看当时进程状况,经过top指令查看体系中各个进程占用资源的状况,经过iftop查看各个进程的网络衔接状况,是否有可疑进程衔接到了可疑的外网IP。
这儿老wu罗列一些平常保护linux常用到的指令供我们参阅:
top 能实时查看体系中各个进程资源占用状况
free 能够显现Linux体系中闲暇的、已用的物理内存及swap内存,及被内核运用的buffer
df 查看linux服务器的文件体系的磁盘空间占用状况。能够运用该指令来获取硬盘被占用了多少空间,现在还剩余多少空间等。
netstat 可用于列出体系上一切的网络套接字衔接状况,包含 tcp, udp 以及 unix 套接字,别的它还能列出处于监听状况(即等候接入恳求)的套接字。
iftop 实时流量监测东西
假如需求监测更多愈加具体的linux功能目标,老wu这儿共享一份歪果仁总结的PDF,里面图文并茂列举了许多相关的linux指令,值得保藏。
来历:吴川斌的博客