云监控如何监控服务器运行状态

腾讯云服务器监控通过在服务器上安装插件,为用户提供服务器的系统监控服务。目前支持linux和windows操作系统。
应用场景
您在腾讯云购买腾讯云服务器后,系统将自动开通腾讯云服务器监控服务。您可以使用腾讯云服务器监控服务对腾讯云服务器资源的使用情况进行进行查询,也可以通过监控图表和告警协助进行故障查询。
监控能力
云监控提供CPU、内存、网卡、磁盘等监控项,满足服务器的基本监控运维需求。
资源视图
1、点击【控制台】-【管理与监控】-【云监控】-【腾讯云服务器监控】,进入腾讯云服务器管理监控控制台,可查看实时的内存使用率、CPU使用率、磁盘空间使用量、磁盘读/写汇总次数。提示:为了获取到监控指标数据,请不要关闭系统中的qemu相关代理进程(如qemu-ga)

如何打开qemu-ga进程?
qemu-ga是一个运行在腾讯云服务器内部的普通应用程序(可执行文件名称默认为qemu-ga,服务名称默认为qemu-guest-agent),其目的是实现一种宿腾讯云服务器和腾讯云服务器进行交互的方式,qemu-ga这个进程还会采集腾讯云服务器的内存、磁盘利用率等状态,如果客户关闭qemu-ga,会导致无法修改腾讯云服务器名称、修改密码、查看系统性能监控。如果qemu-ga进程异常,需要手动打开,可以通过手动启动qemu-ga服务的方法(以CentOS6为例):serviceqemu-gastart。

2、点击腾讯云服务器名称,进入监控图表页面,在监控图表页面中,可以查看:
(1)CPU利用率、内存使用率、总流入流量速率、总流出流量速率。下方展示网卡监控图表,可以查看网卡的流入流出数据包速率、流入流出字节速率。支持“今天”、“昨天”、“一周”、“一月”四个周期的历史数据查询,其中今天和昨天是按照每五分钟粒度查询,一周和一月按照小时粒度均值查询。以5分钟为粒度的统计数据可保存2天,以小时为粒度的统计数据可保存一个月。
支持数据导出功能,导出的数据范围是根据用户选择的时间而定,比如说用户选择了今天,那么数据就是从今天的0点开始到点击导出按钮的时刻结束。
(2)网卡监控图表,展示包括网卡的流入流出速率,流入流出字节速率。支持“今天”、“昨天”、“一周”、“一月”四个周期的历史数据查询,其中今天和昨天是按照每五分钟粒度查询,一周和一月按照小时粒度均值查询,并且支持数据导出。以5分钟为粒度的统计数据可保存2天,以小时为粒度的统计数据可保存一个月。
点击网卡中的【新建】,根据页面向导可以设置网卡告警策略,在监控指标大于设置的阈值的时候,向设置的联系人发送告警短信。
(3)磁盘监控图表,包括系统盘和挂载硬盘的读写速率、读写IOPS。数据采集频率为5min/次,原始数据存储7天;按小时聚合后的数据存储30天。支持“今天”、“昨天”、“一周”、“一月”四个周期的历史数据查询,其中今天和昨天是按照每五分钟粒度查询,一周和一月按照小时粒度均值查询,并且支持数据导出。以5分钟为粒度的统计数据可保存2天,以小时为粒度的统计数据可保存一个月。
点击磁盘监控中的【新建】,根据页面向导可以设置磁盘告警策略,在监控指标大于设置的阈值的时候,向设置的联系人发送告警短信。磁盘策略只支持设置一个。
(4)分区监控图表,展示分区大小、分区已使用量。支持导出功能数据采集频率为5min/次,原始数据存储7天;按小时聚合后的数据存储30天。支持“今天”、“昨天”、“一周”、“一月”四个周期的历史数据查询,其中今天和昨天是按照每五分钟粒度查询,一周和一月按照小时粒度均值查询,并且支持数据导出。以5分钟为粒度的统计数据可保存2天,以小时为粒度的统计数据可保存一个月。
点击分区监控中的【新建】,根据页面向导可以设置分区告警策略,在监控指标大于设置的阈值的时候,向设置的联系人发送告警短信。分区策略只支持设置一个。目前磁盘分区监控的配额为8个。
当您使用腾讯云服务器的过程中,当出现操作系统卡顿、Kernelcrash时,系统会将这些状况判断为腾讯云服务器宕机,如果您做了宕机告警设置,则系统将会以邮件或短信对您进行通知。
说明:宕机监控仅支持linux腾讯云服务器的宕机告警,windows腾讯云服务器告警暂不支持。

宕机告警设置方法如下:

针对新建腾讯云服务器:您创建腾讯云服务器时选择的镜像中已包含一个watchdog设备,创建腾讯云服务器后,腾讯云服务器内部会启动一个喂狗程序,当腾讯云服务器内核出现panic时,watchdog长时间未被喂狗,将会进行宕机告警。
针对存量腾讯云服务器:在9.12日之前创建的腾讯云服务器,如果您有需求需要进行宕机监控,请您手联系客户经理建立工单,联系后台在libvirt侧向xml文件中添加watchdog参数、更新数据库。后台反馈配置完成后,您就可以手动进行安装watchdog的操作了。存量腾讯云服务器安装watchdog流程步骤请参考存量腾讯云服务器watchdog实现平台和腾讯云服务器内部配置方法v03.docx
您的腾讯云服务器安装好watchdog之后,就可以在腾讯云服务器监控详情页面看到监控图表了,其中状态2表示腾讯云服务器操作系统故障。您可以设置宕机告警策略,前往【告警服务】-【告警策略】页面,点击【新建】按钮,选择腾讯云服务器宕机监控项,告警阈值填写1。保存策略后,当您的腾讯云服务器发生宕机时,就会为您进行短信和邮件通知。另外,您可以查看今天、昨天、近一周、近一个月的宕机情况,系统支持对宕机状态进行导出。