咨询热线:400-010-1233在线销售咨询
不方便打电话?让科腾联系您:

首页 > 公司动态 皇冠娱乐国际

告别“救火式”IT运维时代如何打造高效运维监控
发布时间:2019-02-09 08:41 作者:皇冠娱乐

  在系统运维中,为了有效保障系统上线后的正常运行,需要对服务器进行持续的监控,保障其性能的稳定,并通过统计分析每天的各种数据,从而能及时反映出服务器哪里存在性能瓶颈、安全隐患等。

  我们常说,IT运维人员要有危机意识,明白有可能出现哪些问题,出现这些问题后该如何去迅速处理。

  在系统运维中,为了有效保障系统上线后的正常运行,需要对服务器进行持续的监控,保障其性能的稳定,并通过统计分析每天的各种数据,从而能及时反映出服务器哪里存在性能瓶颈、安全隐患等。

  一、上线、首先是备份,做好定时备份策略,备份所有你认为重要的数据,并且定期检查你的备份是否有效、全面;

  一般的监控到的结果是成功或者失败,如Ping不通、访问网页出错、连接不到Socket,发生时这些称之为故障,故障是最优先的告警。除此之外,还能监控到返回的延时、内容等,如Ping返回的延时、访问网页的时间、访问网页取到的内容等。

  当服务器或应用发生故障时告警信息内容非常多,如告警运行业务名称、服务器IP、监控的线路、监控的服务错误级别、出错信息、发生时间等。

  预先定义告警内容及标准使收到的告警内容具有规范性及可读性。这点对于用短信接受告警内容特别有意义,短信内容最多是70个字符,要在70个字符完全知道故障内容比较困难,更需要预先定义内容规范。如:“视频直播服务器10.0.211.65 在2012-10-18 13:00电信线次失败”,清晰明了的知道故障信息。

  每天收到一封网站服务器监控的汇总报表邮件,花个两三分钟就大致了解网站和服务器状态。

  主动(集中)监控虽然能不需要安装代码和程序,非常安全和方便,但缺少很多细致的监控内容,如无法获取硬盘大小、CPU的使用率、网络的流量等,这些监控内容非常有用,如CPU太高表示有网站或者程序出问题,流量太高表示可能被攻击等。

  对于监控同一台服务器的服务,需要定义一个主要监控对象,当主要监控对象出现故障,只发送主要监控对象的告警,其它次要的监控对象暂停监控和告警。

  实现对常见性故障业务自我修复功能脚本进行统一部署并对修复后故障进行检查告警检查频次不多于3次。

  一级系统实现7*24小时告警,二级系统实现7*12小时告警,三级系统实现5*8小时告警。

  实现对负载均衡设备、网络设备、服务器、存储设备、安全设备、数据库、中间件及应用软件等IT资源的全面监控管理;

  1.服务器监控,主要监控服务器如:CPU 负载、内存使用率、磁盘使用率、登陆用户数、进程状态、网卡状态等。

      皇冠娱乐,皇冠娱乐首页,皇冠娱乐官网 << 返回

         

皇冠娱乐娱乐官网

  • 联系电话:   400-010-1233
  • 地 址:       广州市天河区黄埔大道西平云路163号 广电科技大厦803-804、12楼
  • 传 真:     (8620)3835 2000
关于皇冠娱乐 | 联系皇冠娱乐 | 责任申明 | 网站地图 | 人才招聘 | 友情链接
Copyright © 2010 Guangzhou Ke Teng Information Technology Co. Ltd.All Rights Reserved. 粤ICP备09191042号