智能运维管理系统解决方案
自动化运维管理架构,为系统提供全面可靠的监管,最大程度降低故障时间造成的服务质量下降和业务损失,建立一套监测、响应、分析、管理的监管机制,有效提高业务系统的支撑能力。
智能运维管理系统解决方案优势
智能监控,高效运维,让企业洞悉IT管理情况。
智能运维管理系统模块设计
智能运维管理系统数据价值链
提升运维数据的应用价值,盘活数据资产
提高运维管理精细化和智能化水平
科技管理创新,提升IT服务价值
精准分析,未来IT发展决策支持
全层次、全管理域、全周期自动化运维管理,是智能运维基础。
采集配置层:负责实时性能数据、告警数据的采集、解析、上传,网元的统一操作配置;
应用处理层:完成事件流处理、相关资源、性能等数据的处理并入库;
业务视图层:通过归一化呈现方式,确保业务信息数据的快速呈现和管理。
数据获取方式有:
监控范围,分业务监控和设备监控2大类:
设备监控:主要监控主机、网络、数据库、存储、中间件等的基础体系指标;
业务监控:主要监控业务可用性、业务流量、业务服务能力等;
日常监控指标有:
主机:Ping、Ping丢包率、Ping时延、CPU占用率、内存占用率、虚拟内存占用率、分区占用率、采集登录异常、采集数据异常、磁盘IO读写速度(非Windows主机)、磁盘IO繁忙度(非Windows主机)、登陆用户数(非Windows主机)、系统总进程数(非Windows主机)、电源总状态(Dell)、风扇转速(Dell)、硬盘状态(Dell)、总体温度值(Dell)。
数据库:MSSQL表空间大小、MSSQL连接数、MSSQL日志空间占用率、MSSQL锁数量、MySQL表锁数量、MySQL流量、MySQL吞吐率、Oracle表空间占用率、Oracle当前连接数、Sysbase表空间占用率、Sysbase当前连接数 网络:Ping、Ping丢包率、Ping时延、CPU占用率、内存占用率、采集数据异常、端口流量、端口状态变更监控、开机时长。
中间件:JVM CPU占用率(JMX)、JVM live状态线程总数(JMX)、JVM内存堆占用率(JMX)、JVM内存非堆占用率(JMX)。
应用:采集数据异常、进程数量、进程占用CPU前N监控、进程占用内存量、连接/监听端口监控、网页登录状态监控、文件修改时间跟主机时间之差、应用端口检测。
其他个性化监控指标:根据客户需求来定制。
设备监控:
业务监控:
告警管理:
自动巡检:
统计分析:
设备资料管理:
系统拓扑:
机房资源管理效果图:
基于大数据分析技术的智能化IT运维,预测式的挖掘用户刚需,使营销更精准。
居民生活时空分析:基于A口信令数据挖掘分析居民生活时空轨迹、社交关系、出行路线等。达到大数据处理实时化,用户轨迹直观化,广告营销精准化。
公安110系统:基于基站位置信息,在GIS上及时呈现人员位置信息。
故障管理:跨业务领域的全面监控,通过声音、色彩、短信、邮件等方式通知用户告警消息,为解决故障提供建议的解决办法和案例。
应用范围:中国电信集团公司、广东分公司、佛山分公司、西藏分公司、公安局、房管局等领域。
目前已经应用到广东电信、集团电信的网管中,涉及电信移动、接入、交换、数据、业务平台、传输6个专业,纳入管控的设备将近12W台(其中包括10W个左右的WIFI-AP) ,约500多个业务系统。审计49亿3千万次操作,发现IPTV、短信等9个平台/系统共3101148次攻击;500多个账号出现11类违规使用问题近30万次;敏感信息不合规访问3000多次。
可监控的设备厂家:
随着数据量的庞大,实时数据的价值也将逐步降低,需要不断的将历史数据归档管理,为后续的关联性分析提供更有效的依据价值。