IT运维管理的挑战

  • 我们到底有多少在线的网络设备,模块,服务器,数据库等IT资产?
  • 这些系统的软硬件版本,模块,生命周期情况怎样?
  • IT系统日常变更导致资产数据变化,怎么及时准确维护数据?
  • IT服务如果出了问题,是否能快速定位和恢复?
  • 运维部门人少活多,怎么提升运维效率?
  • 大量重复的运维工作能否系统自动帮助执行?
  • 怎么减轻运维人员的负担,快乐的运维?
  • 公司IT系统整体运维水平到底处于什么状态?

GeneInfo的解决方案

GeneInfo 是基于大数据和开源架构;基于HTML5展现框架的分布式网络,系统和应用的综合监控管理平台(NMS+APM+CM),是一个可以进行高度客户化的开放系统。

资产管理

  • 全网自动扫描发现设备及其模块,自动判断设备类型,自动归档。
  • 自动发现设备软件件变化(型号、软件版本等)、设备改名或变更管理IP地址,自动更新数据并通知,无需用户参与。
  • 自动轮询资产及设备状态,并自动分析判断设备上线、更换、下线拆除,并自动更新设备数据库。
  • 可节省大量用户日常维护工作量,提升运维效率,数据准确性和实时性,实现随需应变的运维基础数据自动化管理。

性能管理

  • 采用分布式的性能数据采集方式,能大规模同一时间采集数几十万至上百万的性能数据点,并且易于扩展。
  • KPI、采集时间间隔完全客户化自定义配置,支持KPI动态表达式计算,可对设定的节点组、端口组进行统一配置。
  • 使用HTML5技术对性能数据进行展现,支持柱状图、折线图、饼图等多种图表,并提供RealTime实时图表。
  • 灵活的阀值报警策略,支持二级阀值并可自定义报警消息正文。

事件管理

  • 支持丰富,压缩,对冲,关联,合并,转发,抑制,自动降级,降噪,自动化等处理
  • 支持声光电,短信等高级方式,支持自动升级告警处理
  • 基于正则表达式的事件预处理模板
  • 主要有两类初级分析处理模板:syslog事件模板和分析trap事件的模板
  • 可选用快数据技术进行强大高效的事件处理
  • 集中分析处理来自不同厂商的网络设备事件,对不同格式的网络设备事件均可实现定制化处理
  • 多种高级事件处理模板功能,直接配置即可完成事件的复杂关联分析处理,如关联丰富
  • 将事件的业务影响作为事件处理模型的一个维度,事件业务影响分析直接集成到事件处理过程中
  • 通过部分高级模板配置实现部分事件深度分析处理
  • 可选用 “快数据”进行高效分析处理,能实现秒级的事件智能化深入处理,大大提高了事件的智能化分析能力;强大的事件高级分析处理模板,将复杂的事件处理二次开发变为简单的模板配置

拓扑管理

  • 支持全网自动发现异构网络环境的物理和逻辑拓扑,包括冗余链路的发现;同时自动发现和手动相结合
  • 拓扑具有层次结构
  • 活动和全景拓扑:关联实时事件,实时告警,导航设备信息、事件列表信息等

自动化运维

  • 设备配置的备份
  • 自动化配置下发
  • 配置变更比对
  • 标准化配置审核
  • 自动化健康检查

灵活的可自定义门户界面