首页-人工智能- 智能运维

  • 挑战 · 价值

    挑战
    1. 系统压力大:
    平均日交易量可达3000笔+;每分钟系统性能指标数据达到GB级;运维数据只能保留月度数据甚至1~2周数据量。
    2. 运维协作少:
    运维条线僵硬,整合分析困难,出现运维死角;运维数据缺乏统一管理,造成根因甄别排错困难;业务部门与运维部门协调困难,难以实现敏捷开发,部署,上线快速业务创新。
    3. 数据利用低:
    大量的网络流量与事务处理、日志文件、报警与事件、性能指标数据没有有效利用;被动式IT运维方式,很少做到主动式/预测式IT运维,实现整体运维监控趋势把握。

    价值
    如右图所示:
  • 架构


    单指标趋势分析:

    通过统计学理论/数学算法对历史数据进行分析;按照不同日期特性,如:工作日/休息日/特殊运维日,进行单KPI预测;
    按照不同的时段特性,如:交易高峰时段/交易平峰时段,进行单KPI上下限预测;
    根据预测结果,结合实际值,制定不同的告警规则。
  • 多KPI关联分析

    多KPI关联分析:
    通过统计学理论,挖掘指标间的关联关系;通过统计学理论/数学算法对具有关联关系的KPI进行数据分析,找到各KPI之间的标准误差;通过算法计算各关联指标之间的标准误差,当标准误差超过算法范围后进行预警。

    多KPI关联根因分析:
    根据各KPI的影响度提出故障解决的推荐意见;当多个KPI之间的关系被打破,即发生异常时,通过对大量数据的挖掘和学习,在第一时间找到异常发生的原因。
  • 应用场景

    数据中心成为当代各个行业发展的核心业务支撑。随着科技的进步, 传统数据中心正逐步向智能、高效、绿色新一代数据中心与“云”中心发展, 其IT 基础设备部署呈现“ 大规模、高密度、复杂化”等特点,金融行业数据中心运维管理面临新的挑战。

    我们提供了DCLive特权访问管理方案:

    对机房的服务器主机、网络设备、软件系统的网内或带外维护访问必须先经过DCLive 的认证
    用户不需要保管被访问设备的特权帐号,通过密码代填功能,直接打开会话窗口,提升了访问效率,降低了安全风险
    支持命令行的操作, 例如telnet 、SSH 、Console 等。支持图形化的操作, 例如RDP、VNC、KVM 、IPMI等。支持第三方应用,例如电力调度专用的客户端,数据库客户端等程序
    提供完善的风险控制机制,用户对IT设备的各类访问操作,都会被记录下来,用于后期审计