是一个介绍如何利用思科先进技术解决客户难题的栏目。每期聚焦一个技术热点或应用场景,邀请资深思科技术专家深入浅出地介绍,为读者提供实用性强的建议。
正如上一期介绍的那样,我们身处多云多域的技术世界,企业应用比以往任何时候都更加复杂和不可预测。企业需要运维的数据量呈指数级剧增,传统的 IT 运维监控(ITOM)四大平台—— DEM 数字体验监控、NPMD 网络性能监控、ITIM 基础设施监控、APM 应用性能监控,在某种程度上均为单一技术孤岛,无法形成全栈式端到端的企业拓扑能力。
世界领先的信息技术研究与分析公司 Gartner 很早就认识到这一点,并在 2016 年首次将基于算法的 IT 运维平台(Algorithmic IT Operations Platforms)缩写为 AIOps,并且明确四大场景:
- 自动化
- 监控
- 服务保障和流程(企业服务台)
- 业务大屏
提出六大关键能力:
- 预测性洞察
- 智能告警
- 智能协作
- 自动化工作流
- 故障根因分析
- 决策支持
2017 年,Gartner 正式定义 AIOps(智能运维平台),解读为“Artificial intelligence for IT operations”:
- AIOps 平台利用大数据,现代机器学习和其他高级分析技术,以主动、个性化和动态的洞察力直接或间接地增强 IT 执行力(监视、自动化和服务台)的功能;
- AIOps 平台技术包括,使用多数据源、丰富的数据收集方法、实时和深度分析技术、数据呈现技术、自动化;
2020 年,Gartner 技术成熟度曲线报告(Hype Cycle for ICT in China)里显示,AIOps 仅需 “ 2-5 年进入平稳期 ”(2018 年为 5-10 年!)。AIOps 时代正在加速到来。
思科 AIOps 平台--- “ 家学悠久 ”
一向注重布局前瞻技术的思科在本世纪初就意识到,随着企业 IT 应用的逐渐丰富,运维必将成为企业关注的焦点,所以从那时起就开始在这个领域投资,虽然彼时 AIOps 还没有诞生。
概括起来看,思科 AIOps 布局呈两大特点:早 —— 早于行业探索、早于行业定义;广 —— 多云多域、全栈式、端到端(包括全球全链路)。

思科部分 AIOps 平台时间线
比如,全栈业务和应用性能管理 AppDynamics 连续 9 年 Gartner APM 魔力象限领导者地位,且今年六月份最新公开数据显示市场占有率和利润排名均为第一;
云原生微服务时代的工作负载零信任领域,Tetration(现已更名 Secure Workload)独占鳌头,为全种类工作负载,提供全流量可视化依赖和零信任多云策略,支持企业拓扑全自动化编排;
ThousandEyes 则是 DEM 领域的领导者,跨任何网络任何应用为每一个使用者提供可执行的洞察力,您可以参考之前分享的内容(千眼看多云(上)、千眼看多云(下));
Stealthwatch(现已更名 Secure Network Analytics)安全网络分析平台, 基于网络遥测数据、行业领先的机器学习和行为建模,为企业全网络提供行业领先的流量可见性和安全威胁分析,尤其新兴安全威胁检测和快速响应;
Intersight 则可为您提供传统和云原生应用和基础架构(网络和工作负载)的智能自动化、可解释的观察力和持续优化。
Nexus Dashboard 则为您简化混合云网络运维,提供深度网络洞察,和业务线侧应用模块的流量可见性;

思科典型的AIOps 平台: 多云多域跨技术栈
这样的布局特点,并非偶然。思科凭借超过 35 年的业界专业知识,累计部署超过 5000 万个网络,使得思科具备足够的数据量和多样性,来创建、训练思科高级的 ML 平台、构建最佳的 AI 算法、机器推理。夯实基础架构的同时,思科不断创新并持续扩展 AI 应用,打造业界先进的 AIOps 平台。经过长期稳扎稳打地发展,思科早已成为业内领先的 “ AIOps 巨人 ” 。只不过思科在网络市场的光芒过于耀眼,遮蔽了其在智能运维领域的优异表现。本文就从驱动思科 AIOps 平台的 AI 认知引擎开始,带领大家逐步了解思科 AIOps 的全貌。
火车跑得快全靠车头带——AI 认知引擎
AI 认知引擎是思科 AIOps 平台的核心,提供先进的 AI/ML 模块,比如预测分析、动态模型、智能异常检测、拓扑建立、智能关联、根因分析、跨部门协作和优化建议等等。

思科 AIOps 平台典型架构
思科 AIOps 引擎典型特点包括:
- 精准: 精准检测与告警,帮助在正确的时间采取正确的行动;
- 全栈: 跨不同技术域,智能关联, 提供对于业务、应用的全面可解释的洞察力;
- AI 驱动: 可解释、可信任的故障根因分析;
- 主动运维(pro-active):大大缩短平均故障修复时间(MTTR),让运维从被动走向主动,甚至自我修复;
- 安全: 漏洞和风险检测,覆盖应用全生命周期;
- 开放生态: 丰富的开放生态,与第三方不同类别工具/平台集成

思科 AIOps 引擎
全面的可解释的可视化、持续的洞察力、可信任的正反馈执行,将是您对于 AIOps 平台技术架构的追求目标;自我学习、自我管理、自愈,不再仅存在于科幻小说中,目前,思科 AIOps 平台引擎,远远超越行业普遍期待的前五大技术领域(参考思科报告 Agents of Transformation 2021),有助您通过 AI 改变业务、重新定义应用、守护您的客户并开启您全新的转型旅程。

思科 AIOps 引擎: 超越普遍期待的五大领域
在探索 AIOps 时无需多领域齐头并进,可以根据您自身的实际情况,探索落地实践的技术方向。在后续部分,我们将从多角度总结丰富的使用场景,供您参考思科 AIOps 如何赋能企业拓扑、助您加速数字化转型。

作者:王春艮
思科系统架构师