
然而,用户享受便利的另一面是多云给运维带来的巨大挑战。比如当用户体验变差时,如何判断是智能终端的问题?还是某一个运营商线路的问题?抑或是云服务或企业服务商的问题呢?思科在近期纳入麾下的又一个 AIOps 产品(基于人工智能的运维) — ThousandEyes ,正是为了解决这个难题而生。ThousandEyes 成立于 2010 年,针对各类企业/服务供应商/金融提供丰富的网络全路径透视解决方案,能够可视化地展示全网络企业本地和云端的应用响应情况。典型客户包括微软、salesforce、CapitalOne、PayPal、mastercard、NTT 通信、CenturyLink (运营商) 、COMCAST 等等。
下面我们用 4 个场景来看看 ThousandEyes 如何帮我们看透多云世界的迷雾,享受满分服务。

场景一 令人抓狂的网课
“爸爸,我的在线课堂回放又看不了啦。呜呜呜…”
爸爸赶忙跑过来。
“宝贝别着急。爸爸来找支持热线。”
“喂喂喂,你们这个怎么回事啊?“
没有 ThousandEyes 的情况下…
“ 先生您好,我们其他大部分用户都能正常上课。
要不您重启一下应用试试?
……
要不您重启电脑试试?
……
要不您重启路由器试试?
……
都不行……那过会您再试试?”
“ 都快下课了!你们到底知不知道问题出在哪儿?” 爸爸愤怒地摔了电话。
有 ThousandEyes 的情况下…
客服热线接到客户投诉后打开运维界面,即可反馈给家长是网络某段链路问题还是内容服务端有问题,并给出正确的建议,省却了无尽的猜测和扯皮。
ThousandEyes 是如何做到的呢?
以访问 Webex 的一段视频录像课为例,ThousandEyes 会自动诊断电脑本身,无线、网关以及目标网站的访问速度是否有异常。

如果确认不是家里网络的原因,可以查看全链路的健康状态判断哪个运营商哪段线路可能有问题。

瀑布流( Waterfall )甚至可以揭示非网络的问题,比如下图会议视频的回放失败,是因为该内容已经失效。

更棒的是 ThousandEyes 提供完善的 “分享” (运维画面的网址) 功能,任何故障,可以分享给合作的运营商 (或多云运营商) 运维团队,便于高效、精准的定位和修复故障。无需盲目重试重启,就能让运维团队知道在何处施力。
场景二,千年等一回的网页
“ 每天都要连回公司的服务器提交项目汇报已经够累了,现在这页面不但越来越慢,还经常打不开。我一定要找运维的人问问怎么回事。”
没有 ThousandEyes 的情况下…
“ 小王,这应用怎么越来越慢啊?是不是网络不好?”
“ 有可能是网络,只是不知道是哪个环节的网络。其实吧,也有可能是服务器容量不够?或者这个新应用性能不够优化?”
“ 到底是什么原因?能不能赶紧解决?”
“ 我找其他几个团队问问去… ”
若干天后…
“ 小王,上次说的问题好像有点改善了?你们怎么解决的?”
“ 我刚凑齐应用部门,服务器部门和网络部门的人,应用反应速度又自己变快了。所以我们也不知道怎么回事。”
“ 啊!那没找到原因,以后再出事了还是不知道怎么办嘛?”
“ 嘿嘿,这个嘛… 我们打算请法师给贴个平安符…”
有 ThousandEyes 的情况下…
“小王,这应用怎么越来越慢啊?是不是网络不好?”
“ 让我看一下 ThousandsEyes 的分析 ”
一分钟后…
“ 老板,不是网络原因。我们的用量比较大,应用系统反应有点慢 。” 服务器部门反映 “虚拟机资源有点不够了,我们加点服务器资源就能解决了。”
ThousandEyes 是如何做到的呢?
ThousandsEyes Enterprise Agent (企业版本的代理) 除了能装在网络设备上外,还可以安装在企业私有云或公有云平台的虚拟机或者服务器上,检测目标服务,模拟不同区域的员工对于同一个服务的访问。可视化页面让 IT 运维团队一目了然前后数日的访问性能,避免了从不同部门收集数据的麻烦:

可视化运营商全路径、节点和线路质量,让运维团队精准定位故障点:

ThousandEyes 的 “ 神通 ” 远不止以上这些,欢迎移步到本文的下篇了解更精彩内容。