NetScout NEI体验

作为应用性能管理领域的领导厂商,Netscout以应用流量数据分析和性能管理方面的先进技术闻名业界,其中以CDM(common data model 通用数据模型)和KPI(Key performance indicator关键性能指标)为核心的流量管理方法论更是为广大用户推崇。

Netscout 并没有满足于此,持续进行技术创新,不断地在推出新的产品功能,引领着应用性能管理技术的风向。这不,在Netscout最新的产品版本4.11中,我们惊喜地发现PM(Performance Manager性能管理平台)中增加了 NEI功能模块。这个NEI的模块对Netscout的应用性能管理产品来说,具有里程碑式的意义。其中的缘由,后文会慢慢道来。

在应用性能管理的初期,大部分厂商的产品都着眼于监控应用服务器的资源使用情况和应用进程运行。这种监控存在监控时间精度低(分钟级别的监控周期)和监控颗粒度粗(进程级别)的缺点,无法满足日益提高的业务扩展和用户体验要求。以Netscout为代表的一批应用流量性能管理厂商,通过先进的流量分析技术和强大的硬件引擎,引领应用性能管理走入精细化管理的时代。用户通过Netscout的流量性能管理的解决方案,可以实现毫秒级精度和应用会话层面的性能分析和管理。至此,应该说流量性能的解决方案达到相当完美的程度,可以满足绝大部分用户的需求。但 Netscout的产品研发人员凭着对技术发展的敏感性和用户需求的把握,将解决方案从精细化管理更进一步,实现对业务运行的可视化管理,帮助用户实时洞察业务运行的态势,提高管理效率和决策的灵活性。解决方案更新完善的成果,就是NEI(Netscout Enterprise Intelligence)。

我们在负责业务应用的日常运维管理过程中,基本上都会碰到以下困惑:用户访问业务应用的过程中,都要经过或短或长的路径,才能最终到达服务器端进行应用访问。这期间经过了多个网络节点,可能包含路由器,交换机,防火墙,负载均衡等设备,路径上无论哪个环节出现问题,都会影响应用访问的效果和用户体验。而应用性能管理往往只是部署在服务器一端,一旦中间环节出现问题,就只能感叹鞭长莫及了。此时唯一的解决办法只能是协调每个环节的管理人员,进行分区排查,这样的方式费时费力,效率低下,无法满足日益提高的SLA和 MTTR 等运维标准的要求。

这时候,可能会有人产生疑问:这个问题我们早就意识到了,为此已经在需要重点保障的核心业务访问路径上进行了流量性能监控设备的多点分布式部署,一旦出现问题,可以立刻从多个部署节点上获取流量数据报文进行对比分析,找出问题所在。NEI 有什么创新之处么?

首先,从多个分布式节点采集上来的数据包数据量会比较大,采集和分析过程需要耗时较长;其次分析数据包的人员需要对网络和应用协议都具有丰富的经验;最后这种手段只能作为临时性的故障诊断的手段,无法通过可视化的界面对问题进行实时的持续监控。

NEI 采用 ASR(Adaptivesession record自适应会话记录)技术,深入到数据报文的应用层抽丝剥茧,将应用会话的关键信息如会话 ID, 用户 ID,会话内容等信息抽取后储存成为单独的记录。每个节点上的ASR记录通过相同的记录主键和非主键等信息进行关联,汇总融合后在 PM上 形 成 应 用 会 话 的 SessionASR。

这样,在 NEI 的管理界面上就可以对每一个应用会话的细节进行可视化的管理,会话环节上的细微扰动都会直接纤毫毕现的呈现在管理界面上。

我们可以直接定位问题所在并观察 ASR 中的相关指标,如果需要进一步详细的信息,从ASR 记录上可以直接关联到对应环节的探针设备提取完整的数据包进行深入的分析。

目前NEI可以支持大部分在企业中应用广泛的应用协议,如HTTP,FTP,DNS 和 LADP 等,特别值得一提的是NEI对ISO 8583协议的支持, ISO 8583是国际上通用的金融行业应用通讯报文协议,在金融行业里有着广泛的应用,同时以金融行业为首的服务行业对业务的可视化管理,降低 MTTR和提高用户体验需求正日趋强烈。由此,可以期待NEI将在即将到来的业务应用可视化管理时代大放异彩。

Gavin