业务性能管理案例

业务性能管理案例

用户的业务活动从来没有像现在这样依赖于网络系统,核心业务和支撑业务系统的发展相互促进、互相影响,系统在发展中变得更加庞大和复杂。支撑核心业务的网络运维工作,包括网络基础设施、相关的应用系统、数据库以及安全保障系统的运维已经成为至关重要的工作,网络系统的运维终将和企业的核心业务活动完全融合起来。

科来认为运维的根本是保障业务的安全、持续、高效与稳定运行,而业务表现在网络中则是川流不息的数据。在传统的网络运维工作中,通常更关注网络设备的运行状态,这固然重要,但却忽略了最核心的业务数据。因此要解决运维工作的根本问题,需要对传输于网络中的业务数据进行实时监控与分析。

这些分析不是停留于表面,更不是仅仅对统计数据进行分析,而是对网络中的全流量进行实时的、智能的、完全可视的分析。因此,精细化分析是基础,它能提供全面的业务网络运行关键性能指标;智能化分析是关键,能够主动发现业务运行异常;可视化分析是直观展现,帮助用户高效发现与定位分析业务运行过程中的问题。

第01章 如何定位系统大面积无法访问的根源

客户端或称为用户端,是指与服务器相对应,为客户提供本地服务的程序。而当客户端无法访问时,将造成所有服务的直接中断。针对这一问题,运维人员将进行大量的排查工作,且由于原因的多种多样使得排查难度增大。面对这样棘手的问题,如何第一时间定位问题原因并有效解决?本案例通过讲解如何运用网络回溯分析技术而快速精准定位该类事件的问题根源。

第02章 如何解决支付交易间歇性失败问题

间歇性业务故障往往是运维人员的工作难点之一,随着网络设备日渐增多,网络环境也变得更加复杂,但保障业务性能仍需要各个设备正常运行,因此故障排查难度也越来越大。本案例将通过解决由WAF设备异常引发的支付交易故障,为运维人员提供面对间歇性业务故障时的应对思路。

第03章 如何解决SSO单点登录跳转异常问题

应用出现访问异常,很大可能是由于网络设备出现故障或者设备关联验证过程中出现了问题造成的。但是在部分情况下,对系统程序的设置也会成为造成异常现象的原因所在。正如本案例所介绍的单点跳转异常情况。

第04章 如何发现由设备机制引发的应用故障

当业务系统中的设备进行切换后,往往业务故障也随即出现。我们通常认为问题的发生是由新旧设备的策略差异导致的。但在实际情况中,往往问题根因在于某些设备自身的机制造成,设备的切换只是让这些潜在的问题展现出来,并对业务产生负面影响,正如本案例所述。

第05章 如何定位应用中断的根源

核心业务和支撑业务系统的发展相互促进、相互影响,系统在发展中变得更加庞大和复杂。尽管网络运维技术的不断进步,但能够影响业务运行的因素也越来越多,网络效率、应用状态甚至一些安全检测活动都会与业务的稳定运行息息相关,这使得解决问题变得困难和复杂。本案例将详细讲解在突然发生应用中断的情况下,如何快速、精准定位问题的原因。

第06章 如何定位FTP传输效率低的根源

FTP服务器作为网络传输环境中的重要组成部分,很多FTP传输的本身就是非常重要的业务数据,如果传输质量打折将会直接影响到业务的效率。本章节将通过讲述在同一网络中因未知因素影响FTP传输效果的案例,以及如何排查发现传输故障的根源。

第07章 为何正常应用会被阻断

防火墙作为重要安全设备普遍部署在网络边界中,为网络与业务的正常运行提供必要的安全保障。然而当防火墙设备出现故障时,即使配置策略正确,也极有可能对正常数据作出非正常操作,阻碍通讯,甚至会影响业务数据传输。

第08章 如何分析无盘客户端无法正常启动

随着网络架构的不断升级,数据流通经过的中间设备也日益增加。面对客户端出现的异常情况,常规分析手法难以确定故障原因。本案例将介绍如何使用网络流量分析技术精准定位客户端异常启动的根因。

第09章 如何定位引起网络丢包的根源

网络丢包通常是比较难排查的问题,因为造成网络丢包的原因很多,排查此类问题需要很长的时间。本案例中,通过对网络通信数据进行比对分析,从而找到引起网络丢包的问题根源。

第10章如何解决网络设备之间工作机制冲突问题

在交换机进行数据转发时,对于Native VLAN的数据转发都应该是不打VLAN标签的,但是不同核心处理系统的交换机在VLAN标签的处理上却有不同的处理机制,如果出现工作机制冲突,网络故障也就会随之而来,正如本案例所示。

第11章 如何解决远程VPN连接失败问题

链路负载均衡设备可解决多链路网络环境中流量分担的问题,提高多链路的带宽利用率,保障了网络通信的稳定性。为用户和应用系统分配最佳的通信线路,使用户获得绝佳的访问体验。但也存在因为策略配置或设备自身问题引起的连接失败。

第12章 如何解决业务应用访问失败的问题

许多企事业单位对业务系统的性能、稳定性和扩展性有很高的要求。在业务网络环境中,负载均衡设备由于能对网络设备和服务器的带宽、吞吐量和数据处理能力进行扩容而备受青睐。然而负载均衡设备作为流量转发的一个环节,如果发生故障,也有可能导致业务访问失败,与正如本案例所示。

第13章 如何定位系统大面积无法访问的根源

用户访问互联网需要通过很多网络节点,如交换机、防火墙、IPS、防毒墙、流量控制、负载均衡设备等,一旦出现不能上网的情况,每个节点都会是可疑的故障节点,大大增加了维护人员的排查工作量。本案例将详细讲解如何迅速精准定位故障节点。

第14章 如何解决部分用户无法访问应用问题

当应用出现不能访问时,我们通常会怀疑是某个网络设备或端点设备的问题,然而本案例的分析过程告诉我们,经验往往是不准确的。

第15章 如何发现大型网络中网络环路问题

当网络环路发生时,会出现网络及应用访问缓慢、网络丢包甚至无法正常提供服务等异常。通常在大型的网络中发现网络环路是比较困难的,本案例介绍了如何通过网络分析技术发现网络环路。

科来将陆续更新更多业务性能管理案例