当网络问题并不杂乱,并且当咱们都来自同一个安排的时分,专家团队办法能够有用地对事端作出呼应。但近年来,跟着根底架构云端化,相关利益主体散布在不同的部分、公司和地舆区域,针对网络事端和事务运用功能问题的根本原因剖析(RCA)变得越发困难。
为满意服务水平协议(SLA)要求并避免客户丢失,快速查明根本原因已成为许多企业的首要任务。可是,据《Emulex可视性查询》标明,79%的企业从前将事端产生的原因过错地归咎于某个IT部分,这不只增添了紊乱程度,还推延了处理问题的时刻。
针对以上问题,本文将介绍一个由数据包剖析驱动的毛病域阻隔(FDI)办法,协助企业进行毛病检修并处理网络和运用功能问题。
外包成为干流
即便整个根底架构由一家企业全部,要充沛了解整个根底架构的实践状况也会十分困难。更何况,当外包事务敏捷扩张时,端到端事务运用就会逐步呈现许多盲点。假如整个技术层都被外包出去,就会呈现一个巨大的盲点,导致您无法在该技术域内进行RCA。为了适应技术外包的趋势,企业有必要清楚地差异事端呼应作业流程中FDI阶段与RCA阶段的意图和要求。
什么是FDI?
FDI的理念很简略,任何看过病的人都不难理解,它跟医疗保健范畴的“事端查询”流程在本质上相似。首要,一名全科医师会进行开端评价、安排确诊测验并评价成果。然后,患者将承受专科医师的查看,并且只要在依据充沛、能够承认病况时才会进行其他确诊和医治。确诊进程以现实而不是以猜想作为依据。
布置FDI的企业期望最大极限地削减参加每次事端查询的技术专家的人数和类型,这便是FDI需求在RCA之前进行的原因。这样做的意图是为了在开端深化剖析根本原因之前找到一个可疑的技术层。为什么要按技术进行阻隔呢?一是因为IT部分和外包事务通常是按技术区分的,二是因为这样有助于快速削减参加人员的数量。因为只会牵涉到一个毛病域,技术阻隔能够避免整个部分及外部企业因为承受查询而导致事务中止。这就比如您不会让一名神经外科医师来查看脚趾骨折相同。
FDI的一个首要意图是避免查询进程中“彼此推诿”的现象。要使FDI更为有用,有必要供给确凿的依据,证明某个“可疑”子体系或技术层是导致问题的根本原因。一起,还需求承认任何其他子体系或技术层不行能是问题的本源地点。当毛病域坐落外包技术中时,这一点尤为重要。
在将问题移交给担任的团队或服务供给商处理的时分,有用的FDI还有助于供给与特定技术相关、可付诸行动的数据,这将为技术团队供给相关情形、症状和信息,以便他们当即针对其所担任的体系进行深化的根本原因剖析。
图1: 事端呼应流程
只需求一组现实
为确保其功率及有用性,FDI需求依据在技术层之间交流的实践数据包进行剖析。数据包不会“说谎”,它们也不会掩盖平均值或统计数据中的要害细节。以根本数据包作为依据能够确保FDI流程找到关于事端具有不行推卸责任的毛病技术层。
“首要FDI”指的是将事端交予特定技术团队或外包服务供给商。它的方针相对简略,即在少量部分、团队以及外包服务商中分配事端,因而是一种极为经济的施行办法。在实践操作中,它触及的技术层、网络中的分路点以及在每个技术层之间进行监控的网络记载器均相对较少。
什么原因导致了推迟?
当人们认真地进行RCA并且有自傲承认问题地点的时分,人们就能够降低成本并缩短处理问题的时刻。当担任处理问题的人员具有正确评价原因及处理问题的专业技术时,RCA就能到达最佳作用。
在前文,咱们说到以数据包为导向的FDI流程能够有用加速事端查询并削减参加人员数量。此外,FDI不需求许多分路器和设备即可对首要技术层进行阻隔,然后完结其首要方针——仅指使相关的人员参加事端查询。那么,为什么许多重大事端查询依然需求举行专家小组会议呢?
问题在于,有的人以为,只是依托若干分路器和网络记载器不足以彻底处理杂乱的事端。您知道吗?他们的观点是正确的。可是,这并不是事端查询流程FDI阶段的方针,该阶段的方针是阻隔毛病。经过根本数据包以及数据包剖析的流程,您能够简略有用地完结这一方针。
分而治之
首要/一级FDI流程会将事端阻隔到由企业内部结构和外包安排所界说的单一技术层。要到达首要FDI的最佳作用,咱们需求:1) 运用网络记载东西监控和贮存技术层之间产生的网络流量;2) 经过运用事务剖析(Application Transaction Analysis)来进行毛病阻隔。数据包存储关于高效的FDI所依靠的回忆性剖析(Back-in-time Analysis)至关重要。
您或许现已猜到,FDI是一个能够分层布置的“分治”流程。您还能够在每个技术层次中进行FDI,然后进一步阻隔问题,直到高效完结RCA。这个进程能够称为“层内FDI”或“辅佐FDI”。
辅佐FDI作业流程特别适用于网络事端查询。同理,为到达FDI的最佳作用,咱们需求监控并贮存要害网络组件之间的实践数据包流,然后进行有用的回忆性剖析。
假如以网络内FDI作为方针,则需求了解应在哪些方位布置网络分路器和网络记载东西。首要FDI与网络内FDI之间的首要差异在于查询点的方位更多与物理方位、技术、职工专业技术以及外包程度和外部供给商有关,与安排问题关系不大。可是,FDI流程较为相似:履行依据数据包的剖析以供给确凿依据,然后承认哪些技术或服务供给商存在问题、哪些不存在问题。
一直运转仍是一直可用?
咱们不期望比及产生重大事端时才开端布置履行FDI所需的分路器和监控东西,这将与FDI的初衷各走各路。因而,咱们应布置并一直运转履行首要/一级FDI所需的分路器和网络记载东西。
可是,怎么履行辅佐/技术内FDI呢?怎么处理长途站点、地区性数据中心和非要害性运用呢?您不行能四处进行分路,也无法贮存全部内容。
走运的是,人们开发了许多网络记载东西,以满意首要技术层之间的“一直运转”记载需求,以及经过网络数据包署理连接到很多二级分路点的“一直可用”记载需求。一直可用的设备纷歧定能够确保长时间的回忆可视性,但您能够在需求时快速装备这些设备,依据当时事端查询的特定可视性需求进行监控。
如此简略?
那么,FDI真的像咱们所说的那么简略吗?咱们需求辩证地答复这个问题。很显然,在现代企业联网事务运用根底架构这样杂乱的动态体系中,或许会呈现各种失常、杂乱乃至是匪夷所思的问题。您一直需求对这些类型的问题进行深化查询,并使用专家的技术和常识来加以处理。但这并不能阐明FDI与有用处理这些负载问题无关。现实上,这些问题使一个严厉、可重复、由数据驱动的FDI流程更为重要了。要处理杂乱问题,为什么不选用FDI这种久经考验的“分治”办法呢?