Muitas vezes ao monitorarmos um link, criamos triggers que emitem os alarmes apenas quando um link apresenta uma queda total ou quando está em sua capacidade máxima. Mas e se acontecer de o mesmo apresentar apenas uma queda parcial, ou uma degradação? Para isto tem a possibilidade de criar uma trigger que emita um alarme de uma queda de mais de 30% de gráfico comparado ao total dos últimos 15min. Ou uma que apresente uma queda de mais de 60% comparando a ultima coleta com o mesmo horário a 7 dias atrás.

– Queda Parcial de 30%

Para criar essa trigger nós iremos usar a seguinte estrutura para o tráfego de “download”:  {host:net.if.in[ifHCInOctets.OctetoDoItem].last()}<0.7*{host:net.if.in[ifHCInOctets.OctetoDoItem].avg(15m)} and {host:net.if.in[ifHCInOctets.OctetoDoItem].last()}>=100M

E a seguinte estrutura para o tráfego de “upload”:

{host:net.if.out[ifHCOutOctets.OctetoDoItem].last()}<0.7*{host:net.if.out[ifHCOutOctets.OctetoDoItem].avg(15m)} and {host:net.if.out[ifHCOutOctets.OctetoDoItem].last()}>=100M

Onde está escrito “host” devemos passar o nome do host que iremos criar a trigger e onde está escrito “OctetoDoItem” devemos passar o número do octeto do item que queremos criar a trigger, o octeto é uma identificação única de cada item. O ultimo parâmetro que passamos é o mesmo parâmetro usado para identificar queda total em um link, sendo que colocamos que ela precisa ser maior que o parâmetro, assim a trigger que queda parcial não ativa junto com a de queda total.

– Queda Parcial de 60%

Para criar essa trigger nós iremos usar a seguinte estrutura para o tráfego de “download”:  

{host:net.if.in[ifHCInOctets.OctetoDoItem].last(#1)}/{ host:net.if.in[ifHCInOctets. OctetoDoItem].last(#5040)}<=0.4 and { host:net.if.in[ifHCInOctets. OctetoDoItem].last(#2)}/{ host:net.if.in[ifHCInOctets. OctetoDoItem].last(#5041)}<=0.4 and { host:net.if.in[ifHCInOctets. OctetoDoItem].last(#3)}/{ host:net.if.in[ifHCInOctets. OctetoDoItem].last(#5042)}<=0.4 and { host:net.if.in[ifHCInOctets. OctetoDoItem].last(#4)}/{ host:net.if.in[ifHCInOctets. OctetoDoItem].last(#5043)}<=0.4 and { host:net.if.in[ifHCInOctets. OctetoDoItem].last(#5)}/{ host:net.if.in[ifHCInOctets. OctetoDoItem].last(#5044)}<=0.4 and { host:net.if.in[ifHCInOctets. OctetoDoItem].last()}>50M

Para criar essa trigger nós iremos usar a seguinte estrutura para o tráfego de “upload”:  

{host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#1)}/{ host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#5040)}<=0.4 and { host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#2)}/{ host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#5041)}<=0.4 and { host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#3)}/{ host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#5042)}<=0.4 and { host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#4)}/{ host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#5043)}<=0.4 and { host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#5)}/{ host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#5044)}<=0.4 and { host:net.if.out[ifHCOutOctets.OctetoDoItem].last()}>50M

Onde está escrito “host” devemos passar o nome do host que iremos criar a trigger e onde está escrito “OctetoDoItem” devemos passar o número do octeto do item que queremos criar a trigger, o octeto é uma identificação única de cada item. O ultimo parâmetro que passamos é o mesmo parâmetro usado para identificar queda total em um link, sendo que colocamos que ela precisa ser maior que o parâmetro, assim a trigger que queda parcial não ativa junto com a de queda total.

Funcionamento de cada trigger

A trigger de queda parcial de 30% funciona da seguinte maneira, ela compara a última coleta do zabbix com a média das coletas dos últimos 15 minutos, caso tenha uma queda de 30% em relação da ultima coleta com a média e não tenha acontecido uma queda total, é emitido um alerta para a gente.

Já a trigger de queda parcial de 60% funciona comparando as ultimas 5 coletas do zabbix com as coletas de 7 dias atrás no mesmo horário.

Diferença entre as triggers

A trigger de queda parcial de 30% nós usamos com a ideia de descobrir quando temos uma queda repentina, já a de 60% nós usamos para comparar o tráfego com a semana anterior, para sabermos quando tem uma queda no tráfego de uma semana para a outra.

Gostou do nosso tutorial de hoje? 

Diz para gente o que você achou?

Lembrando que nós temos o nosso monitoramento 24×7 e esse artigo foi escrito por nosso gestor de monitoramento, caso você não queira precisar se preocupar com sua rede nós te convidamos a conhecer um pouco mais nosso trabalho com o Made4Noc.