Muitas vezes ao monitorarmos um link, criamos triggers que emitem os alarmes apenas quando um link apresenta uma queda total ou quando está em sua capacidade máxima. Mas e se acontecer de o mesmo apresentar apenas uma queda parcial, ou uma degradação? Para isto tem a possibilidade de criar uma trigger que emita um alarme de uma queda de mais de 30% de gráfico comparado ao total dos últimos 15min. Ou uma que apresente uma queda de mais de 60% comparando a ultima coleta com o mesmo horário a 7 dias atrás.
– Queda Parcial de 30%
Para criar essa trigger nós iremos usar a seguinte estrutura para o tráfego de “download”: {host:net.if.in[ifHCInOctets.OctetoDoItem].last()}<0.7*{host:net.if.in[ifHCInOctets.OctetoDoItem].avg(15m)} and {host:net.if.in[ifHCInOctets.OctetoDoItem].last()}>=100M
E a seguinte estrutura para o tráfego de “upload”:
{host:net.if.out[ifHCOutOctets.OctetoDoItem].last()}<0.7*{host:net.if.out[ifHCOutOctets.OctetoDoItem].avg(15m)} and {host:net.if.out[ifHCOutOctets.OctetoDoItem].last()}>=100M
Onde está escrito “host” devemos passar o nome do host que iremos criar a trigger e onde está escrito “OctetoDoItem” devemos passar o número do octeto do item que queremos criar a trigger, o octeto é uma identificação única de cada item. O ultimo parâmetro que passamos é o mesmo parâmetro usado para identificar queda total em um link, sendo que colocamos que ela precisa ser maior que o parâmetro, assim a trigger que queda parcial não ativa junto com a de queda total.
– Queda Parcial de 60%
Para criar essa trigger nós iremos usar a seguinte estrutura para o tráfego de “download”:
{host:net.if.in[ifHCInOctets.OctetoDoItem].last(#1)}/{ host:net.if.in[ifHCInOctets. OctetoDoItem].last(#5040)}<=0.4 and { host:net.if.in[ifHCInOctets. OctetoDoItem].last(#2)}/{ host:net.if.in[ifHCInOctets. OctetoDoItem].last(#5041)}<=0.4 and { host:net.if.in[ifHCInOctets. OctetoDoItem].last(#3)}/{ host:net.if.in[ifHCInOctets. OctetoDoItem].last(#5042)}<=0.4 and { host:net.if.in[ifHCInOctets. OctetoDoItem].last(#4)}/{ host:net.if.in[ifHCInOctets. OctetoDoItem].last(#5043)}<=0.4 and { host:net.if.in[ifHCInOctets. OctetoDoItem].last(#5)}/{ host:net.if.in[ifHCInOctets. OctetoDoItem].last(#5044)}<=0.4 and { host:net.if.in[ifHCInOctets. OctetoDoItem].last()}>50M
Para criar essa trigger nós iremos usar a seguinte estrutura para o tráfego de “upload”:
{host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#1)}/{ host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#5040)}<=0.4 and { host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#2)}/{ host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#5041)}<=0.4 and { host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#3)}/{ host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#5042)}<=0.4 and { host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#4)}/{ host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#5043)}<=0.4 and { host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#5)}/{ host:net.if.out[ifHCOutOctets.OctetoDoItem].last(#5044)}<=0.4 and { host:net.if.out[ifHCOutOctets.OctetoDoItem].last()}>50M
Onde está escrito “host” devemos passar o nome do host que iremos criar a trigger e onde está escrito “OctetoDoItem” devemos passar o número do octeto do item que queremos criar a trigger, o octeto é uma identificação única de cada item. O ultimo parâmetro que passamos é o mesmo parâmetro usado para identificar queda total em um link, sendo que colocamos que ela precisa ser maior que o parâmetro, assim a trigger que queda parcial não ativa junto com a de queda total.
Funcionamento de cada trigger
A trigger de queda parcial de 30% funciona da seguinte maneira, ela compara a última coleta do zabbix com a média das coletas dos últimos 15 minutos, caso tenha uma queda de 30% em relação da ultima coleta com a média e não tenha acontecido uma queda total, é emitido um alerta para a gente.
Já a trigger de queda parcial de 60% funciona comparando as ultimas 5 coletas do zabbix com as coletas de 7 dias atrás no mesmo horário.
Diferença entre as triggers
A trigger de queda parcial de 30% nós usamos com a ideia de descobrir quando temos uma queda repentina, já a de 60% nós usamos para comparar o tráfego com a semana anterior, para sabermos quando tem uma queda no tráfego de uma semana para a outra.
Gostou do nosso tutorial de hoje?
Diz para gente o que você achou?
Lembrando que nós temos o nosso monitoramento 24×7 e esse artigo foi escrito por nosso gestor de monitoramento, caso você não queira precisar se preocupar com sua rede nós te convidamos a conhecer um pouco mais nosso trabalho com o Made4Noc.