Olivier Le Moal - stock.adobe.co
Por que um bom gerenciamento de alertas é importante na gestão dos recursos de TI?
Especialista da Telcomanager enfatiza a necessidade de mais atenção ao monitoramento proativo do consumo de recursos dos recursos tecnológicos para evitar paralisação dos negócios.
Quando ocorre qualquer anomalia na rede de computadores, a pior coisa que pode acontecer é o administrador de TI não ser alertado sobre o fato, impedindo que seja adotada uma ação preventiva ou corretiva de incidências e colocar as empresas em situações de alto risco. Por esta razão, a configuração adequada de alarmes possui grande importância no cotidiano das organizações. Segundo Marco Catunda, CTO da Telcomanager, as empresas devem sempre estar alertas e em dia com a saúde dos recursos tecnológicos e, para isso, é necessário garantir a elevada capacidade proativa no monitoramento da rede de computadores e de toda a infraestrutura de TI.
De acordo com o executivo –que é graduado em Engenharia de Telecomunicações pela Universidade Federal Fluminense e com mestrado em Ciência da Computação pela Pontifícia Universidade Católica do Rio de Janeiro– “a crescente complexidade das redes de computadores é, geralmente, proporcional à sua importância para as empresas. Principalmente em um ambiente altamente competitivo e da necessidade de inovações contínuas que exigem elevado consumo de recursos de TI, e onde o dimensionamento da infraestrutura torna cada vez mais necessários para poder enfrentar os desafios empresariais. Por esta razão, segundo ele, capacidade alarmística na gestão dos recursos de TI é vital para as empresas”, afirma ele.
Catunda explica que a alarmística é definida pelo conjunto de técnicas para desenvolver, configurar e instalar alarmes para a prevenção de situações de risco, tais como incêndio, intrusão, medição de temperatura, entre outras aplicações. No caso da TI, é a capacidade de alertar aos gestores sobre qualquer ocorrência no ambiente de aplicações e dispositivos para que se possa se antecipar proativamente e evitar anomalias na rede de computadores.
O executivo cita os parâmetros FCAPS, acrônimo para Fault, Configuration, Accounting, Performance e Security, que é um modelo adotado pelas maiores companhias em todas as partes do mundo para qualificar o gerenciamento e monitoramento das estruturas de aplicações e dispositivos. “A alarmística contribui para que parâmetros FCAPS possam ser aplicados corretamente e possui grande importância na gerência de falhas e desempenho, por exemplo, monitorar o consumo de CPU dos ativos da infraestrutura, picos de tráfego, entre outros”, comenta.
Recursos essenciais em alarmística
Marco Catunda enfatiza que os recursos e ferramentas essenciais de alarmística não podem faltar na gestão de uma rede e infraestrutura de TI que se queira eficiente.
Segundo o executivo, a Telcomanager liberou recentemente uma nova versão da sua linha de produtos (TRAFip, SLAview e CFGtool), com uma série de melhorias para garantir a saúde do ambiente tecnológico com foco no desempenho dos negócios e segurança dos dados críticos.
A nova versão deu grande atenção à alarmística, oferecendo mais opções para que os gestores de TI possam responder imediatamente a quaisquer ocorrências na rede, inclusive podendo os alarmes serem visualizados diretamente no mapa georreferenciado. Os alertas especiais de serviço relativos a grupos de objetos podem ser ativados com base na mudança do seu status dentro de uma estrutura hierárquica, além de ajudar na comparação de versões entre configurações e para a identificação de incompatibilidades entre ativos e sistemas.
O executivo aponta na versão 9 das soluções Telcomanager as novas capacidades que ajudam os gestores de TI a enfrentarem os desafios do dia a dia em relação aos alarmes:
Alarmes de serviço - São aplicados a grupos de objetos, que podem ser ativados com base na mudança do estado de um objeto do grupo, de alguns ou de todos os objetos do grupo. É possível interpretar objetos como qualquer item monitorado, como uma interface, uma CPU, uma aplicação e afins;
Comparação entre configurações - Permite configurar alarmes personalizados para identificação de incompatibilidades de configurações, como por exemplo, gerar alarmes para uma configuração aplicada, mas não salva de forma permanente, além de gerar um alerta para cada mudança de configuração aplicada aos equipamentos;
Facilidade e praticidade para criar alarmes - Agora é possível criar alarmes diretamente pelos gráficos, com poucos cliques, alarmes funcionais podem ser configurados com extrema facilidade;
Gestão centralizada de alarmes e filtragem - Agora é possível caracterizar e filtrar tipos de alarmes diferentes em abas diferentes, como por exemplo, criar uma aba de alarmes específica para firewalls;
Ação de provisionamento no alarme - Permite disparar scripts de ação automática a partir da ativação de um alarme para o monitoramento de serviços em servidores. Caso o serviço pare de funcionar e um alarme seja ativado, a ação automática poderia, por exemplo, reiniciar esse serviço;
Ativação baseada em níveis de alarme - Permitir ao usuário da rede associar e/ou criar níveis de urgência diferentes a alarmes de objetos. Por exemplo, em um alarme de consumo de CPU que esteja entre 30% e 60% um nível “major” pode ser associado e o alarme vai disparar nesse nível e em casos de consumo percentual superior a 60%, os alarmes dispararam com nível crítico.
Nas soluções de monitoramento v9 da Telcomanager é possível configurar os níveis de urgência dos alarmes e definir a ação mais adequada a cada tipo de ocorrência. Quando disparado, o alarme pode executar uma ou mais ações, como envio de e-mail, mensagem para dispositivo móvel, mensagem para aplicativo de mensageria (Telegram), E-mails, Traps SNMP ou até mesmo integração com sistemas de tickets de ferramentas HelpDesk.
“Os sistemas de alarmística das soluções Telcomanager na versão 9 trabalham com dois tipos de alarmes: Padrão, para a análise de tráfego imediata, condições que precisam ser tratadas assim que detectadas; e Comportamento, que compara a evolução gradual de uma métrica sobre o tempo, o alarme dispara no caso dessa evolução desrespeitar o nível de tolerância definido pelo usuário”, diz o fornecedor.