Cinco coisas que todo sistema de monitoramento deve ser capaz de fazer
Se você identificar a falta de algum deles durante a implementação do sistema escolhido, não perca tempo

De todas as medidas que devemos implementar em nossas infraestruturas
para mantê-las em funcionamento, o sistema de monitoramento é uma das
mais críticas e, no entanto, uma das mais negligenciadas.
Construir um
sistema de monitoramento contínuo para avisá-lo de uma indisponibilidade
ou problema iminente, ajuda a escolher rapidamente a solução para um
desastre em andamento, ou a solução para problemas de desempenho. No
entanto, os calendários de implementação de aplicativos e atualizações
de infraestrutura muitas vezes acabam empurrando a implementação e a
manutenção dos sistemas de monitoramento para segundo plano.
Não importa que tipo de sistema de monitoramento você opte por usar,
muito raramente eles são turn-key, do tipo configurar e esquecer. O problema é que, a
menos que você tenha um ambiente extremamente simples, o acompanhamento
de todos os detalhes importantes e a eliminação de distrações
desnecessárias e falsos positivos pode ser um processo muito demorado e
contínuo.
É importante ser capaz de dimensionar suas opções desde o início e
certificar-se de que o tempo que você investirá na ferramenta preferida
será um tempo bem gasto.
Baseado em minhas experiências de trabalho com
uma variedade de pilhas de monitoramento, elaborei uma lista de cinco
itens que todo pacote de monitoramento em um ambiente suficientemente
complicado deve ser capaz de fazer, se corretamente configurado. Se você
identificar a falta de algum deles durante a implementação do sistema
escolhido, não perca tempo. Arregace as mangas e corrija antes que seja
tarde demais.
No. 1 : Vários colecionadores redundantes
A maioria dos sistemas de monitoramento utiliza um serviço
de software para fazer o seu levantamento de dados e sondagem. Em alguns
casos , este serviço de coleta de dados é realizado pelo mesmo sistema
que permite a configuração da emissão de alertas. Outras vezes, o
serviço de coleta é um pedaço de software, e você pode ter mais de um.
Os sistemas em que você pode implantar mais de um coletor e
orquestra-los são definitivamente preferíveis àqueles em que você não
pode.
Há duas razões principais para isso. Uma delas é que você pode ser
capaz de construir alguma redundância no caso de um coletor ser afetado
por um desastre. Outra é que ter múltiplas visões do mesmo item pode ser
muito útil. WANs maiores podem se beneficiar de ter coletores
instalados em cada local para que um problema com toda a rede possa ser
diferenciado de um problema em um único local.
No. 2 : Excelente capacidade gráfica
Qualquer sistema de monitoramento que se preze terá um
excelente processamento gráfico. Isso não significa apenas linhas suaves
e cores agradáveis. Se você já usou um sistema de monitoramento para
solucionar um problema de desempenho , você vai saber que a
possibilidade de dar zoom, alinhar e visualizar vários gráficos
simultaneamente pode ser extremamente útil .
Imagine que você esteja tentando descobrir o que está retardando um
aplicativo Web de múltiplas camadas. Ser capaz de empilhar um monte de
gráficos aparentemente não relacionados ( latência de armazenamento ,
transferência de rede , transações de banco de dados por segundo , e
assim por diante ) e prestar atenção na correlação entre eles pode ser
tremendamente esclarecedor para determinar a causa da lentidão.

No. 3 : Fácil supressão de eventos
Uma das piores
facetas de qualquer sistema de monitoramento é a emissão de falsos
positivos causados por problemas conhecidos ou esperados. Toda vez que
o celular explode com 80 alertas semelhantes, você perde a
sensibilidade sobre o que o sistema de monitoramento está querendo dizer
– e o risco de perder uma advertência importante em meio a todo esse
ruído é grande. É fundamental ter a capacidade de suprimir rapidamente
eventos específicos que você sabe que não são importantes.
Também é importante ser capaz de suprimir os eventos a partir de uma
determinada fonte, quando você sabe que a manutenção ou a atividade de
atualização irá gerar erros. Estive em várias situações em que um
processo de atualização conhecido causou efeitos secundários
inesperados em outros sistemas, mas esses efeitos não foram observados
muito mais tarde, porque os sistemas de monitoramento foram ignorados.
Ser capaz de criar paradas e janelas programadas dentro do sistema de
monitoramento pode ajudar.
No. 4: Múltiplos métodos de coleta de dados
Você tem uma ampla variedade de maneiras de obter
informações a partir de uma infraestrutura. Quase todo o pacote de
monitoramento vai apoiar as opções básicas, como pings ICMP para testar o
tempo de atividade , SNMP para coletar estatísticas de rede , e WMI
para puxar os dados de log de eventos. São métodos básicos usados para
cobrir a grande maioria dos sistemas. No entanto, SNMP está sendo
deixado de lado em favor de outras interfaces de monitoramento e de
gestão mais modernas, como WBEM e CIM. Na verdade , muitos fabricantes
estão começando a depreciar o suporte SNMP completamente a favor de CIM ,
e essa tendência só irá acelerar à medida que o tempo passa.
Além dos protocolos mais recentes substituindo SNMP, uma variedade de
outros tipos de consultas pode ser útil . Alguns exemplos podem incluir
a possibilidade de executar diretamente as consultas SQL e o tempo de
sua execução ou assistir a sua produção. Quanto mais ferramentas que
você tiver na caixa de ferramentas, mais provável será que você encontre
um meio de monitorar as minúcias importantes.
No. 5 : Facilidade de integração e extensão
Não importa o que o seu sistema de monitoramento faz ou
deixa de fazer, a habilidade de estendê-lo ou integrá-lo com outros
sistemas pode, eventualmente, significar a diferença entre a necessidade
de substituí-lo e preservar todo o tempo que você investiu nele. Embora
muitos sistemas de monitoramento sejam muito bons no que fazem, eles
não podem ser bons em tudo. Às vezes, a única maneira de obter a
informação que você precisa é programar uma solução ou usar uma
ferramenta diferente. Nessas situações, a capacidade de estender ou
integrar o pacote de monitoramento para trabalhar com outros softwares é
fundamental.
No final do dia, a escolha de qual aplicativo de monitoramento deve
ser usado vai depender do que você quer realizar. Alguns serão melhores
no monitoramento de ambientes predominantemente Linux, em vez de
ambientes Windows. Alguns são melhores em redes e infraestrutura de
aplicações. No entanto, o que você escolher deve ser capaz de verificar
os cinco itens que listei acima.
