“Mayday mayday mayday. Este é o cactus quinze trinta e nove, atingiu pássaros, perdemos a potência nos dois motores, estamos virando de volta para LaGuardia”, dizia à torre de comando o piloto Chesley Burnett Sullenberger III, do voo que acabará de decolar de LaGuardia, em um acidente icônico que virou até filme na Netflix.

Após diversas conversas com a torre de comando que monitorava o tráfego aéreo naquele dia e dava a visão geral da situação ao comandante da aeronave para que pudesse haver um pouso adequado, Sully como ficou conhecido o corajoso piloto, tomou a decisão de pousar no Rio Hudson, salvando os 150 passageiros a bordo e toda a sua tripulação.

Mas o que isso tem a ver com o nosso dia a dia em Data Center?

Assim como na aviação, as infraestruturas de Data Center passam por investimentos milionários em seus itens de segurança, como UPS, geradores, sistema de ar-condicionado, todos eles respeitando rigorosas regras de redundância para, em caso de falha, o sistema possa continuar seu “voo de cruzeiro” e levar a informação até seu próximo porto seguro.

Monitoramento

O fato é que, diferente da aviação, que já possui sistemas de monitoramento e pessoas especializadas olhando para os céus 24 horas por dia, no mundo de Data Center isso ainda não é uma realidade.

Por vezes, alguns ambientes não possuem um sistema de monitoramento que conhecemos BMS (Building Management System) e em alguns ambientes, quando há um sistema, não existe um técnico olhando para aquilo e dando direcionamento para quem está em campo em um momento de incidente.

Durante auditorias de infraestrutura é comum escutar como resposta: “Não precisa ficar monitorando, fazemos ronda de 3 em 3 horas em toda a infraestrutura para ver se temos algum alarme”, aí cabe a pergunta: Você subiria em um avião monitorado apenas de 3 em 3 horas?

Precisamos estar atentos ao instante em que os problemas acontecem, no caso do voo US Airways 1549, ele decolou às 15h25 e apenas 6 minutos depois já estava pousando no Rio Hudson. O processo de análise do incidente também passou por todos os registros coletados nos sistemas de monitoramento do avião.

Voltando para o nosso mundo, é possível novamente afirmar que 6 minutos são suficientes para que um Data Center tenha um desligamento parcial e, muitas vezes, total. Não possuir um sistema de monitoramento e uma equipe checando o que está acontecendo com cada sistema pode ser a diferença entre um pouso de sucesso e uma tragédia.

Considerando que o investimento em um sistema de monitoramento é percentualmente mínimo quando comparado a tudo que está em jogo e que hoje em dia há serviços de Centrais de Monitoramento que podem olhar o ambiente 24x7x365 dias, não há motivos para correr riscos de prejuízos financeiros e de imagem, deixando um Data Center parar por falta de monitoramento.

pt_BRPortuguese