Alta Disponibilidade em Infraestrutura Local: O Que Toda PME Deveria Ter Antes de Crescer?

A maioria das PMEs descobre a importância da alta disponibilidade da pior forma possível: quando um servidor falha numa sexta-feira à tarde e a empresa fica parada até segunda-feira. A questão não é se vai acontecer — é quando. E a diferença entre uma empresa que recupera em minutos e uma que recupera em dias é a decisão que foi ou não tomada meses antes do incidente.

Alta disponibilidade (HA) não é um conceito reservado a grandes empresas com data centers próprios. Existem soluções adequadas e economicamente viáveis para PMEs de qualquer dimensão. Este artigo apresenta o que é, o que custa e como implementar de forma faseada.

O custo real de uma hora de paragem

Antes de discutir soluções, é importante quantificar o problema. O custo de downtime vai muito além dos salários improdutivos — inclui vendas perdidas, penalizações contratuais, custos de recuperação de emergência, impacto na reputação e, em casos mais graves, perda permanente de dados.

Um estudo da Gartner estima que o custo médio de downtime não planeado é de 5.600 euros por minuto para empresas de médio porte. Para PMEs o valor é menor, mas o impacto proporcional pode ser superior. Uma empresa faturação anual de 2 milhões de euros que fica parada 8 horas perde potencialmente 7.000 a 15.000 euros em impacto direto e indireto.

Calcule o custo de downtime da sua empresa: (faturação anual ÷ 2.000 horas úteis) × horas de paragem estimadas. Adicione 40% para custos indiretos. O resultado justifica normalmente o investimento em HA.

O que é alta disponibilidade na prática

Alta disponibilidade é a capacidade de um sistema continuar a funcionar, ou retomar funcionamento rapidamente, após a falha de um componente. É medida em percentagem de tempo de funcionamento — 99,9% significa menos de 9 horas de paragem por ano, 99,99% significa menos de 1 hora.

HA alcança-se eliminando pontos únicos de falha (SPOF — Single Points of Failure). Em infraestrutura típica de PME, os SPOFs mais comuns são: servidor único sem redundância, storage sem RAID, ligação de internet única, switches sem redundância, e fonte de alimentação não redundante.

Clustering e failover: conceitos sem jargão

Clustering é a técnica de ter dois ou mais servidores configurados para substituírem-se mutuamente. Em caso de falha do servidor primário, o secundário assume as funções automaticamente — idealmente sem intervenção humana e com interrupção mínima ou nula para os utilizadores.

Existem dois tipos principais de clustering relevantes para PMEs:

Active-Passive (o mais comum em PMEs)

Um servidor está ativo, o outro em standby. Em caso de falha do primário, o secundário assume. O failover pode ser automático (com software de clustering) ou manual. É mais simples de implementar e mais económico, mas o servidor secundário não contribui para a capacidade normal do sistema.

Active-Active

Ambos os servidores estão ativos e partilham a carga de trabalho. Em caso de falha de um, o outro absorve toda a carga. É mais complexo, mais caro, mas aproveita melhor o investimento em hardware. Adequado para sistemas de maior volume.

Nível de HA adequado por dimensão de empresa

Perfil de empresaNível mínimo recomendado
1-15 colaboradores, sem sistemas críticosBackup diário offsite + UPS + RAID nos servidores
15-50 colaboradores, ERP ou dados críticosServidor de backup quente + RAID + redundância de internet
50-150 colaboradores, operações dependentes de TICluster ativo-passivo + storage redundante + link duplo
150+ colaboradores ou dados altamente críticosCluster ativo-ativo + replicação + DR site secundário

Implementação faseada: por onde começar com orçamento limitado

A boa notícia é que HA não exige implementação completa e simultânea. Uma abordagem faseada permite distribuir o investimento e priorizar os componentes mais críticos.

Fase 1: Eliminar os riscos mais óbvios (custo baixo)

  • Implementar RAID nos servidores existentes se ainda não existir
  • Adicionar UPS (No-Break) com autonomia mínima de 30 minutos
  • Garantir backup diário com cópia offsite ou cloud
  • Adicionar segundo link de internet (mesmo que de qualidade inferior)

Fase 2: Redundância de servidor (investimento médio)

  • Adquirir servidor secundário com capacidade para assumir workloads críticos
  • Implementar clustering básico com Windows Server Failover Clustering ou Hyper-V Replica
  • Configurar storage compartilhado ou replicação de volumes

Fase 3: Alta disponibilidade completa (investimento significativo)

  • Storage redundante com SAN ou NAS enterprise
  • Switches de rede redundantes em topologia stack
  • Clustering ativo-activo para sistemas de missão crítica
  • Plano de disaster recovery documentado e testado

Quanto custa implementar HA básico numa PME portuguesa

Uma solução de HA básica para uma PME de 20 a 50 colaboradores — servidor secundário, clustering Hyper-V ou VMware, storage redundante e UPS adequado — pode ser implementada com um investimento entre 8.000 e 25.000 euros dependendo da dimensão e requisitos.

O número parece elevado isoladamente, mas comparado com o custo de um único incidente grave de downtime, o ROI é frequentemente positivo em menos de 12 meses. E ao contrário do custo de um incidente, o investimento em HA é previsível, planeável e pode ser faseado.

📌 Saiba qual nível de alta disponibilidade a sua empresa precisa — a JL Suporte & Consultoria realiza diagnósticos gratuitos e apresenta propostas faseadas adaptadas ao seu orçamento.

Se esse conteúdo fez sentido pra ti . . .

Talvez ele também faça sentido para alguém que tú conheces.

TI PROFISSIONAL, sem dores de cabeça.

Contacto

© 2022 JL Suporte & Consultoria | Todos os direitos reservados.