Dimensionar certo evita super e subdimensionamento. Monitore CPU e memória antes de subir. Apps limitadas por CPU precisam de mais núcleos; por memória, mais RAM. Comece com specs modestas e escale com base em métricas; escale verticalmente primeiro, depois horizontalmente se precisar.
Medir primeiro
- CPU: Verifique utilização e steal time (em VPS). Uso sustentado alto ou steal indica necessidade de mais núcleos ou CPU dedicada.
- Memória: Verifique usado, cache e swap. Uso de swap muitas vezes significa que precisa de mais RAM.
- Linha de base: Rode sob carga normal e de pico; use médias e percentis (ex.: p95).
Limitado por CPU vs memória
- Por CPU: Encoding, compilação, computação pesada → adicione núcleos ou CPU mais rápida.
- Por memória: Conjuntos grandes de dados, muitas conexões, caches → adicione RAM.
- Por I/O: Banco de dados, logs → melhore disco (SSD, IOPS) ou rede.
Abordagem de escalonamento
- Vertical primeiro: Suba para instância maior (mais vCPU/RAM) até custo ou limites.
- Horizontal: Adicione mais servidores e balanceamento quando um único servidor não bastar.
- Auto-scaling: Use quando a carga for variável; defina min/max e gatilhos por métricas.
Resumo
Meça CPU, memória e I/O; identifique gargalos. Dimensione para a carga: escalonamento vertical primeiro, depois horizontal. Evite adivinhar; use métricas e tendências.




