Como configurar o escalonamento automático no Google Cloud Platform
O escalonamento automático é um recurso oferecido por muitos provedores de nuvem, como AWS e Google Cloud Platform, que cuidará da criação e exclusão de novos servidores em sua rede automaticamente, permitindo que você dimensione seu aplicativo para atender a cargas variáveis.
O que é escala automática?
Digamos que você tenha dois servidores atrás de um balanceador de carga, ambos controlando igualmente metade do seu tráfego. Se você precisar lidar com mais demanda, adicione outro servidor. No entanto, essa demanda costuma ser cíclica, atingindo o pico a cada dia com uma carga maior, então seria uma dor lidar com isso manualmente.
O escalonamento automático lida com isso, como o nome indica, automaticamente. Você define um modelo pré-construído que é usado para iniciar uma cópia de seus servidores do zero. Sempre que sua rede atinge uma quantidade predeterminada de carga, digamos, 70% do uso da CPU, o escalonamento automático aciona uma nova instância para suavizar as coisas. Quando ele se acalmar, ele &’ reduzirá o número de instâncias.
Claro, configurar este modelo não será fácil, mas o GCP tem ferramentas para tornar isso mais simples, como ser capaz de usar um contêiner como imagem de máquina.
Embora o Auto Scaling permita que você aumente para atender a qualquer quantidade de demanda, ele também pode economizar dinheiro diminuindo sua escala quando não for necessário. Com a hospedagem de servidor tradicional, você precisa planejar o pico de demanda — se o seu servidor não conseguir lidar com o tráfego de pico, você precisa de um servidor melhor. No entanto, isso geralmente é um desperdício de dinheiro, porque fora do horário comercial, quando seu aplicativo não está sob carga de pico, você está pagando mais do que precisa.
Mesmo se você estiver usando apenas um ou dois servidores, a configuração do Auto Scaling pode ajudar sua rede a lidar com picos na atividade de tráfego e é um recurso útil para qualquer rede de alta disponibilidade.
Configurando um grupo de instâncias gerenciadas
No console de gerenciamento do GCP, selecione Compute Engine > Grupos de instâncias.
Crie um novo grupo de instâncias e escolha “ Novo grupo de instâncias gerenciadas. ”
Você pode definir este grupo para gerar em várias zonas, o que é melhor para alta disponibilidade. Cada grupo de instâncias será fixado em uma região, porém, e essa configuração é permanente. Você precisará criar grupos de instâncias adicionais para todas as outras regiões em que planeja ter servidores.
É claro que você precisará de um modelo de instância configurado para definir quais dados são colocados em seu servidor e como um novo nó no grupo Auto Scaling é iniciado. Se você já tiver um, selecione-o aqui. Caso contrário, você pode ler nosso guia sobre como configurá-los.
Abaixo disso, você encontrará as configurações para Auto Scaling. O modo padrão aumenta e diminui automaticamente, mas você pode desativar o aumento e apenas aumentar a escala da rede. Você também pode definir a métrica que ele usa para escala automática, que é definida para uso de CPU em 60% por padrão.
O período de resfriamento é basicamente o tempo que um novo servidor leva para carregar — se seu servidor levar um ou dois minutos para configurar tudo, você não quer que o GCP veja essas métricas enquanto ele &’ está sendo configurado, pois pode relatar um uso inesperadamente alto da CPU.
Você também pode alterar o número mínimo e máximo de instâncias para garantir o desempenho e limitar os custos, respectivamente.
O último recurso é a recuperação automática, que realiza regularmente verificações de saúde nos serviços em execução em cada instância. Se uma instância começar a funcionar, ela pode ser substituída facilmente. Se você tiver um balanceador de carga, ele direcionará o tráfego para longe automaticamente, mas não corrigirá a própria instância sem a recuperação automática. Recomendamos que você habilite este recurso.
Clique em “ Criar, ” e o número mínimo de instâncias será criado. Você pode gerenciá-los individualmente no console do Compute Engine ou gerenciar o modelo de instância para editar as configurações de todo o grupo.
Nenhum comentário