linux-BR.org

Notícias de software livre e tecnologias

Falhas de hardware, equívocas de kernel, gargalos de rede, lançamentos problemáticos, escassez de recursos, vulnerabilidade de segurança etc. Para abordar isso, implementamos uma automação de autocura que monitora o servidor API Kubernetes para pods com, qualquer status.Phase = sucedado ou status ou status.Phase = falhou com pod.status.Reason = despejado.O nó não está conectado, as cargas de trabalho não são fechadas graciosamente e o nó não é desregmentado do servidor API Kubernetes.sinalizadores de sistema operacional configurados, problemas de tração de imagem, serviços de sistema ausente, etc.) Isso ocorreu porque quando o detector de problemas de Nó (NPD) consulta o serviço de metadados do Azure para o evento VMeventsChedule, a solicitação ocasionalmente falha resultando em uma condição de nó de novo e novente (exemplo abaixo).

Fonte: https://techblog.citystoragesystems.com/p/kubernetes-self-healing