
Isso nos mostrou que a causa raiz era uma alteração de configuração de wireguard, com função wg_set_device () mantendo a trava rtnl e peer_remove_after_dead () esperando muito tempo para uma chamada NAPI_DISABLE ().Nada mais estava no log, a maioria das métricas do sistema era boa e o tráfego existente estava sendo servido, mas não foi possível SSH para o servidor.10 de abril de 2025 14:00
D1, o banco de dados SQL gerenciado da CloudFlare, anuncia a replicação da replicação beta.Se o processo gastar mais do que Hung_task_timeout_secs segundos no estado D, uma entrada de log será gravada e nosso sistema de monitoramento interno emite um alerta com base nesse log.Quando um processo é encerrado com base em algum conjunto de sinais (anormalmente), o kernel Linux pode fornecer um arquivo de despejo principal, se ativado.
Fonte: https://blog.cloudflare.com/searching-for-the-cause-of-hung-tasks-in-the-linux-kernel/