F5 LTM frequentemente uccide i processi con SIGKILL

Abbiamo un dispositivo BIP-IP 6400 LTM che sta uccidendo processi con una frequenza allarmante. La CPU è costantemente circa il 23% di utilizzo, quindi non è un problema.

Ecco un esempio di /var/log/ltm :

 Oct 7 08:21:55 local/pri-4600 info bigd[3471]: reap_child: child process PID = 25338 exited with signal = 9 Oct 7 08:22:15 local/pri-4600 info bigd[3471]: reap_child: child process PID = 25587 exited with signal = 9 Oct 7 08:22:34 local/pri-4600 info bigd[3471]: reap_child: child process PID = 25793 exited with signal = 9 Oct 7 08:23:10 local/pri-4600 info bigd[3471]: reap_child: child process PID = 26260 exited with signal = 9 Oct 7 08:23:36 local/pri-4600 info bigd[3471]: reap_child: child process PID = 26584 exited with signal = 9 Oct 7 08:23:40 local/pri-4600 info bigd[3471]: reap_child: child process PID = 26647 exited with signal = 9 Oct 7 08:23:45 local/pri-4600 info bigd[3471]: reap_child: child process PID = 26699 exited with signal = 9 Oct 7 08:23:55 local/pri-4600 info bigd[3471]: reap_child: child process PID = 26805 exited with signal = 9 Oct 7 08:25:36 local/pri-4600 info bigd[3471]: reap_child: child process PID = 28079 exited with signal = 9 Oct 7 08:27:15 local/pri-4600 info bigd[3471]: reap_child: child process PID = 29286 exited with signal = 9 Oct 7 08:27:16 local/pri-4600 info bigd[3471]: reap_child: child process PID = 29307 exited with signal = 9 Oct 7 08:27:56 local/pri-4600 info bigd[3471]: reap_child: child process PID = 29793 exited with signal = 9 Oct 7 08:29:20 local/pri-4600 info bigd[3471]: reap_child: child process PID = 30851 exited with signal = 9 Oct 7 08:33:00 local/pri-4600 info bigd[3471]: reap_child: child process PID = 1122 exited with signal = 9 Oct 7 08:33:16 local/pri-4600 info bigd[3471]: reap_child: child process PID = 1299 exited with signal = 9 Oct 7 08:34:15 local/pri-4600 info bigd[3471]: reap_child: child process PID = 2054 exited with signal = 9 Oct 7 08:35:16 local/pri-4600 info bigd[3471]: reap_child: child process PID = 2784 exited with signal = 9 Oct 7 08:35:16 local/pri-4600 info bigd[3471]: reap_child: child process PID = 2807 exited with signal = 9 Oct 7 08:35:35 local/pri-4600 info bigd[3471]: reap_child: child process PID = 3015 exited with signal = 9 Oct 7 08:36:15 local/pri-4600 info bigd[3471]: reap_child: child process PID = 3601 exited with signal = 9 

È normale? Se no, cosa potrebbe causare questo accadere?

  • F5 Load Balancer ristabilisce la richiesta di timeout
  • Possibile reindirizzamento da HTTPS a HTTP dietro il bilanciatore di carico?
  • NTLM, Kerberos e F5
  • Per il ponte SSL, i back-end HTTPS verificano che l'equalizzatore di carico utilizzi la stessa chiave privata? In caso affermativo, come?
  • Come posso distriggersre e ritriggersre le macchine in un pool BIG-IP tramite ssh?
  • 301 redirect Regola per il bilanciamento del carico F5 BigIp
  • Applicazione Non riuscire a non funzionare nel server web Apache 2.2 configurato con BIG IP (f5) di bilanciamento del carico
  • Cambiare gli indirizzi IP nodes nella configuration F5 BigIP
  • 2 Solutions collect form web for “F5 LTM frequentemente uccide i processi con SIGKILL”

    bigd è il demone di monitoraggio sul BIG-IP e quindi questo sembra che un monitor in uso sia in crash. Dovresti aprire un caso con supporto e caricare il tuo qkview a ihealth.f5.com. Ecco una soluzione correlata a quel messaggio di errore:

    https://support.f5.com/kb/en-us/solutions/public/17000/000/sol17092.html

    Questo era un bug noto nel software 10.2.4 BIG-IP in esecuzione.

    Dal supporto F5:

    … hai colpito un problema noto tracciato internamente come: bug ID539130 "bigd può bloccare durante l'elaborazione di SIGCHLD che causa un errore cardiaco bigd e SIGABRT" – = Condizione = – Monitor esterni che funzionano per lungo tempo e vengono uccisi dalla successiva iterazione del monitor, può causare il crash e il nucleo del bigd, ciò provoca un intervallo temporaneo nel monitoraggio della salute.

    La correzione era di aggiornare il software con Hotfix-BIGIP-10.2.4-HF12-866.11-ENG .

    Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.