Imansible uccidere VMware VM

Vengo incontrato un VM molto testardo (2008R2, strumenti VMware appena leggermente obsoleti, quelli con 5.5U3a) in un cluster ESXi 6.0U2 in esecuzione su server Dell R630. Dall'esterno, il VM non risponde dopo qualche tempo – potrebbe essere un giorno, potrebbe essere una settimana – e non risponde più a ping, alle richieste di connessione e così via (gestisce un'applicazione industriale e alcuni MSSQL). Quel comportmento potrebbe già essere osservato quando il cluster ha funzionato 5.5U3a, però.

Quindi, cerco di riavviare il VM tramite il webclient o tramite il client grasso. Non accade nulla. Come, per ore. Passo successivo di escalation:

esxcli vm process kill -w <worldID> -t soft 

Nessuna risposta, nessuna modifica. Sfiorare duro e andare direttamente

 esxcli vm process kill -w <worldID> -t force 

Nessuna risposta. La VM continua a scoraggiarsi per non rispondere e tutto, ma il mondo si rifiuta semplicemente di essere ucciso. Non esiste alcun messaggio di errore. Riavviare l'host con il VM è l'ultima risorsa.

Come posso identificare la causa principale di questo comportmento molto strano?

  • Esxi con iSCSI SAN rallenta con molte VM multiple in esecuzione
  • Hyper-V vs ESXi vs XenServer
  • "Unballooning" la RAM che è stata lanciata da VMware
  • Distribuire la macchina virtuale ESX dal template con esxcli
  • Alternative gratuite per vSphere per ESXi (se esiste uno)
  • Elenca tutti i file sui datastori VMware - PowerCLI / SSH?
  • VMXNET3 nic perde la capacità di aggiornare la tabella ARP dopo le ore N
  • Aggiunta di un disco rigido locale a un host ESXi
  • 2 Solutions collect form web for “Imansible uccidere VMware VM”

    Come posso identificare la causa principale di questo comportmento molto strano?

    Il metodo scientifico è il tuo amico.

    1. Definire il problema da risolvere. Sembra che tu abbia 2 problemi (forse interrelati). Il VM non risponde e ESXi non può ucciderlo.

    2. Raccogliere dati. Guarda nei registri, nel tuo monitoraggio ecc per informazioni pertinenti.

    3. Analizzare i dati.

    4. Effettui i cambiamenti in base all'analisi.

    5. Verificare che le modifiche funzionino. Se non tornano a 2 o 3 e raccogliere più dati / reanalisi.

    6. Documentate le tue conclusioni.

    Dopo aver identificato il process giusto usando ps | grep vmx ps | grep vmx , puoi improvvisamente terminare con kill -9 <pid>

    Fare molta attenzione a select (e uccidere) il process giusto. Per ulteriori informazioni, dare un'occhiata qui

    Se nulla funziona, secondo la documentazione di VmWare, wherevi riavviare l'host ESX

    Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.