Perché la mia HyperV VM sta casualmente perdendo la connettività?

Ho un strano problema di connettività intermittente che accade una volta each due settimane.

Prima la mia configuration: sto eseguendo un cluster di failover HyperV con due host fisici (node01 e node02). Gli host sono entrambi in esecuzione server HyperV di Windows Server 2008 R2 (quello gratuito) con SP1. Su tali host ho eseguito due versioni di VM ciascuna che esegue l'edizione Web di Windows Server 2008 R2 con SP1. Il mio server di archiviazione è Windows Storage Server 2008 connesso tramite iSCSI. Entrambi gli host e il server di archiviazione eseguono i driver di networking più recenti scaricati direttamente dal sito web di Intel.

Ecco il problema: 99,99% del tempo, tutto funziona perfettamente. Circa una volta each due-tre settimane, i VM perdono simultaneamente la connettività di networking, sia in entrata che in output. Quando questo accade,

  1. Non posso RDP in entrambi i VM.
  2. Posso RDP in entrambi gli host.
  3. Posso connettersi a VM dal Gestore Cluster di Failover facendo clic con il button destro del mouse sul nodo e selezionando 'Connetti a Virtual Machine'
  4. Una volta che si connette alla VM come descritto al punto 3, non posso arrivare a siti o macchine in LAN. Distriggersre e ritriggersre la connessione virtuale di networking all'interno del VM non risolve il problema.
  5. Se sposterò il VM in un altro nodo, questo risolve il problema (per le prossime due settimane).
  6. Se riavvii l'host e sposti il ​​VM su di esso, questo risolve il problema (per le prossime due settimane).
  7. Quando ciò accade, il cluster di failover NON fa automaticamente il failover automatico del VM.
  8. Non ci sono voci di registro events insoliti su nessuno degli host o VM.

Ciò è accaduto circa 5 volte con gli stessi sintomi descritti sopra. Sospetto un driver di networking o un problema di hardware di networking, ma da quando sto già eseguendo i driver più recenti, non so cosa fare.

Questo è un vero scratchatore … qualsiasi idea?

Aggiornare

Ho trovato un caso molto simile: Virutal Machine perde la connettività di networking sul cluster Hyper V

Aggiornamento 7/29/2011

Dopo l'installazione di aggiornamenti rapidi e l'aggiornamento dei driver di networking, sto ancora riscontrando lo stesso problema. In risposta al commento che chiede dettagli hardware, il server è un Intel SR1670HV, che è un canvasio da 1U contenente due tabs madri indipendenti S5500HV. La comunicazione avviene tramite le tabs madri integrate NIC Intel 82574L. Il driver di networking è la versione 16.2.49.0.

  • Errore Debian: ifup: Imansible leggere le interfacce file "/ etc / network / interfaces"
  • Creazione di una piccola networking di uffici
  • È ansible salvare il running-config su Nexus Switches
  • Può collegarsi tramite Watchguard VPN mobile, ma non è in grado di eseguire il ping o l'accesso alle unità di networking
  • Modalità di collegamento alla networking 802.3ad su Ubuntu 12.04 e un switch Cisco
  • La networking VM di VirtualBox si blocca a causa di ethernet "Reset adapter"
  • Può qualcuno spiegare cosa significa questa vulnerabilità?
  • / etc / interfaces per gateway multipli, la stessa networking? (linux)
  • 7 Solutions collect form web for “Perché la mia HyperV VM sta casualmente perdendo la connettività?”

    Abbiamo usato un problema come questo in cui sono a. Non ricordo i dettagli esatti, ma la soluzione finale ha avuto a che fare con un indirizzo MAC in conflitto assegnato dynamicmente a una scheda di networking virtuale. Pinning quelli giù a loro non erano dinamici aiutato molto. Normalmente non volete farlo perché potrebbe rendere più difficile spostare una macchina virtuale a un host diverso, ma ci ha aiutato in questo caso.

    L'altra parte è che le NIC fisiche sono state fatte da broadcom e abbiamo anche avuto un errore di configuration in cui un amministratore precedente aveva tentato di utilizzare erroneamente l'utilità broadcom per trunk le due nics insieme all'host per una migliore width di banda / throughput. Abbiamo rimosso tale configuration e configurato uno dei nics in modo che non disponesse di alcun IP sulla macchina host, ma potremmo ancora essere utilizzato per passare attraverso gli ospiti virtuali. Quindi abbiamo impostato each macchina virtuale per utilizzare solo una o l'altra, bilanciando il carico in base al traffico storico. Ovviamente questo significa che non ci sono failover se un adattatore o una connessione scende e non abbiamo seguito bene per vedere se il traffico è rimasto bilanciato nel tempo, ma è stato stabile da allora.

    Sono consapevole che questa è una vecchia domanda, ma ho incontrato la stessa questione e ho perso tanto tempo per risolvere che ho pensato di condividere la soluzione che ha funzionato per me. Ho trovato la soluzione al mio problema qui:

    http://invendows.wordpress.com/2008/03/06/network-issue-with-hyper-v/

    La soluzione in mia situazione è stata quella di distriggersre il TCP Offloading sui VM. Citerò la sezione interessata dal link:

    Per distriggersre lo scaricamento TCP ho dovuto creare e impostare un nuovo valore di registro in each VM connesso alla Broadcom 8507 Nextreme II NIC.

    Ho usato la seguente modifica del Registro di sistema per distriggersre il TCP Offloading:

    Tasto: HKLM \ SYSTEM \ CurrentControlSet \ Services \ Tcpip \ Parametri

    Valore (DWORD): DisableTaskOffload = 1

    Dopo aver disabilitato lo scaricamento TCP su each VM in questo modo tutti i problemi sono finiti e sono stato in grado di colbind più VM a una port NIC della Broadcom 5708 Nextreme II NIC.

    Il mio server dispone di NIC Broadcom NetExtreme , quindi mi sembra che la causa di questo problema sia sicuramente legata al driver, ma l'impostazione DisableTaskOffload = 1 ha risolto completamente il problema per me. Spero che queste informazioni risparmiano altre ore di ricerca!

    Ho eseguito qualcosa di simile in un ambiente molto più semplice di Hyper-V, e ho attraversato questo articolo a Microsoft. Sembra che si adatti alla tua situazione se i server web sono fortemente utilizzati.

    http://support.microsoft.com/kb/974909 – La connessione di networking di una macchina virtuale Hyper-V in corso viene persa in caso di traffico di networking in output pesante in un computer basato su Windows Server 2008 R2

    Abbiamo avuto questo stesso problema, anche se nel nostro caso era each 24-48 ore. Vorrei duplicare il controllo del fatto che il tuo prodotto antivirus / firewall support SP2002 con Hyper-V, se non, provare un altro (o temporaneamente rimuovendo se ansible) il tuo prodotto antivirus / firewall come prova per vedere se il problema si allontana .

    Dopo una chiamata a Microsoft e diversi file di dumping / file di log più tardi, hanno stabilito che TrendMicro OfficeScan è stato il colpevole nel nostro caso. Utilizziamo una versione che si è rivelata non esplicitamente supportta su Hyper-V, una volta che abbiamo aggiornato all'ultima versione, il problema è andato via.

    Questo si è rivelato un problema hardware – ho isolato il problema ad un switch gestito Netgear GSM7224v2, sostituito con un D-Link DGS-1024D, e da allora tutto funziona bene.

    Come "lezione imparata", in questo caso ho probabilmente passato il 99% del mio sforzo diagnostico per la risoluzione dei problemi relativi alle impostazioni del software per ciò che si è rivelato un problema hardware. Ho anche pagato Microsoft Support $ 259 (e ho passato un sacco di tempo al telefono con loro) per aiutarmi a capirlo spingendo intorno alle impostazioni del software. Immagino che la morale della storia è sospettare il tuo hardware proprio come il tuo software.

    Nelle properties; dell'adattatore di networking per l'ospite VM, hai disabilitato pacchetti Jumbo e Large Send Offload? Sulla base della mia esperienza con queste impostazioni, lo cercherò sicuramente.

    https://support.microsoft.com/en-us/kb/2986895

    È noto problema con gli adattatori di networking Broadcom 1gigabyte.

    Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.