Codici di errore MCE / Schermo rosa – Dovrebbero essere causa di preoccupazione?

Così ho recentemente acquistato un sistema di server grado insieme a tutte le periferiche del server grade. Ho la licenza per ESXi 6 e ho installato tutte le patch recenti. Il sistema è in esecuzione circa 2 settimane e ad un tratto ho avuto un crash completo.

Ho interpretato questo codice di errore come "Internal Timer Error". Ho inoltrato le informazioni a SuperMicro ma ad essere onesti non sono molto fiducioso con le risposte finora. La mia interpretazione era che il sistema non whereva semplicemente cadere – perchè è un Xeon con la memory ECC che esegue ESXi.

È ansible che si tratti di un errore in una sola volta e non dovrebbe accadere di nuovo? Come gestire questo? Alla ricerca di alcuni consigli da parte di coloro che hanno visto questi tipi di errori e che cosa finiscono per realizzare effettivamente.

schianto

  • Ottimizzazione del server MSSQL 2008 all'interno di VMWare ESXi
  • VMwre ESXi 5 - Lo stato di salute hardware mostra "Sconosciuto"
  • Scelte SAN per due cluster server ESXi 4.0 con vMotion e HA
  • ESXi 5 ha una function "routed IP" come Xen?
  • ESXi e Windows Server CPU
  • Come proteggere ESXi dal block dell'account di root
  • Avvisi di ESXi per consolidare ma non sono state effettuate istantanee
  • come configurare una substring IP secondaria che viene indirizzata direttamente all'indirizzo principale di WMware ESXI
  • 2 Solutions collect form web for “Codici di errore MCE / Schermo rosa – Dovrebbero essere causa di preoccupazione?”

    Vedere questo errore (MCE, exception di controllo macchina) proprio perché ha ECC RAM.

    Hai qualche hardware rotto da qualche parte, probabilmente un memory stick ma forse uno o più processri (CPU 10 forse?) O qualcosa in mezzo. Invocare il tuo contratto di assistenza.

    Può essere altri bit dell'hardware anche, ma each volta che ho visto questo è stato errato ECC RAM che si verificano errori a più bit. Se l'MCE è stato decodificato come "errore temporizzatore interno", la prossima cosa più probabile è una CPU difettosa o una scheda madre.

    Sì, è una causa di preoccupazione. Il server si è schiantato!

    Controllare la RAM e i pin del socket della CPU (se hai assemblato manualmente il server).

    Si tratta di tutte le informazioni che avrai. È ansible aprire un case di supporto con VMware e analizzeranno il dump di crash per te.

    Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.