Cose chiave da cercare in un centro dati

Sto cercando di build una semplice list di controllo per determinare la qualità di un datacenter … where e cosa devo cercare e come posso determinare se ciò che i proprietari dicono (ad esempio "il nostro UPS mantiene il data center fino a 100 giorni senza potere ") è vero o no? Quali sono i segni tipici o i data center buoni o cattivi?

5 Solutions collect form web for “Cose chiave da cercare in un centro dati”

Ecco un elenco di domande che ho fatto per me l'ultima volta che sono andato shopping datacenter:

  • Spiega cosa sarebbe stato necessario per gli sprinkler di uscire dalla nostra attrezzatura.
  • Cosa farà le mani remote? Ad esempio, installare unità disco rigido, ruotare nastri …
  • Sono disponibili le tue mani remote 24/7/365, tempo di attesa medio per arrivare alla gabbia dopo il deposito di un biglietto (Come vengono immessi i biglietti?)?
  • Sei in più griglie?
  • Hai sollevato il raffreddamento a pavimento?
  • Quanti datacenter funziona oltre a questo?
  • Quanto tempo può eseguire il datacenter sulla potenza di backup?
  • Possiamo fornire apparecchiature direttamente al datacenter?
  • C'è un molo di consegna e un parcheggio gratuito, vicino e disponibile?
  • Se abbiamo un fornitore venuto al datacenter, dovremo accompagnarli?
  • Quale temperatura ambiente e l'umidità sono mantenuti?
  • Quante scelte ISP sono presenti?
  • Qualcuno dei tuoi clienti ha mai perso energia per qualsiasi tempo nella storia del datacenter?
  • Quanto tempo ha funzionato questo datacenter?
  • Quali sono i controlli di accesso per il pavimento e le attrezzature?

Se si visita diversi e chiede queste domande tra il prezzo, le impressioni di visita e le loro risposte probabilmente sarà chiaro quale vuoi. Assicurati di visitarli sempre e di visitare una buona quantità di essi.

Kyle lo ha coperto abbastanza bene, ma qui ci sono due punti:

La sicurezza fisica è enorme. Dovrebbe prendere quasi un atto del Congresso (Parlamento, inserire qui l'istituzione burocratica lenta) per entrare.

Dovrebbe avere la soppressione del fuoco di Halon, non gli sprinkler; I server non devono essere umidi. (Le norme locali di soppressione del fuoco possono sovrascrivere …)

Scopri quali sono i fornitori di server preferiti. A less che non sia per una ragione molto specifica (come eseguire un datacenter come Google), dovrebbe essere server di marca. (Dell, HP, IBM, Sun, Apple, ecc.) Se dicono "white-box" o un brand che non riconosci, eseguire. Si noti che ci sono alcuni produttori affidabili di server di livello inferiore che sono reputati (System76, per esempio), ma "custom-built" significa che stanno mettendo le cose insieme se stessi. Ottimo per la tua casa, ma male per il tuo datacenter. (Questo non include l'acquisto di un HP Proliant DL580 e l'installazione di oggetti come i kit di opzioni di memory o le gabbie di unità.)

Quali sono le opzioni di properties; disponibili? Acquista attraverso di essi? Acquista direttamente e drop-ship lì? Leasing? VM?

Eccellente come sempre Kyle, Un paio di cose che ho imparato dall'esperienza:

  • Chiedere se ci sono generatori per il backup degli UPS, se così sono stati testati i generatori, quanto spesso?

  • Quali blocchi e controlli fisici hanno in atto per impedire agli elettricisti di uccidere il potere?

  • Quale responsabilità / copertura assicurativa hanno?

  • Come si occupano di situazioni quando non soddisfano il loro SLA?

  • Quanto spesso non hanno incontrato un SLA?

  • Quanto potenza forniscono ad each rack / gabbia / etc? (Sarà potere costretto e bisogno di un altro rack / gabbia solo per il potere extra?)

  • Chiedere referenze, nel tuo settore sarebbe buono.

Storie divertenti che all'epoca non erano divertenti:

  1. C'era un incendio a Vancouver in un vano elettrico sotterraneo, a 4 isolati dalla mia DC, il fuoco prese il potere per un raggio di 10 blocchi. L'UPS ha mantenuto le luci fino a quando il set Gen è entrato in linea. Gen-set è rimasto online per circa un'ora prima del sovraccarico. Gli UPS sono stati in grado di tenere le luci accese per altri 30 minuti dopo che il gen-set ha fatto un arresto di sicurezza. Gen-set apparteneva all'edificio, IIRC il DC era in grado di biasimarli e lavare le mani.

  2. Un elettricista ha ucciso il potere di un paio di file di rack al DC perché il pannello di qualche cosa cadde e bussò tutti gli interruttori aperti. Ho anche sentito parlare di un elettricista in un altro DC che dovrà lavorare su un UPS, non metterlo in modalità bypass e prendere in giù tutta la DC.

  • Direi che probabilmente un terzo di un data center è l'elemento tecnico (Avete {VESDA, ri-alimentando contratti, refrigeratori coperti da UPS, più griglie di alimentazione, ingressi di fibre diverse).

  • Un terzo è come si occupano di ciò quando le cose non vanno bene. Inghiottono il loro orgoglio, esaminano il fallimento e capiscono cosa fare per assicurarsi che non accada più? Oppure continuano a fare ciò che non funzionava prima?

  • E l'altro terzo è il personale. Sono intelligenti, facili da lavorare e non si rivolgono each mese?

Ma ancora più importnte: hanno lo spazio necessario? Un posto in cui siamo andati quasi, entro due anni usavamo più spazio di quanto avevamo a disposizione.

Lavoro in un piccolo centro dati in Silicon Valley. Io sono lo sysadmin sul lato gestito-server del business.

Segnali difettosi:

  • Mancanza di monitoraggio ridondante e di avviso per potenza, temperatura e umidità
  • Mancanza di monitoraggio per dispositivi di networking, colos, server e altre apparecchiature
  • Perderti e non utilizzare cavi o altri sisthemes di gestione dei cavi per mantenere rack organizzati e puliti

Buon segno: – Generatore diesel in loco con failover automatico – Riduttori di refrigerazione e gestori d'aria con failover automatico – Elevata width di banda sulle principali spine porttili (AT & T, XO Comm) – Fornitori di reti ridondanti – Router di nucleo ridondato, firewall, bilancieri di carico e interruttori – Corrente controllo della memory e diagnostica hardware prima di distribuire i server

I server dei brand name sono soddisfacenti, ma se sono vecchi e sono stati intorno al block un sacco di volte, è meglio assicurarsi che stanno passando la diagnostica hardware prima di utilizzarli.

Un buon centro dati dovrebbe fornire ai propri clienti un sito web in cui possono monitorare il consumo di banda e l'impiego. Dovrebbero anche rispondere a tutte le domande. Chiedi loro il marchio e il model del loro UPS. Chiedere loro di vedere il carico corrente sull'UPS. Con queste informazioni è ansible verificare quanto tempo può andare senza alimentazione.

Ma onestamente, l'UPS non dovrebbe essere la tua preoccupazione. Un UPS fornisce solo un breve tempo di funzionamento (30 minuti circa). Una preoccupazione molto migliore è se la DC ha un generatore di backup. Vale anche la pena di chiedere quale griglia c'è sulla DC. In termini di brownouts e blackouts, diverse priorità sono assegnate a diverse griglie. Indovina un po? Gli ospedali e le stazioni antincendio sono di alta priorità (il potere non viene mai tagliato). Se il Data Center si trova sulla stessa griglia, la sua potenza garantita è affidabile.

Chieda loro quanto quantità di energia disponibile per rack. Dove lavoro forniamo each rack con circuiti 3x25amp. Un tipico server 1u consuma 1-3 amp.

Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.