Perché un'applicazione pesante ad alta intensità di disco funziona più velocemente su una SAN che su un disco fisico?

Perché un'applicazione pesante ad alta intensità di disco funziona più velocemente su una SAN che su un disco fisico? Mi sarei aspettato che il disco fisico fosse leggermente più veloce, ma in realtà il process è stato eseguito 100 volte più velocemente quando l'unità di lavoro è stata impostata su una partizione sulla SAN.

La nostra ipotesi è che la SAN sia ottimizzata dalla scatola per essere veloce mentre le impostazioni di sintonia fisica del disco sono OS (Solaris) relative e non sono state toccate o il sistema operativo patchato.

Durante l'attività più alta il disco I / O era in esecuzione al 100% e il tempo per completare una scrittura è stato più di 2 secondi in quanto diversi processi stanno scrivendo al disco contemporaneamente.

(FYI l'applicazione in questione era Informatica PowerCenter)

  • MySQL com_select?
  • Come ottimizzare il nostro server MySQL?
  • scoprire la localizzazione NUMA della RAM di process
  • Scegliendo il diritto innodb_buffer_pool_size
  • Hai bisogno di aumentare il throughput di nginx a un suono upstream del socket - tuning del kernel di linux?
  • Come posso vedere se apache è sovraccarico e che non ti accetta le connessioni?
  • Esaurire il limite di socket TCP della macchina Linux (~ 70k)?
  • Come si può qualificare un server?
  • 4 Solutions collect form web for “Perché un'applicazione pesante ad alta intensità di disco funziona più velocemente su una SAN che su un disco fisico?”

    Non sono affatto sorpreso. Le matrici SAN hanno tipicamente un LOTTO di dischi coinvolti. Il fattore di limitazione per il disco I / O è la velocità del singolo disco e questi stack. 6 unità localmente in un RAID10 eseguiranno meglio di 2, e 80 unità su una SAN eseguiranno meglio di 10 unità localmente. Naturalmente ci sono variables, ma è così che dovrebbe funzionare.

    Inoltre, se la SAN ha coinvolto SSD, le cose diventano veramente zippy.

    È quasi certamente dovuto al caching. La probabilità DAS è minima nella cache, in cui la maggior parte delle SAN aziendali ha più gigabyte di cache. Avrei indovinato che l'applicazione sta saturando la cache della DAS, ma non la SAN.

    Concettualmente sembra sempre che il disco di distribuzione da SAN dovrebbe essere più lento di quello che serve a livello locale. Tuttavia, ci sono molti fattori che possono invertire questo risultato e la SAN è un'opzione molto più veloce. Alcuni di questi fattori sono:

    • Il carico di lavoro richiede tempi di ricerca rapidi o velocità veloci o entrambi?
    • Quanti mandrini sul SAN LUN rispetto al disco locale?
    • Quale velocità di bus tra il SAN LUN e il server, rispetto all'interface disco locale?
    • Quanto è disponibile la cache di lettura / scrittura sul SAN LUN contro il disco locale?
    • Quale velocità sono i dischi che ruotano su SAN LUN contro il disco locale?
    • Quale altre attività IO si svolgono sul SAN LUN contro il disco locale?
    • Quale livello RAID sono gli arrays sul SAN e lo storage locale?

    Tutti questi effetti influenzeranno le performance di SAN e disco locale.

    Tutto scende a quanti fusi sono disponibili …. Il numero più elevato di mandrini è più veloce l'accesso a qualsiasi dato pezzo di dati. se sei pesante IO intenso, in particolare se sei un'applicazione di database, allora puoi abbastanza facilmente seppellire le performance del disco locale con una soluzione SAN che può avere un numero molto maggiore di set di dischi per la gestione di dati fondamentali, indici e simili.

    Con il sottosistema locale del disco è anche probabile che condividi l'accesso ai test di lettura / scrittura con altre operazioni, ad esempio r / w per lo scambio, l'accesso al sistema operativo locale e di libreria, l'accesso alle applicazioni, ecc. per tutte le azioni di lettura / scrittura per spostare le teste di lettura / scrittura da un'area del disco per coprire una serie di azioni all'altra per soddisfare i requisiti dell'applicazione possono sicuramente battere le performance.

    Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.