I download restano in pausa e time out frequentemente

Sono nuovi sisthemes e amministratore di networking. La mia esperienza è stata nell'hardware e nel software di sisthemes e server, la parte di networking è piuttosto nuova per me. Ho familiarità con il collegamento di numbers nelle configurazioni di networking, ma se mi chiedete di sottoreti o di spazzatura dei pacchetti (;), vedrai questo sguardo davvero perduto sul mio viso. Sto imparando.

Ecco il mio problema:

Da circa due mesi prima di assumere le redini qui, la precedente Amministrazione di networking riferisce di avere problemi a scaricare file di grandi size. Beh, non solo file di grandi size, è solo più frustrante con quelli grandi. Ora che sto facendo i download (tutto da un driver random alle distro più recenti e SP dalla nostra tecnologia di sottoscrizione e licenza Technet, ai pacchetti software di ingegneria multi-gigabyte per i nostri vari reparti) devo "andare a sedere" i download, tenendomi incatenati alla mia scrivania per ore alla volta.

I download inizieranno bene e arrivano ad un certo punto random che vanno da pochi K a una coppia G prima che il download stallo e non riesca se non riesco a mettere in pausa e riavviare il download prima che non riesca. A volte la pausa / riavvio funziona subito, il download riprende la velocità e progredisce un po 'prima che il ciclo ripeta. A volte dovrei passare attraverso diversi loops di pausa / riavvio prima che il download inizia effettivamente a scaricare di nuovo.

Dettagli della networking e ISP:

  • Connessione internet a fibre servita dal nostro ISP (la nostra città locale è il nostro ISP). Le velocità di download generalmente superano circa 1,1 Mbps, con picchi fino a 1,6 Mbps. A volte in mezzo ai loops di pausa / riavvio vedremo velocità minime di centinaia di Kbps, ma pochi loops successivi e riapriremo di nuovo. Le velocità dei diversi host sono abbastanza coerenti.
  • Non esiste nessun proxy nella nostra networking interna e nessun firewall che so di bloccare la connessione. Utilizziamo un Cisco 1811W come nostro gateway, ma non abbiamo avuto problemi prima.

Il problema è stato notato per la prima volta intorno a settembre e non ci sono stati cambiamenti da parte nostra attorno a quel tempo che possiamo attribuire a questo.

Cosa dovrei testare, verificare, ecc., Per determinare se il problema è da parte nostra o dagli ISP?

Aggiornare:

Sto guardando un feed wireshark filtrato per il stream TCP di un download grande che ho avuto problemi con per alcuni giorni. La maggior parte dei telegrammi sono etichettati …

Continuazione o traffico non HTTP

… che presumo sono solo i pacchetti successivi che compongono il download. Tuttavia, relativamente frequentemente (tra each 3-20 secondi) e corrispondente approssimativamente esattamente a qualsiasi scarico della velocità di download riportto da Firefox sono grandi sezioni di frame etichettati …

[TCP Retransmission] Continuazione o traffico non HTTP

Ci sono anche alcuni fotogrammi casuali, generalmente distribuiti intorno ai pacchetti di ritrasmissione, alcune dozzine di fotogrammi da entrambi i lati, etichettati …

[Segmento precedente di TCP perso] Continuazione o traffico non HTTP

… e whadayaknow, il download è fallito solo a metà del file da 3.2GB. Il fotogramma finale è un canvasio perduto del segmento precedente di TCP. Questo è arrivato subito dopo che ho dovuto mettere in pausa il download e tentare di riavviarlo: coda immediata fallimento.

I frame finali nel download sono stati http [ACK] seguito da http [FIN, ACK] , che credo indicato una chiusura "graziosa" TCP connessione.

Non ho visto altro che indica l'interruzione di un intermediario.

Aggiorna 2

Il problema viene osservato in tutti i browser e le applicazioni che il download e la funzionalità di pausa / riavvio funzionano al 99% del tempo in tutte le applicazioni che consentono la pausa / riavvio. Applicazioni e browser specifici posso replicare facilmente in: Firefox (versioni correnti), IE (9), iTunes (scaricando applicazioni e aggiornamenti per i dispositivi iOS). Non sono sicuro se questi utilizzano tutte le stesse funzionalità per la function pause / resume nel download.

iTunes scarica da server che consentono di riavviare (ad exception dei file di aggiornamento di iOS) e quindi non import quanto tempo interrompe il download. La maggior parte dei siti che scarico i file di grandi size da (MS, PTC, Solidworks, AutoDesk) non support la ripresa di download fermati / annullati (MS fa ma solo da lì gestore di download basato su java) e quindi posso solo sospendere per circa 15 secondi max prima del download non riuscirà immediatamente dopo il tentativo di riprendere.

Aggiornamento 3

Utilizzando il mturoute (grazie a Tom H), ho trovato il path costante max MTU è di 1500 byte prima della frammentazione e il path portò ICMP i payload con frammentazione di 10000 byte da fine a fine senza molti problemi, compreso il luppolo attraverso i miei dispositivi ISP. Quindi il problema non sembra essere frammentazione o impostazioni MTU incompatibili.

ICMP non è anche bloccato dal mio ISP e né è BitTorrent, anche se non sto utilizzando BT per scaricare questi file.

UPDATE 4

Quindi quello che ho bisogno di esaminare, giudicare dai log di WireShark, è come individuare la causa dei ritrasmissioni e dei segmenti precedenti persi. Come potrei isolare la probabile fonte di questi?

  • Cosa significano i campi in output sar-B?
  • Qual è il modo migliore per immagazzinare le immagini del sito web?
  • LSI RAID: La politica di cache di scrittura influisce sulle performance di lettura?
  • dd vs. sicuro-cancella per SSD di ricondizionamento
  • Come select la migliore Formato Stripe durante la configuration di un arrays RAID
  • Scopri il collo di bottiglia per il server desktop remoto di Windows (Terminal server)
  • Aumenta la dimensione del diario migliorando le performance per i filesystem ext4?
  • Posso avere 2Gbit su 1Gbit Nics
  • 5 Solutions collect form web for “I download restano in pausa e time out frequentemente”

    Tipicamente si può lavorare per isolare e risolvere il problema, provando sistematicamente diverse parti della networking. Questo è un process di fiducia da dire, so che questo funziona usando gli strumenti appropriati per indagare e da parti che arriverai ad un pezzo finale del puzzle e dici: so che questo è il problema, perché tutto il resto è buono !

    1. Se è ansible replicare il problema nei dispositivi collegati sia a ethernet che wireless che isolano il problema nel collegamento finale tra la networking <=> Cisco 1811W <=> DSL Fiber <=> ISP <=> e Internet

    2. Se visualizzi il problema solo in networking cablata o in dispositivi wireless, puoi mettere a fuoco la configuration wireless Ethernet o wireless sulla Cisco 1811W. Quindi è ansible rivedere le impostazioni comuni al segmento problematico come un passo successivo.

    3. Generalmente riposizionare tutti i cavi ethernet comunemente collegati e provare a scambiare i cavi DSL se disponibili, quando si prova un dispositivo.

    4. Controllare le impostazioni di MTU e di auto-negoziazione sul router, che sono impostate per il DSL, esaminare il file di registro del router da IOS.

    Il router esegue IOS 12 o qualcosa del genere, che avrà alcuni buoni strumenti di row di command accessibili tramite ssh per controllare le impostazioni negoziate.

    Utilizzare il command di show interfaces per esaminare le statistiche di errore, ad esempio rieseguire e abbandonare i pacchetti. Potrebbe anche avere un'interface web (ma non sto lavorando con i dispositivi Cisco IOS al momento, quindi questo non è testato solo da alcune note che ho fatto su problemi di ripresa in networking Cisco)

    Tuttavia, dovrebbe essere ansible eseguire una tabella delle statistiche di errore della port usando la console cisco

     # show interfaces status # show interfaces counter errors 

    e per un particolare porto, ad esempio

     # show interface GigabitEthernet 5/28 status # show interface GigabitEthernet 0/24 switchport 

    Modifica: ecco un piccolo video di un ragazzo che mostra come utilizzare ios "show interfaces counters errors" per risolvere i problemi. In realtà è veramente freddo, ma è probabilmente in profondità troppo profonda, ma ti fornisce le informazioni necessarie per rilevare la non corrispondenza duplex o le impostazioni di negoziazione automatica.

    ps è ansible provare la parte router della connessione, collegando un router DSL alternativo alla connessione in fibra, se i download funzionano trovarli, sai che il problema è questo lato, anziché lato ISP.

    Alcuni ISP fanno la strana decisione di bloccare tutti i pacchetti ICMP sui loro interruttori o firewall. Questo blocca il calcolo del Path MTU, il che significa che si ottiene più pacchetti frammentati che si verificano mentre passano attraverso routes con MTU inferiori. Forse stai vedendo il risultato di questo.

    I pacchetti frammentati devono essere riassemblati che può essere un problema se si ha anche la perdita di pacchetti! Dato che si sta tentando di scaricare file di grandi size, sia la frammentazione che la perdita dei pacchetti saranno un problema maggiore. La scoperta del path MTU è progettata per ridurre la frammentazione.

    Quindi come fai a sapere se il tuo ISP ti ha fatto questo? Potreste chiederle – però, nella mia esperienza, i provider di Internet preferiranno di inviarti con la risoluzione di problemi di base per diversi giorni / settimane anziché ammettere che avrebbero potuto fare qualcosa di sbagliato. E naturalmente a volte hanno ragione!

    Dovresti raccogliere informazioni per mostrargli quello che stai vedendo. Packet Captures come hai fatto in Wireshark o raccolti al tuo firewall sono utili poichè spesso rivelano il livello di frammentazione. È ansible verificare se la ricerca di path MTU funziona utilizzando tracepath (* nix) o mturoute (Windows).

    Se scopri che pMTU non funziona, potrebbe essere il tuo ISP o l'ISP del sito che stai cercando di scaricare. Se vedi il problema per i download da più siti, è probabile che sia il tuo ISP.

    E naturalmente, potrebbe anche essere un gruppo di altre cose 🙂 Buona fortuna!

    Stai utilizzando BitTorrent per scaricare questi file di grandi size? Molti ISP hanno installato hardware speciale per rilevare e valutare gli abusi di traffico limitato.

    Chiamerò il tuo ISP per chiederle quale piano hai con loro e se sono a conoscenza di qualsiasi forma di traffico o di strozzamento.

    Ecco cosa utilizza il mio ISP:

    http://www.sandvine.com/

    Lo lascerò come un esercizio all'OP per determinare come aggirare qualsiasi dispositivo di limitazione del tasso di hardware / software se dovrebbe essere trovato.

    solo curiosi, sono queste tutte le macchine Windows 7? Ho avuto un problema simile che ha interessato soltanto le macchine Win 7. L'improbabile soluzione ha funzionato e non sono mai stato più felice nella mia vita.

    Anche se la mia domanda era originariamente per quanto riguarda l'email, ho subito capito che il problema era diffuso a quasi tutto ciò che coinvolge la networking. La correzione di Microsoft è stata semplice e facile ed è qualcosa che sto configurando adesso a tutti i pre-implementazione di macchine W7. Non ho avuto alcun problema da allora.

    Ecco la domanda: Domanda Originale

    Il problema è risolto!

    Il problema era estremamente difficile da diagnosticare perché è accaduto irregolarmente e, anche se raramente, non frequentemente (sì, questa è una contraddizione, io vivo con esso).

    Alla fine il problema sembrava peggiorare e influenzare altri aspetti della nostra connessione, e sono stato in grado di catturarlo in pinguini caduti e simili e mi è diventato chiaro che la questione non era nella nostra networking.

    Il nostro ISP (al momento) era una rivenduta connessione AT & T e quindi ho parlato con il rivenditore prima di presentarle con le informazioni che avevo raccolto (questo è dalla memory, il problema è stato risolto circa 6 mesi fa, così poco dettagli tecnici , mi dispiace) dimostrando che la questione non era interna alla nostra networking. Hanno scoperto che uno dei loro interruttori ha avuto difficoltà e lo ha sostituito, ma questo non ha risolto il problema, quindi hanno fatto dei test e hanno trovato problemi a monte con AT & T e AT & T è riuscito a corroborare e risolvere i problemi.

    Non sono del tutto certo che il problema era solo con AT & T. Sulla base di come i sintomi si esaltarono, direi che l'escalation è dovuta a problemi sul lato di AT & Ts, ma il problema originario era con il nostro ISP locale e quindi abbiamo avuto un problema di fiducia.

    Abbiamo cambiato ISP, lasciando quindi il rivenditore locale per questo motivo e siamo andati a … AT & T. Lo so, fuori dalla padella e nel fuoco. Ma ora stiamo pagando molto less per una garanzia di più, e non appena AT & T ha visto il loro problema, lo hanno risolto, che è OK nel nostro libro.

    Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.