La soluzione di backup e disaster recovery disk-to-disk-to-cloud pensata per le PMI

Cosa influenza la velocità di backup e ripristino in BackupAssist ER?

KB521151

Ultimo aggiornamento: 23 March 2021

Tutti i fattori che influenzano i tempi di backup e rispristino nel prodotto BackupAssist ER

Ci saranno momenti in cui sarà necessario eseguire un ripristino completo, localmente o dal cloud, in questo articolo discuteremo i fattori che possono ostacolare o influenzare la velocità di backup e ripristino.

Introduzione

Nel modello D2D2C di BackupAssist ER, ci sono due diverse fasi del backup:

  • Fase 1: l’immagine dell’unità dei dischi di origine sul dispositivo di backup (da disco a disco)
  • Fase 2: backup su cloud dal dispositivo di backup all’archiviazione su cloud (da disco a cloud)

Nella discussione, prenderemo in considerazione il primo backup completo e un ripristino completo. Dal punto di vista del recupero, questo significa:

  1. Ripristino dal backup locale: un ripristino bare metal completo, che copia tutti i dati dal dispositivo di backup alle unità di destinazione
  2. Ripristino dal backup su cloud: che scarica l’intero backup dal cloud, di nuovo su un dispositivo locale

Fase 1 (D2D) Fattori che influenzano la velocità del backup e del ripristino completo locale

FattoreLivello di influenza
Velocità del dispositivo di backupAlto
Velocità delle unità di originemedio

Fase 2 (D2C) Fattori che influenzano la velocità di backup e ripristino completi nel cloud

FattoreLivello di influenza
Velocità della connessione di rete al cloud storageAlto
Avere molti piccoli file nel backupAlto
Velocità del tuo servizio di cloud storagemedio
Numero di thread / core della CPU sulla macchina clientmedio
Velocità dell’unità su cui scaricare il backup nel cloudBasso

Fattori di prestazione dei backup locali (da disco a disco)

La parte da disco a disco del backup in BackupAssist ER è generalmente molto veloce.

Velocità del dispositivo di backup – livello di influenza: alto

Per la maggior parte delle persone, la velocità di scrittura del dispositivo di backup sarà il fattore limitante nell’immagine dell’unità D2D.

La maggior parte delle persone utilizzerà un dispositivo di backup più lento delle unità principali del server. Ecco alcuni colli di bottiglia per le prestazioni.

Archiviazione collegata direttamente sul server

Limitazioni dell’interfaccia:

  • SATA – limite teorico di 6 Gbps (750 MB/s)
  • USB 3.0 – limite teorico di 5 Gbps (625 MB/s)
  • USB 3.1 – limite teorico di 10 Gbps (1250 MB/s)
  • USB 3.2 – limite teorico di 20 Gbps (2500 MB/s)

Limitazioni del dispositivo di archiviazione:

  • HDD: velocità tipiche indicate dal produttore: 227 MB/s, 180 MB/s
    • Se un disco rigido contiene già dati, il livello di frammentazione dei file sul disco diventa estremamente rilevante.
  • SSD SATA: velocità tipica indicata dal produttore: 550 MB/s in lettura e scrittura sostenute
    • Nota: nei nostri test, abbiamo riscontrato che molti SSD non sono in grado di mantenere a lungo la velocità di scrittura sostenuta del produttore. Dopo diversi minuti, abbiamo riscontrato che molti SSD si surriscaldavano e avviavano la limitazione termica (Thermal Throttling), riducendo la velocità di scrittura a meno della metà.

Archiviazione collegata alla rete/ iSCSI

Oltre ai colli di bottiglia elencati per DAS, altri colli di bottiglia sono:

  • Gigabit Ethernet: limite teorico di 1 Gbps (125 MB/s)
  • Velocità dell’unità di elaborazione NAS: una combinazione di CPU (spesso processori incorporati) e sistema operativo.

Velocità delle unità di origine – livello di influenza: medio

Per una minoranza di situazioni, il dispositivo di backup sarà più veloce del dispositivo di origine. In tal caso, il collo di bottiglia saranno le unità di origine.

Oltre ai colli di bottiglia sopra elencati, le unità di origine sono influenzate da:

  • RAID controller
  • Livello di frammentazione dei dati sulle unità

Backup su cloud (da disco a cloud)

Velocità della connessione di rete al cloud storage – livello di influenza: alto

Di gran lunga, la più grande influenza sulla velocità è la velocità della connessione di rete al provider di archiviazione cloud. Per la maggior parte delle situazioni in sede, ciò è limitato dalla velocità del servizio fornito dal provider di servizi Internet.

Ad esempio, se disponi di una connessione 100/20, è molto probabile che ti avvicinerai a 20 Mbps di velocità effettiva per il backup e 100 Mbps per il ripristino. In un esperimento che abbiamo eseguito nel gennaio 2021, possiamo vedere le varie velocità di backup e ripristino da una macchina in sede a 3 diversi cloud pubblici.

Velocità della connessione Internet, testata da speedtest.net:

Velocità media di backup e ripristino:

OperazioneWasabiAzzurroAWS
Backup10,6 Mbps10,0 Mbps10,5 Mbps
Recupero82,2 Mbps79,7 Mbps80,2 Mbps

I fattori che influenzano la vicinanza della tua connessione Internet al suo punto di saturazione sono:

  1. La latenza tra la tua macchina e il servizio cloud
  2. La velocità di trasferimento sostenuta tra la tua macchina e il servizio cloud

La latenza è importante perché influisce sul tempo di attesa che intercorre tra i trasferimenti di dati effettivi. Ciò significa che puoi aspettarti prestazioni inferiori se esegui il backup su grandi distanze, ad esempio tra paesi.

E come mostrato nella tabella sopra, la velocità di trasferimento sostenuta presenta il limite superiore teorico per la velocità media complessiva di upload e download.

Avere molti piccoli file nel backup – Livello di influenza: alto

Prendiamo due scenari: se hai 10 GB di dati in un file, rispetto a 10 GB di dati in 100.000 file, quale sarà il backup e il ripristino più velocemente?

La risposta, senza dubbio, è la prima: lo scenario a file singolo. Vediamo perché …

Ha tutto a che fare con l’algoritmo di “chunking” nel motore cloud di BackupAssist. Prenderà ogni file e lo dividerà in blocchi deduplicati, con una dimensione media di 2 MB. Ma se un file ha una dimensione inferiore a 2 MB, l’intero file viene archiviato come un blocco.

Nei nostri due scenari:

  • Scenario a file singolo: il file viene suddiviso in (in media) 5.000 blocchi da 2 MB ciascuno
  • Molti scenari di file: i file vengono archiviati in 100.000 blocchi di (in media) 100 KB ciascuno.

Ciò significa che nel nostro primo scenario, BackupAssist invierà 5.000 richieste all’archivio cloud, ma nel secondo scenario ci saranno 100.000 richieste. Questo è 20 volte di più!

Ogni richiesta al server richiede tempo e l’effetto è molto evidente se c’è un’elevata latenza tra la tua macchina e il servizio cloud.

Cerchiamo di mitigare questo problema avendo molte connessioni simultanee aperte al servizio cloud, ma non si può evitare il fatto che molte richieste al server cloud rallenteranno le cose.

Velocità del tuo servizio di cloud storage – livello di influenza: medio

Durante i nostri test sperimentali, abbiamo testato la velocità di vari servizi cloud per il backup e il ripristino e abbiamo scoperto che la velocità del servizio cloud fa la differenza.

In un esperimento che mostra le differenze al meglio, vediamo una differenza di circa il 10% tra il cloud più veloce e più lento durante il ripristino, ma una differenza enorme del 76% sul backup.

Numero di thread / core della CPU – livello di influenza: medio

Supponendo che la connessione di rete e la velocità del servizio cloud non siano colli di bottiglia significativi, il numero di thread / core della CPU influisce sulla velocità di backup e ripristino.

Nei nostri esperimenti dettagliati con diversi thread / core della CPU abbiamo visto un miglioramento di circa il 30% raddoppiando il numero di thread della CPU da 8 a 16. Ma andare oltre i 16 thread non produrrà un vantaggio significativo in termini di prestazioni.

Le ragioni di ciò sono discusse in quell’articolo del blog.

Velocità dell’unità su cui si scarica il backup su cloud – livello di influenza: basso

L’ultimo fattore di cui discuteremo oggi riguarda il ripristino, ovvero il disco su cui stai eseguendo il ripristino. Quando scarichi un backup completo dal cloud, il tuo disco di destinazione può fare la differenza.

Supponiamo per ora di avere una rete veloce, un servizio cloud veloce e una CPU a 16 thread.

Se esegui il ripristino su un disco rigido anziché su un SSD , si verificherà un rallentamento, soprattutto se nel backup sono presenti file di grandi dimensioni. (E consideriamo qualsiasi file superiore a 20 GB come un file enorme … e più grande è il file, maggiore è il potenziale rallentamento che potresti riscontrare.)

Il motivo è che BackupAssist deve scaricare blocchi e quindi riassemblarli per ricreare i file originali. Il problema è che non possiamo prevedere in anticipo in quale ordine arriveranno questi pezzi … infatti, la maggior parte delle volte arrivano fuori ordine. Pertanto, spesso dobbiamo scrivere blocchi su file temporanei su disco e quindi riscriverli “sul posto” nella destinazione finale quando diventano disponibili blocchi contigui.

Ciò può causare una notevole quantità di I/O del disco quando i dati vengono scritti, letti e riscritti sullo stesso disco.

Sugli SSD, questo effetto è appena percettibile, ma sui dischi rigidi in rotazione può provocare un rallentamento.

Conclusioni

BackupAssist ER può fornire backup e ripristino a prestazioni estremamente elevate in ambienti senza colli di bottiglia significativi.

Tuttavia, ogni sistema avrà dei limiti, molti dei quali derivanti da considerazioni pratiche o di bilancio sottostanti.

La comprensione dei colli di bottiglia può darti un’idea di cosa aspettarti da BackupAssist ER nel tuo ambiente e una guida su come ottenere le migliori prestazioni di ripristino con le risorse a tua disposizione.

New call-to-action