Lo storage pool integrato: il mirroring e lo striping dei dati

08 Febbraio 2016

In questo post parleremo del layer di HC3 dedicato allo storage distribuito e vedremo in quale modo i dati vengono memorizzati sui vari dischi fisici del cluster allo scopo di garantirne la ridondanza in caso di guasto di un drive e per aggregare le performance di I/O di tutte le unità presenti nel sistema.

HC3 tratta tutta la capacità storage di un cluster come un unico pool logico allo scopo di permetterne la scalabilità e facilitarne la gestione; ma l'aspetto più interessante riguarda il modo in cui i blocchi di dati vengono memorizzati in maniera ridondante attraverso il cluster per massimizzarne disponibilità e performance.
Dove possibile HC3 impacchetta tutte le richieste di I/O relative a file o blocchi in una sequenza di chunk da 256KB (il resto viene allocato in chunk da 8KB).

Da qui, il layer Clustered Storage Volume Management fa in modo che due copie di ogni chunk vengano scritte nello storage pool non solo per creare il livello di ridondanza richiesto (equivalente a un approccio RAID 10) ma anche per aggregare le capacità di I/O e throughput di tutti i singoli dischi del cluster secondo una tecnica denominata wide striping.
L'operazione di scrittura dei dati tra il nodo nel quale il protocollo impacchetta l'I/O e i nodi su cui vengono memorizzati i blocchi avviene attraverso la connessione della rete backplane privata al fine di isolare questo tipo di traffico da quello relativo a utenti, server e macchine virtuali.

Prendiamo l'esempio di 10GB di dati che vengono scritti su un cluster di 3 nodi Scale Computing HC3 contenente un totale di 12 hard disk (ciascun nodo contiene 4 dischi da 500GB di capacità nominale per contribuire al cluster con 1TB di capacità storage effettiva considerando che vengono memorizzate 2 copie di ciascun blocco di dati). Quei 10GB di dati (10.240KB) richiederebbero 40 chunk (256KB ciascuno) per memorizzare la prima copia, più altri 40 chunk per memorizzare la seconda copia di ciascun chunk.

Il cluster HC3 esegue l’operazione in questo modo:


 


Ovviamente è possibile che all'interno del cluster vi siano altre operazioni di I/O in corso allo stesso tempo, valorizzando ulteriormente le capacità di I/O e il throughput di tutti i drive presenti nel cluster. Più nodi vengono aggiunti al cluster, più performance aggregate si possono ottenere. I vantaggi della tecnica del wide striping su un grande numero di dischi si applica tanto alle operazioni di I/O di lettura quanto a quelle di scrittura.

Di contro, un controller RAID convenzionale permette di selezionare un numero limitato di dischi e allocarli su un set RAID specifico limitando le performance ai drive presenti in quel particolare set RAID. Se un altro set RAID dovesse essere inattivo, i suoi dischi resterebbero fermi senza nulla da fare nonostante quelli collegati al set RAID in uso si siano trasformati nel frattempo in un collo di bottiglia (la tecnologia RAID impone molte altre limitazioni comuni come l'appesantimento dovuto ai calcoli di parità, ai tempi di ricostruzione, agli hot spare dedicati ecc. che sono tuttavia al di fuori dello scopo di questo documento).
 
(Tratto dal blog di Scale Computing)

Autore
Claudio Panerai
Gli ultimi prodotti che vi ho portato, nel 2020: Vade Secure Il primo sistema antispam/antihishing/antimalware basato sull'intelligenza artificiale e appositamente progettato per Office 365. Naturalmente a misura di MSP. ID Agent Piaffaforma che consente agli MSP di monitorare le credenziali (proprie e dei clienti) che sono in vendita nel dark web.
Nato a Ivrea nel 1969, è sposato e padre di due figlie. Laureato in Scienze dell’Informazione nel 1993, ha dapprima svolto numerose consulenze e corsi di formazione per varie società per poi diventare responsabile IT per la filiale italiana del più grande editore mondiale di informatica, IDG Communications. Dal 2004 lavora in Achab dapprima come Responsabile del Supporto Tecnico per poi assumere dal 2008 la carica di Direttore Tecnico. Giornalista iscritto all’albo dei pubblicisti, dal 1992 pubblica regolarmente articoli su riviste di informatica e siti web di primo piano. E' stimato da colleghi e clienti per la schiettezza e onestà intellettuale. Passioni: viaggi, lettura, cinema, Formula 1, sviluppo personale, investimenti immobiliari, forex trading. Claudio è anche su LinkedIn e Facebook.
Commenti (0)
guest
0 Commenti
Inline Feedbacks
Guarda tutti i commenti

Tieniti aggiornato

Inserisci il tuo indirizzo e-mail per restare aggiornato su tutte le nostre iniziative