Lo storage pool integrato: il mirroring e lo striping dei dati

08 Febbraio 2016

In questo post parleremo del layer di HC3 dedicato allo storage distribuito e vedremo in quale modo i dati vengono memorizzati sui vari dischi fisici del cluster allo scopo di garantirne la ridondanza in caso di guasto di un drive e per aggregare le performance di I/O di tutte le unità presenti nel sistema.

HC3 tratta tutta la capacità storage di un cluster come un unico pool logico allo scopo di permetterne la scalabilità e facilitarne la gestione; ma l'aspetto più interessante riguarda il modo in cui i blocchi di dati vengono memorizzati in maniera ridondante attraverso il cluster per massimizzarne disponibilità e performance.
Dove possibile HC3 impacchetta tutte le richieste di I/O relative a file o blocchi in una sequenza di chunk da 256KB (il resto viene allocato in chunk da 8KB).

Da qui, il layer Clustered Storage Volume Management fa in modo che due copie di ogni chunk vengano scritte nello storage pool non solo per creare il livello di ridondanza richiesto (equivalente a un approccio RAID 10) ma anche per aggregare le capacità di I/O e throughput di tutti i singoli dischi del cluster secondo una tecnica denominata wide striping.
L'operazione di scrittura dei dati tra il nodo nel quale il protocollo impacchetta l'I/O e i nodi su cui vengono memorizzati i blocchi avviene attraverso la connessione della rete backplane privata al fine di isolare questo tipo di traffico da quello relativo a utenti, server e macchine virtuali.

Prendiamo l'esempio di 10GB di dati che vengono scritti su un cluster di 3 nodi Scale Computing HC3 contenente un totale di 12 hard disk (ciascun nodo contiene 4 dischi da 500GB di capacità nominale per contribuire al cluster con 1TB di capacità storage effettiva considerando che vengono memorizzate 2 copie di ciascun blocco di dati). Quei 10GB di dati (10.240KB) richiederebbero 40 chunk (256KB ciascuno) per memorizzare la prima copia, più altri 40 chunk per memorizzare la seconda copia di ciascun chunk.

Il cluster HC3 esegue l’operazione in questo modo:


 


Ovviamente è possibile che all'interno del cluster vi siano altre operazioni di I/O in corso allo stesso tempo, valorizzando ulteriormente le capacità di I/O e il throughput di tutti i drive presenti nel cluster. Più nodi vengono aggiunti al cluster, più performance aggregate si possono ottenere. I vantaggi della tecnica del wide striping su un grande numero di dischi si applica tanto alle operazioni di I/O di lettura quanto a quelle di scrittura.

Di contro, un controller RAID convenzionale permette di selezionare un numero limitato di dischi e allocarli su un set RAID specifico limitando le performance ai drive presenti in quel particolare set RAID. Se un altro set RAID dovesse essere inattivo, i suoi dischi resterebbero fermi senza nulla da fare nonostante quelli collegati al set RAID in uso si siano trasformati nel frattempo in un collo di bottiglia (la tecnologia RAID impone molte altre limitazioni comuni come l'appesantimento dovuto ai calcoli di parità, ai tempi di ricostruzione, agli hot spare dedicati ecc. che sono tuttavia al di fuori dello scopo di questo documento).
 
(Tratto dal blog di Scale Computing)

Autore
Gabriele Palumbo
Nasco a Bologna ma ho vissuto l’infanzia in Piemonte, l’adolescenza in Puglia e la maturità tra Umbria, Toscana, Puglia, Emilia-Romagna e Lombardia (e non è ancora finita). Ho avuto quindi modo di entrare in contatto con diversi ambienti e contesti sociali. Una formazione umanistica (Sociologia della devianza a Perugia e Relazioni Internazionali a Pisa), passione per la scrittura e decine di corsi sul mondo digital sono state ottime basi per entrare nel campo del marketing e della comunicazione. Nel 2015 pubblico il romanzo breve “Ci siamo solo persi di vista” e, a inizio 2019, pubblico la biografia della rock band “Ministri”, entrata in poche ore nei Top Sellers di Amazon. Un romanzo è in fase di scrittura. Terminati gli studi entro attivamente nel mondo della musica, organizzando svariati concerti e un festival, e della comunicazione digitale, gestendo la linea editoriale di blog e social e ricoprendo ruoli di copywriter e content editor. Nel 2017 entro nel collettivo Dischirotti. occupandomi dei contenuti web, mentre il 2018 mi vede prima nell’agenzia FLOOR concerti come booking agent per svariati artisti e poi in VOX concerti come direttore di produzione. Tornato a Bologna inizio a collaborare con l’etichetta discografica Manita Dischi come project manager e svolgo un tirocinio presso l’agenzia di marketing e comunicazione digitale Engine Lab, nel ruolo di content editor. Dal 2020 al 2023 ho collaborato, sia come editor che come contributor, con Fantastico.esclamativo, newsletter letteraria e rivista culturale creata da Alberto Guidetti de Lo Stato Sociale. Ogni due sabati invio “Capibara”, una newsletter che tratta di attualità e meme in un progetto che, occasionalmente, porto anche dal vivo sotto forma di Stand-Up. Attualmente ricopro il ruolo di Channel Marketing Manager in Achab, con particolare focus su contenuti editoriali, analytics, marketing automation e CMS.
Commenti (0)
Iscriviti
Notificami
guest
0 Commenti
Inline Feedbacks
Guarda tutti i commenti