La tecnologia All Flash Storage

All Flash

Dagli anni ’60 ad oggi la tecnologia di memorizzazione dei dischi è rimasta immutata.
Per memorizzare i dati aziendali ci siamo affidati a piatti magnetici rotanti: la performance è definita dalla tecnologia di connessione e dalla velocità di rotazione del piatto. Questo sistema è solitamente integrato da una certa quantità di memoria (detta cache) che riesce a minimizzare gli effetti di lentezza che affliggono il sistema. Il tutto è naturalmente basato sulla meccanica: la testina si deve posizionare sul piatto prima di leggere o scrivere e tutto questo richiede tempo.

Da diversi anni sono nati sistemi di memorizzazione con memoria a stato solido (SS). Questi sistemi, solo inizialmente lenti e costosi, si sono diffusi in molti settori: se pensiamo agli smartphone o alle chiavette USB avremo una chiara indicazione della crescita delle capacità a cui abbiamo assistito in poco tempo.
Il successivo passo, sempre per gli stessi motivi, sono stati i dischi SSD ad equipaggiare i portatili. Se avete mai provato la differenza tra un disco tradizionale ed uno SSD (magari sostituendolo sullo stesso portatile) avrete notato un impareggiabile aumento della velocità unito ad un aumento della durata della batteria. Nell’ambito di memorizzazione enterprise questo è altrettanto dirompente in termini prestazionali, ma unito ad un prezzo più elevato per terabyte.

Da diversi anni sono comparse svariate tecnologie che puntano ad utilizzarli in maniera mirata. Le tecnologie di tiering sono ormai mature, si tratta di mettere una percentuale di dischi SSD (di solito tra il 10% ed il 20% dello spazio totale) davanti a dischi tradizionali. Questo approccio permette di godere appieno dei vantaggi degli SSD ad un prezzo bilanciato. In pratica i dati vengono mantenuti il più possibile nei dischi SSD e poi passano, quando meno utilizzati, nei dischi di tipo tradizionale. Questo sistema risulta efficace in molti casi ma naturalmente deve concedere delle limitazioni. Quando il dato viene posizionato nel tier tradizionale deve venire letto dai dischi rotanti. Questo risulta inevitabilmente più lento. Altro effetto collaterale è la user experience sfalsata: la stessa applicazione potrebbe essere a volte performante, a volte meno a seconda di dove risiedono i dati utilizzati. Questo a livello applicativo non è predicibile e comporta spesso una percezione generale di inconsistenza delle prestazioni.
Va da sé che un sistema completamente SSD è la soluzione tecnologicamente migliore, il dato è sempre veloce, lo strato software di gestione è più semplice e le applicazioni sono sempre approvvigionate di dati al massimo delle prestazioni. Non solo la velocità è alta (in GB/s) ma la latenza è molto bassa e sempre uguale, non ci sono testine da posizionare e in genere parti in movimento. Due sono i problemi che da sempre limitano l’adozione massiva di questi sistemi, il primo (reale e concreto) il prezzo, il secondo (per lo più un mito) l’inaffidabilità.

Passerò ora ad analizzarli per dimostrare come queste siano problematiche superate dai moderni sistemi All Flash:
  1. Prezzo. Il prezzo di acquisto per TB sta velocemente scendendo unito ad un aumento della densità. Oggi esistono dischi di dimensione 2,5” da oltre 10TB contro il massimo da 2TB per la stessa dimensione dei dischi tradizionali. Inoltre, grazie alla performance, possiamo utilizzare tecniche di efficientamento impossibili da proporre su dischi tradizionali. Partendo dal meccanismo di protezione dei dischi, RAID6 estesi, e utilizzando poi compressione e deduplica non è insolito ottenere dei rapporti superiori al 1:2 quindi è possibile parlare di un più che dimezzamento dei costi reali. Considerando anche alcuni costi collaterali che comprendono il minore spazio occupato, minore consumo elettrico e generazione di calore (nell’ordine di 150W per ogni TB in meno) il risultato è che la tecnologia all flash risulta molto interessante. Pensiamo inoltre quale sia il valore di dimezzare (o anche meno) i tempi elaborativi delle più critiche delle nostre applicazioni. Nel costo totale possiamo anche valutare di aver bisogno di meno potenza elaborativa, quindi meno server per ottenere lo stesso risultato o, per lo stesso motivo, di poter allungare i cicli di rinnovamento sia dei server che dello storage stesso (non abbiamo più gli stessi problemi di limite di performance).
  2. Inaffidabilità. Come già accennato prima, lo considereremo più un mito che altro. La realtà non è che i dischi SSD siano inaffidabili o abbiano rotture superiori a quelli tradizionali, anzi non avendo parti in movimento sono meno soggetti a problematiche. Hanno però una caratteristica, ossia è possibile scrivere un numero di celle un numero ben determinato di volte prima che queste risultino inutilizzabili. Questa è una caratteristica che viene determinata dal processo produttivo ed è fissa. Gli SSD hanno un numero predeterminato che viene indicato come PDW (Per Day Write), ossia la quantità di dati che può essere scritta ogni giorno per 5 anni sul disco stesso in rapporto alla sua dimensione. Quindi un disco da 1 TB che ha un DPW 1 ha la possibilità di scrivere 1TB di dati al giorno per 5 anni prima di esaurirsi. Questo parametro è determinato dal processo produttivo ed indica anche il prezzo di produzione (e poi vendita) del prodotto. E’ qui spiegata la differenza di costo che intercorre dagli SSD da PC (DPW 0.3-0.5) e quelli per datacenter con un DPW che va da 3 a 10. L’esperienza di Nanosoft è che difficilmente si superi il 30% di scritture su disco giornaliere, comunque fa parte delle dimensioni misurabili durante la fase di analisi del progetto grazie a tool specifici. Oltre quindi ad aver chiarito questo punto naturalmente utilizziamo RAID evoluti per proteggere i dati con bassi tempi di ricostruzione grazie alle performance degli SSD.

In conclusione reputo che al momento di scegliere una soluzione di storage sia doveroso valutare una soluzione All Flash affidandosi a realtà come Nanosoft che, oltre alla capacità tecnologica, affronta le opportunità per offrirle ai propri clienti e per l’utilizzo nei propri datacenter.
Dal 2014 utilizziamo sistemi All Flash di DellEMC, Purestorage, IBM e NetApp oltre che soluzioni iperconvergenti full flash basate su tecnologie Nutanix, VMware vSAN e Datacore.


Dario Vemagi

Dario Vemagi
Solution Designer Nanosoft – Gruppo Sme.UP
My LinkedIn Profile


Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *