Archiviazione dati: la soluzione al disordine informatico

Che sia il tema principale del 2025? Non si può dire, ma che i nostri sistemi informativi rischino il disordine informatico, questo è innegabile.

Parto dalla mia esperienza: io non cancello niente. Quasi come un “nidarolo” (si dice a Bologna), ovvero un soggetto che accumula in cantina. Solo che io non accumulo in cantina, ma conservo dati sul disco. E come faccio io fanno tutti perchè “non si può mai sapere”.

 

Perché archiviare i dati informatici

Tutto ciò genera una enorme quantità di dati nei nostri sistemi informativi, dati spesso destrutturati, che occupano giga e giga di spazio, per non dire terabyte. Questo genera confusione ed entropia, non solo nelle directory di rete o nei sistemi documentali, ma soprattutto nell’utilità di detti dati, perché l’utente finisce per non ricordarsi neanche più di averli, e riduce le possibilità di ricerca. Senza tenere conto che di detti dati dobbiamo comunque provvedere alla business continuity, al backup, al disaster recovery, al… riscatto in caso di esfiltrazione e furto.

Non ha senso, non ha più senso. C’è la via d’uscita, c’è la soluzione.

L’archiviazione dati.

 

Il criterio di archiviazione

Lasciatemi partire da una definizione: l’archiviazione dati non è il backup ed il backup non è l’archiviazione dati. Archiviare significa togliere dei dati dall’ambiente di produzione e portarli in un archivio storico. Non facevamo lo stesso con i faldoni delle fatture in cantina?

Lo stesso dobbiamo farlo con i dati, definendo, innanzitutto, il criterio di archiviazione: può essere la “vecchiaia” del dato, o più opportunamente, il tempo di non accesso. Infatti, un file può essere vecchio e non modificato da tempo, ma acceduto in consultazione quotidianamente, e quindi non ha senso archiviarlo. Poi si possono aggiungere altri parametri, più sofisticati e dettagliati, come il proprietario, che magari non lavora più in azienda, o altri elementi legati alle persone della nostra organizzazione.

 

Archiviazione dati sicura

Quindi abbiamo capito che dobbiamo spostare fuori dall’ambiente di produzione i dati freddi, ovvero quei dati che non sono praticamente più utilizzati. Il primo punto fermo è che tale spostamento deve avvenire in sicurezza, ovvero garantendo anche al dato archiviato la doppia copia, perché se li teniamo in doppia copia in produzione, la logica vuole che tale livello di sicurezza avvenga anche nell’archivio storico: se no, tanto vale, cancellarli.

 

Trasferire i dati in uno spazio di archiviazione in cloud

In secondo luogo, va definito dove archiviare i propri dati: a mio parere non ha senso archiviare in casa se non ho almeno 100TB di dati freddi. E anche oltre questa cifra ci penserei bene a mettermi questo onere in casa. Il cloud è la morte sua, si dice. Esistono molti sistemi di archiviazione cloud, a partire da AWS che è sempre tenuto come termine di paragone.

Attenzione! Nell’ambito del servizio di archiviazione cloud, molte piattaforme fanno pagare lo spazio disco una cifra fissa, più un costo irrisorio per l’upload, invitandoci così a caricare i dati, per poi bastonare l’utente nella tariffazione del download degli stessi.

 

Il supporto di archiviazione dati

In terzo luogo, va definito il supporto sul quale archiviare: e la scelta è semplice e non ammette dubbi. Protocollo S3 su disco o su nastro. Non si archivia su NAS, ovvero su sistemi con protocolli CIFS o NFS, che sono ancora attaccabili dai ransomware, mentre l’object storage offre la possibilità di immutabilità, o addirittura il nastro non è scrivibile come un comune disco. Archiviare dati su S3 significa quasi contestualmente effettuare un’archiviazione dati in cloud, o su un servizio offerto nel cloud.

Una soluzione interessante offerta da Meet It è la creazione di una prima copia su S3 single node disco in casa, ed una replica su nastro offerta in cloud. Questo garantisce gli stessi vantaggi per l’archiviazione sicura dei dati e solitamente rappresenta una scelta più economica.

 

Quale software di archiviazione dati utilizzare

Infine, è necessario un software di archiviazione, ovvero un prodotto/servizio che prenda i dati freddi dal source e li sposti sul destination. A questo proposito esistono diverse soluzioni: io suggerisco di guardare quelle più agnostiche possibili, ovvero quelle che partono da qualunque source ed archiviano in qualunque destination.

Una scelta da fare in questo caso è se lasciare o meno lo stub, ovvero l’alias sul file system: è vero che questa soluzione lascia all’utente l’idea che il file ci sia ancora: l’utente che vuole accedere al file archiviato col doppio click “richiama” il file che viene ricopiato dall’archivio al file server per ricominciare il suo ciclo di vita. A volte però questa soluzione genera confusione, dovuta al fatto che l’apertura del file non è immediata come per un file locale. A questo punto spesso l’utente comincia a fare multipli doppi click, generando confusione al sistema.

Una soluzione più tranchant, ma forse più semplice, è quella di avvisare gli utenti che, tutti i file non trovati ed archiviati vanno ricercati nel portale di archiviazione, dotato di interfaccia web e quindi interrogabile solo da browser. Qui possono essere anche attivati i metadati per l’indicizzazione e la più facile ricerca dei file, che mantengono comunque la gerarchia ed i diritti di lettura che avevano in precedenza

 

Archiviare dati tramite backup? Non sempre una buona idea

Esistono anche soluzioni di backup che con “one-pass” archiviano, ovvero cancellano da source il dato e lo tengono in doppia copia (se disponibile) sull’ambiente di backup. Vero, anche se la soluzione slegata dal backup è sicuramente più flessibile per l’utente, in termini di ricerca e lettura del dato archiviato.

 

Conclusioni

La mia esperienza dice che mediamente il 70% dei file system può essere così snellito, e far uscire dal ciclo dei backup + disaster recovery + business continuity molti TB di dati vecchi. Pensiamo a nuove infrastrutture di storage, oggi ormai all flash: perché spendere migliaia di euro per dati vecchi? Non dobbiamo arricchire i produttori di storage, non ne hanno bisogno…

 

Giuseppe Mazzoli
Amministratore Unico di 3CiME Technology

 

Condividi

Video in evidenza