DR sta per disaster recovery. Sono particolarmente paranoico per i miei dati e per i dati della moglie di un mio caro amico, che fa la fotografa.
Ora, io produco veramente poco, tutti i miei dati personali stanno in una 80ina di giga, ma il grosso sono foto. Se faccio un controllo sui miei documenti, contratti, dati clienti di lavoro … siamo a 5.2 giga.
I miei dati stanno su 5 macchine diverse, tutte con il filesystem crittato. Una di queste sta a Berlino, il resto sta nel mio ufficio in Franciacorta: una copia su portatile, una su fisso, una su Mac mini, forse anche qualche qualche vecchia macchina, ma non sincronizzata abitualmente.
Di solito tengo sincronizzati portatile e workstation. Subito a seguire si va su JBOD ZFS, ovvero una macchinetta esterna che mi presenta i dischi all’accensione tramite SAS e SATA (la stessa macchinetta ha un controller SAS per il tape driver). I dischi su tale macchina sono in in raidz1 (cosa non ottimale, che sto anche io imparando in corso d’opera… sostanzialmente perdo i dati, nel momento in cui mi muoiono almeno 2 dischi su 5).
In aggiunta, critto e butto i dati su AWS Glacier tramite duplicity+gpg
E giusto perche’ il cloud e’ sempre il computer di qualcun altro… registro i dati in maniera crittata anche su dei nastri magnetici, che alla fine e’ quello che fa AWS Glacier. (vedasi i costi, non ci vuole molto a dedurlo).
Analisi tecnica ed economica
Visto che un DVD/Blueray potrebbe arrivare a 50 giga. Un normale DVD non super i 4.5 giga… potrebbe essere un’alternativa su cui scrivere i dati. Quello che cerco di evitare e’ di mantenere in giro dei dischi retail di quelli che si comprano in qualsiasi negozio di computer. Oramai un disco esterno da 1TB pero’ si aggira sui 100EUR…
Ovviamente sono un te-nnnico, per cui scoprendo che sul mercato si trovavano nuovi ancora nastri di tipologia LTO5 (1.4 TB o 2.5 TB in caso di compressione LZO -> non applicabile a materiale gia’ compresso di suo come video e immagini) a 25 EUR l’uno… mi sono messo a cercare unita’ nastri per poterle usare. Normalmente nuove costano un rene, sopra i 4k EUR, ma ne ho trovate di usate sui 300-400 EUR.
Rotta la prima (unita’ LTO5, me ne sono comprata una seconda mentre la prima era in riparazione e me la sono portata a Berlino. Per cui ho anche il DR in due posti decisamente distanti tra loro.
Ora… tutto questo e’ molto bello e nerdico, ma fottutamente antieconomico, soprattuto per le moli di dati irrisorie che tratto.
e con la fotografa?
Allora, DB e’ una fotografa giovane, per cui non so ancora dove portera’, diciamo che i suoi dati di lavoro stanno nell’ordine dei 6/7 TB, tutti. Ovviamente mi sento responsabile nel vederla trafficare con dischi esterni USB presi nelle grandi catene di distribuzione, che le morivano come mosche al sole… le ho fatto anche a lei una unita’ JBOD (again: just a bunch of drives, la sigla non e’ niente di esoterico).
Perche’ non un NAS? perche’ il NAS ti impone quello che vuole lui, non puoi truscolare con la tecnologia di replica e consistenza dei dati, prendi quel che passa il convento. Invece con OpenZFS so che da Linux, Win o Mac, i dati li vedo sempre. Ho dovuto disattivare un paio di funzionalita’ per essere sicuro di vedere il dataset su qualsiasi sistema operativo.
Sempre perche’ non un NAS, sul gruppo di barbe bianche appassionati di sistemi *nix/Linux, uno recentemente ha dovuto aggiornare tutti i dischi nell’unita’ e non ha potuto giocare col resilvering. Sostanzialmente se avesse avuto ZFS, avrebbe potuto cambiare un disco alla volta, facendo la re-sincronizzazione nel mentre per ciascuno, e invece ha dovuto recuperare un secondo NAS, trasferire tutti i dati e dismettere il vecchio.
Inoltre…
Il primo tentativo con DB per il suo JBOD con ZFS ci ha lasciati a piedi, forse era il convertitore thundebolt > eSata (mi ero accanito a voler usare eSata al tempo) … fatto si e’ che come le ho cambiato lo scatolo in cui mettere i dischi, con uno USB-3, i dati sono andati corrotti. Ma essendo ZFS uno standard, ho trovato chi si e’ scritto una utility per Windows per recuperare i dati, e ci siamo riusciti, recuperati e anche la history di scrittura (anche i file cancellati nel tempo).
Ma… in tutto questo il mio tempo e’ stato divertimento, perche’ se avessi dovuto conteggiarlo sarebbe stata completamente anti-economica come soluzione.
Per cancellare un nastro LTO5, ci vogliono 4 ore. Per scrivere un dataset da 1.4 TB ci vogliono circa 12h, e per rileggerlo, forse qualcosa meno. Insomma, DB sta su 4 nastri LTO5, indistruttibili, a quanto pare non dovrebbero avere problemi ad attraversare i raggi X agli aereoporti, non e’ roba che emette onde magnetiche, per cui…
Ma il disco esterno preso in un qualsiasi grande magazzino costa infinitamente meno di tutto il cinema qua sopra.
Sicurezza
Ah, per avere i nastri cifrati, nel mio caso, uso dump di snapshot di pool crittati in AES256 da OpenZFS… LTFS per il momento mi ha dato solo problemi di compilazione o consistenza di uso, accesso, tra workstation/OS differenti. Non che LTFS mi aggiunga alcun layer di sicurezza, ma alla fine il modo piu’ pratico che ho trovato e’ registrare dei file singoli, dump AES256, scritti tramite l’utili *nix standard ‘tar’.
p.s. se qualcuno e’ paranoico come me ho l’infrastruttura e gli faccio volentieri dei nastri LTO5, ma non ho la piu’ pallida idea di cosa far pagare un servizio simile