Uncategorized

Dlaczego warto robić wielokrotne backupy – case study

Dziś będzie wpis, który nie będzie dotyczyć programowania :)

Kilka dni temu, oczekując aż pasek postępu pewnej długo trwającej operacji dojdzie do końca, przeglądałem moje archiwa ze zdjęciami. Dane te (zdjęcia) trzymam w dwóch miejscach: na dysku podstawowym WD Green, oraz na dysku backupowym WD Red. Gdy przejrzałem już wszystkie zdjęcia z 2008 oraz 2009 roku, uświadomiłem sobie, że nigdzie nie widziałem zdjęcia, które kiedyś miałem jako profilowe na wielu portalach. A przecież dokładnie pamiętam to zdjęcie – zrobione podczas próby u mnie w garażu, gdy akurat miałem chwilę przerwy w graniu na perkusji. Przez moment pomyślałem, że może pamięć mnie zawodzi, że może to zdjęcie było zrobione kiedy indziej – ostatecznie doszedłem do wniosku, że jednak z moją pamięcią jest wszystko OK, a problem raczej leży po stronie maszyny, zwanej komputerem. Przystąpiłem więc do próby odnalezienia innej wersji tego zdjęcia – jako, że to był mój avatar na wielu forach, miałem je na dysku (w katalogu z obrobionymi zdjęciami) w wielu rozmiarach.

Bingo! Zdjęcie się znalazło – ale tylko obrobione. Surówki brak. Szybkie sprawdzenie danych w Exifie potwierdza mój stan pamięci – data zrobienia zdjęcia 10 lipca 2009. W Exifie są również informacje o pozostałych parametrach zrobienia zdjęcia. Ustaliłem, że zdjęcie zrobiono z ogniskową 135mm. Wyszukałem więc wszystkie pliki JPG, na wszystkich dyskach, które w Exifie mają ogniskową o długości 135mm. Przegląd wyników wyszukiwania nie przyniósł niestety oczekiwanych rezultatów – pośród wyników były tylko obrobione kopie poszukiwanego zdjęcia – surówki nadal brak.

Zacząłem się więc zastanawiać, czy dane Exif są prawidłowe. Przecież rozpoczynając edycję zdjęcia A, a wklejając na płótno zdjęcie B, w Exifie zostaną dane zdjęcia A. Przez chwilę potraktowałem Exif jako fałszywy trop. Podjąłem nawet zupełnie oderwaną od rzeczywistości próbę ustalenia większej ilości szczegółów na temat możliwej daty zrobienia tego zdjęcia – dostrzegłem, że w tle zdjęcia wisi kalendarz. Pomimo tego, że obrobione kopie zdjęcia były w niskiej rozdzielczości, udało się odczytać rok kalendarza – 2008. Niewiele to dało – zdjęcie miało być zrobione w 2009, kalendarz jest z 2008 – nie zawężyło to możliwego zakresu dat.

(w międzyczasie pasek postępu, rzeczonej wcześniej długo trwającej operacji, wolno zmierzał ku 50%, więc nadal miałem sporo czasu na moje analizy).

Analiza innych zdjęć z dni otaczających 10 lipca 2009 potwierdzała, że to zdjęcie mogło być zrobione 10 lipca 2009 – ułożenie przedmiotów w tle się zgadzało. Niestety ostatnie zdjęcie było z 9 lipca, a kolejne dopiero z 12 lipca. Katalog z 9 lipca kończył się na pliku z numerem 86, a katalog z 12 lipca zaczynał się od pliku z numerem 12. To, że w międzyczasie formatowałem kartę i numeracja wyzerowała się jest OK. Ale dlaczego startuje od 12? Czyżby mi brakowało 11 zdjęć? Może właśnie tam jest to zdjęcie, którego szukam. Tyle pytań, a żadnych odpowiedzi.

Uruchomiłem więc stary komputer. Przeszukałem cały dysk, ale na nim kompletnie nie było śladu po tych zdjęciach. No tak – przecież jakiś czas temu skasowałem je z tego komputera, bo były tylko trzecią kopią. Pierwsza i druga kopia były na dwóch dyskach (WD Green oraz WD Red) nowego komputera, zatem nie było sensu trzymać trzeciej kopii.

Ale…. Kopia pierwsza oraz druga (te z nowego komputera) zostały utworzone z danych odczytanych z dysku zewnętrznego Samsung. Dysku, który jak się później okazało był uszkodzony. Jednak zanim się dowiedziałem, że jest uszkodzony używałem go jako backupu. Przez długi czas. W momencie, gdy dysk ten zaczął szwankować nawet się tym nie przejąłem, bo cała jego zawartość była już bezpieczna na dwóch dyskach nowego komputera. Zaraz sami się przekonacie, że było to bardzo złudne poczucie bezpieczeństwa.

Odkładając stary komputer na swoje miejsce do głowy przyszła mi jeszcze jedna myśl – przecież ja kiedyś te zdjęcia nagrałem na płyty! Szybkie przeszukanie archiwów i już mam w dłoni płytę podpisaną 2009.07.10. Czuję specyficzny zapach, charakterystyczny dla płyt. Wkładam krążek DVD do komputera, a napęd powoli rozpędza się. Jak dawno nie słyszałem tego dźwięku. Na płycie są 92 pliki. Plik z numerem 90 to zdjęcie, którego szukałem. Super!

Tylko skąd ta różnica w zawartości katalogów? Teraz wszystko stało się jasne. Pierwszy backup (nagranie zdjęć na płytę) wykonałem jeszcze ze starego komputera. Właśnie na ten komputer przegrywałem wtedy zdjęcia bezpośrednio z aparatu. Za jakiś czas kupiłem dysk zewnętrzny Samsunga i zrobiłem na nim backup zdjęć. Jednocześnie przestałem backupować zdjęcia na płytach. Myślałem, że na dysku zewnętrznym będą bezpieczne. Dysk trzymałem w szufladzie, podłączałem go do komputera tylko, żeby skopiować na niego pliki. Nigdy nie wynosiłem go poza mieszkanie. Teoretycznie więc nic nie mogło mu się stać, wydawał się być pewnym nośnikiem danych.

Jakiś czas później później kupiłem nowy komputer. Jednak dane na nowy komputer nie były przegrywane bezpośrednio ze starego komputera, ani z płyt – tylko z dysku zewnętrznego. Gdy wszystkie pliki leżały bezpiecznie (jak mi się wtedy wydawało) w kilku miejscach na nowym komputerze, sformatowałem stary komputer.

Po jakimś czasie zaczęły się problemy z dyskiem zewnętrznym Samsung. Jego podłączenie czasem zawieszało komputer, bardzo wolno działał, a bywało, że nie dało się odczytać plików. A więc Samsung się zepsuł. Część plików, które były na nim zapisane była wypełniona zerami, a kolejna część plików po prostu zniknęła. Niestety – od czasu powstania tych uszkodzeń, do momentu ich odkrycia minęło sporo czasu. Bo wszystko co skopiowałem z tego dysku na nowy komputer było obciążone wadami – zerami w niektórych plikach lub niepełnymi katalogami. Jednak kopiując te dane na nowy komputer o tym nie wiedziałem – przed sformatowaniem starego komputera nie sprawdziłem checksum katalogów backupów – co było moim błędem. Tak więc backupowałem sobie dalej te uszkodzone pliki i katalogi z brakami, nie wiedząc o tym. Gorsze było to, że losowe sprawdzanie integralności danych (czyli po prostu przeglądanie różnych świeżo skopiowanych plików) nie wykazało, że są problemy. Uszkodzenia był zbyt małe, i wybierając losowe zdjęcia trafiałem zawsze akurat na takie, które dało się otworzyć.

Ostatecznie wszystkie pliki, których brakowało w bieżących kopiach odzyskałem – część z płyt, a część z innych archiwów, takich jak załączniki do maili czy chmury.

Jak wiadomo ludzie dzielą się na dwie grupy: na tych którzy robią backupy oraz na tych którzy będą robić backupy. Jednak jak widać na moim przykładzie samo kopiowanie plików nie zawsze wystarcza. Warto sprawdzać sumy kontrolne wszystkich backupów oraz danych źródłowych. Dane, które leżą na dysku z backupem, mają ten problem, że rzadko do nich sięgamy – bo zwykle korzystamy z danych źródłowych. Mogą się więc uszkodzić, i nawet się o tym nie dowiemy. Robiąc kopię uszkodzonych danych, będziemy żyć w przeświadczeniu o bezpieczeństwie naszych plików, ale będzie to miało dla nas zgubne skutki. Częściowym rozwiązaniem jest więc robienie backupów zawsze tylko z danych źródłowych. Jak widać backup backupu backupu może się nie sprawdzić, jeśli już pierwszy z nich ma wady ukryte.

Obecnie posiadam backup zdjęć w dwóch miejscach, a wszystkie sumy kontrolne są zgodne. Wydaje się więc, że wszystko jest OK. Jednak mimo wszystko zastanawiam się, czy nie zainwestować w kolejny sposób backupu, np. nagrywarkę blu ray. Bo przecież każdy kolejny n backup, zwiększa szanse na odzyskanie danych, jeśli poprzednie n-1 backupów zawiedzie.

Facebooktwittergoogle_plusredditpinterestlinkedinmailFacebooktwittergoogle_plusredditpinterestlinkedinmail

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

*