Automatyzacja S.M.A.R.T.

Dział przeznaczony dla profesjonalistów i entuzjastów produktów Synology. Można tu dyskutować oraz nauczyć się jak zmodyfikować serwer Synology. Informacje w tym dziale nie są wspierane przez Synology.

Automatyzacja S.M.A.R.T.

Postprzez jdoe77 » 4 wrz 2010, o 21:59

Ostatnio zostałem niemile zaskoczony przez jeden z dysków, który odmówił współpracy w najmniej spodziewanym momencie. Oprócz malowniczego wpisu do logu typu: "Read error at md3 disk2 sector xxxxx" także rozszerzony test SMART potwierdził błędy na dysku. I tutaj zadałem sobie pytanie - a co by było, gdyby wcześniej test SMART wykrył mi błędy? Super, tylko musiałbym co pewien czas uruchamiać taki test z poziomu DSM. Ale przecież nie o to chodzi, by serwera doglądać cały czas, to chyba nie te czasy.
Na szczęście jest na to rozwiązanie. Nazywa się smartmontools i jest częściowo zainstalowane już na naszych dyskach (tak, to ta część odpowiadająca za zakładkę SMART), ale my dla automatycznego sprawdzania potrzebujemy wersji pełnej, posiadającej demona smartd. Umożliwia on w pełni automatyczny monitoring i powiadamianie o jakichkolwiek odchyleniach w parametrach dysku.
No to zaczynamy:

1. Instalujemy pakiet smartmontools
Kod: Zaznacz cały
ipkg install smartmontools

2. Edytujemy plik /opt/etc/smartd.conf, a w nim komentujemy jedną linijkę:
Kod: Zaznacz cały
#DEVICESCAN

a dodajemy wpis:
Kod: Zaznacz cały
/dev/sda -a -I 194 -W 2,36,42 -R 5! -R 200! -n standby,3 -o on -S on -s (S/../.././04|L/../(08|18|28)/./06) -m <nomailer> -M daily -M test -M exec /root/smart.sh

co oznacza, iż:
- monitorujemy pierwszy dysk (/dev/sda)
- monitorujemy standardowe atrybuty (opcja -a)
- ignorujemy zmiany temperatury (-I 194)
- ale w przypadku zmiany temperatury o ponad 2 stopnie, przekroczenia 36 lub osiągnięcia temp, krytycznej 42 będzie wysłany mail (-W 2,36,42)
- monitorujemy każde zmiany atrybutów o ID 5 oraz 200, każda zmiana jest dla nas krytyczna (opcja -R z wykrzyknikiem)
- nie wybudzamy dysku z uśpienia (opcja -n), ale po trzech próbach jednak odpytamy dysk, wybudzając go
- włączamy automatyczne testowanie SMART (mechanizm wbudowany w dysk - opcja -o)
- włączamy opcję automatycznego zapisu atrybutów w sterowniku dysku (zachowanie zależne od producenta, opcja -S)
- ustawiamy harmonogram testów, czyli - test szybki, codziennie o godzinie 4, test rozszerzony 8, 18 i 28 każdego miesiąca o 6 rano (opcja -s)
- nie używamy standardowego programu mail do wysyłania powiadomień (-m <nomailer>)
- codziennie zostaną wysłane dodatkowe maile z przypomnieniami o problemach (-M daily)
- zostanie uruchomiony skrypt smart.sh z katalogu root-a (-M exec)
- każdy start, stop oraz reload demona wyśle maila testowego (-M test)

I tutaj chwilka na wyjaśnienie zawirowań z pocztą. Oprogramowanie NAS-a nie posiada standardowego mechanizmu wysyłania poczty (program mail), przez co musimy lekko pokombinować. Stąd wywołanie skryptu smart.sh, a jego zawartość:
Kod: Zaznacz cały
#!/bin/sh
echo "$SMARTD_FULLMESSAGE" | /opt/bin/nail -s "$SMARTD_MESSAGE" -r "your.email@server.com (DSM)" "your.email@server.com"

czyli do wysłania poczty używamy nail-a, a tutaj jest opis jego instalacji i konfiguracji.

3. Edytujemy plik /opt/etc/init.d/S20smartmontools a w nim usuwamy komentarz przy ENABLE_SMARTD=1
UWAGA!!! U mnie w katalogu /bin nie było programu killall, musialem zmienić ścieżki na /usr/bin/killall, można też zrobić linka do bin.

4. Uruchamiamy demona smartd
Kod: Zaznacz cały
/opt/etc/init.d/S20smartmontools start


5. Sprawdzamy, czy wszystko jest poprawnie skonfigurowane - czy demon się uruchomił:
Kod: Zaznacz cały
ps aux | grep smartd
oraz czy w logach pojawiły się jakieś komunikaty o błędach konfiguracji
Kod: Zaznacz cały
tail -f /var/log/messages

Najważniejszym potwierdzeniem powinno być odebranie maila testowego.

Oczywiście monitorowanie należy wprowadzić na wszystkie dyski, oraz można użyć innych opcji, wszystko jest wyczerpująco opisane w dokumentacji.

I to by było na tyle, życzę wszystkim by zostali ostrzeżeni na tyle wcześnie o padach dysku by nie stracili żadnych danych.
Z wszystkich form monotonii najgorsze jest potwierdzanie.
jdoe77
Amator
 
Posty: 38
Dołączył(a): 16 mar 2010, o 13:04
Lokalizacja: Wrocław
Medale: 3
Syn (3)
Synology: DS209+II
Firmware: DSM 3.0-1337
Dyski: 2 x 1,5TB WD EARS
Pochodzenie: Wrocław
Internet: 4 MB
Płeć: Mężczyzna
System Operacyjny: W7HP 64
Router/Switch: DIR-635


Powrót do Cichociemni

Kto przegląda forum

Użytkownicy przeglądający ten dział: Brak zidentyfikowanych użytkowników i 0 gości