We are in the process of migrating this forum. A new space will be available soon. We are sorry for the inconvenience.

Serwery RPS 197


oles@ovh.net
08-05-2008, 22:30
Witam,

Mamy poważny problem z serwerami RPS zainstalowanymi na 197. Problem dotyczy 167 serwerów.
Najstarszy został zainstalowany 18 dni temu, najnowyszy 10 dni temu.

Szczegóły znajdują się na tej stronie:
http://prace.ovh.pl/?do=details&id=10217

Wykonaliśmy interwencję na SAN, który zarzadza serwerami RPS 196 i 197.
W godzinach popołudniowych wystąpił problem z SAN. Wymieniliśmy shelf
i uruchomiliśmy ponownie SAN. Z systemem plików 196 nie było problemu.
Problem pozozstał na 197. Mimo RAID-1 na 3 dyskach, kilka dysków uległo
uszkodzeniu i nie mogliśmy ich uruchomić.

root@filerz3:~# zpool status -x
pool: filer197
state: FAULTED
status: The pool metadata is corrupted and the pool cannot be opened.
action: Destroy and re-create the pool from a backup source.
see: http://www.sun.com/msg/ZFS-8000-CS
scrub: none requested
config:

NAME STATE READ WRITE CKSUM
filer197 FAULTED 0 0 4 corrupted data
mirror ONLINE 0 0 0
c1t20d0 ONLINE 0 0 0
c1t21d0 ONLINE 0 0 0
c1t22d0 ONLINE 0 0 0
mirror ONLINE 0 0 2
c1t23d0 ONLINE 0 0 4
c1t24d0 ONLINE 0 0 4
c1t25d0 ONLINE 0 0 4
mirror ONLINE 0 0 2
c1t26d0 ONLINE 0 0 4
c1t27d0 ONLINE 0 0 4
c1t28d0 ONLINE 0 0 4
mirror ONLINE 0 0 0
c1t29d0 ONLINE 0 0 0
c1t30d0 ONLINE 0 0 0
c1t31d0 ONLINE 0 0 0

checksum na drugim i trzecim RAID-1 nie był dobry,
ale przede wszystkim nie był dobry na 3 dyskach 2 RAID-1!

Pracujemy nad backupem wykonanym w niedzielę. Odzyskanie backupu
i utworzenie systemu plików może zająć nawet
kilkadziesiąt godzin (aktualnie backup ma postać pliku. Będziemy odzyskiwać
dane za pomocą komend ZFS zreceive/zsend).



Pozdrawiam,
Octave