We are in the process of migrating this forum. A new space will be available soon. We are sorry for the inconvenience.

Awaria dysku?


del_jachim
12-11-2009, 06:36
dzieki za odpowiedzi, przy tej drugiej komendzie coś sie wywala...

Kod:
mdadm --add /dev/md1 /dev/sda1
mdadm: cannot find valid superblock in this array - HELP
próbowałem coś w googlach znaleźć na ten temat, ale nie bardzo rozumiem z czym ten problem jest związany, tutaj coś jest na temat tego błędu:
http://www.spinics.net/linux/lists/raid/msg11576.html

wiecie może co może być przyczyną?

Kod:
mdadm --detail /dev/md1/dev/md1:
        Version : 00.90
  Creation Time : Thu Jan 29 10:25:31 2009
     Raid Level : raid1
     Array Size : 10482304 (10.00 GiB 10.73 GB)
  Used Dev Size : 10482304 (10.00 GiB 10.73 GB)
   Raid Devices : 2
  Total Devices : 1
Preferred Minor : 1
    Persistence : Superblock is persistent

    Update Time : Thu Nov 12 06:07:51 2009
          State : clean, degraded
 Active Devices : 1
Working Devices : 1
 Failed Devices : 0
  Spare Devices : 0

    Number   Major   Minor   RaidDevice State
       0       0        0        0      removed
       1       8       17        1      active sync   /dev/sdb1

del_jachim
11-11-2009, 23:00
zaczęło się od tego że nie działały mi żadne usługi na serwerze. zalogowałem się przez ssh jako root ale nie mogłem nic zrobić - nawet utworzyc katalogu bo wyskakiwał komunikat że partycja jest zamontowana w trybie tylko do odczytu...
Zresetowałem więc serwer i od tego momentu jest z nim problem i uruchamia się tylko w trybie Rescue...Zgłosiłem problem OVH to odpowiedzieli że usterka została naprawiona, dali komentarz "Replacement of a disk in the RAID" i uruchomili mi serwer w trybie Resuce.

cokolwiek nie zrobili to nie wiem jak sobie teraz poradzić i przywrócić serwer do normalnego działania... podaje wynik zapytania smartctl -a /dev/sda

Kod:
root@rescue:/mnt# smartctl -a /dev/sda
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Model Family:     Hitachi Deskstar 7K1000
Device Model:     Hitachi HDS721075KLA330
Serial Number:    GTF202P8GK8T4F
Firmware Version: GK8OAB0A
User Capacity:    750,156,374,016 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 1
Local Time is:    Wed Nov 11 22:51:39 2009 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x80)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		 (11471) seconds.
Offline data collection
capabilities: 			 (0x5b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 191) minutes.
SCT capabilities: 	       (0x003f)	SCT Status supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   054    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   133   133   024    Pre-fail  Always       -       519 (Average 378)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       12
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   020    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       -       2
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       12
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       12
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       12
194 Temperature_Celsius     0x0002   136   136   000    Old_age   Always       -       44 (Lifetime Min/Max 14/45)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

del_jachim
11-11-2009, 22:19
witam,
mam duży problem z moim serwerem dedykowanym na ovh (Release2)... wczoraj w nocy coś sie posypało i serwer wogóle nie odpowiada na ping. Można uruchomić go tylko w trybie Rescue, ale niestety nie wiem jak zdiagnozować problem...
Uruchomiłem testy hardware przez interfejs webowy jaki udostępnia ovh. Problem jest chyba z dyskiem bo testy partycji dają wynik: "Errors have been detected". w załączniku przesyłam zrzut ekranu.

nie mam zielonego pojęcia w jaki sposób znaleźć problem i naprawić więc bardzo liczę na Waszą pomoc... od czego wogóle zacząć? zalogowałem się przez ssh do trybu rescue i próbowałem coś zrobić wg instrukcji: http://pomoc.ovh.pl/TrybRescue

wklejam wyniki kilku komend:

Kod:
root@rescue:/# fdisk -l

Disk /dev/sda: 750.1 GB, 750156374016 bytes
255 heads, 63 sectors/track, 91201 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x00000000

Disk /dev/sda doesn't contain a valid partition table

Disk /dev/sdb: 750.1 GB, 750156374016 bytes
255 heads, 63 sectors/track, 91201 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x000717b4

   Device Boot      Start         End      Blocks   Id  System
/dev/sdb1   *           1        1305    10482381   fd  Linux raid autodetect
/dev/sdb2            1306       91136   721567507+  fd  Linux raid autodetect
/dev/sdb3           91137       91201      522112+  82  Linux swap / Solaris
Kod:
root@rescue:/# mount /dev/sdb2 /mnt/
mount: /dev/sdb2 already mounted or /mnt/ busy
Kod:
root@rescue:/# cat /mnt/etc/fstab
cat: /mnt/etc/fstab: No such file or directory
Kod:
cat /etc/fstab 
# /etc/fstab: Information sur les systèmes de fichiers.
#
#     
#10.48.100.122:/home/pub/rescue.test/debian        /       nfs     rw,exec,auto,nodev,nouser,async,nosuid,nfsvers=2,udp,rsize=8192,wsize=8192,hard,intr,acregmin=6,acregmax=120,acdirmin=60,acdirmax=120,timeo=10 0 0
proc    /proc   proc    defaults       	0       0
Kod:
root@rescue:/# mount
rootfs on / type rootfs (rw)
none on / type tmpfs (rw,relatime)
none on /sys type sysfs (rw,relatime)
94.23.30.232:/home/pub/rescue.v5 on /nfs type nfs (ro,relatime,vers=3,rsize=8192,wsize=8192,namlen=255,hard,nolock,proto=udp,timeo=11,retrans=3,sec=sys,addr=94.23.30.232)
94.23.30.232:/home/pub/pro-power on /power type nfs (ro,nodev,relatime,vers=3,rsize=8192,wsize=8192,namlen=255,hard,nolock,proto=udp,timeo=11,retrans=3,sec=sys,addr=94.23.30.232)
tmpfs on /lib/init/rw type tmpfs (rw,nosuid,relatime,mode=755)
proc on /proc type proc (rw,nosuid,nodev,noexec,relatime)
tmpfs on /dev type tmpfs (rw,relatime,size=10240k,mode=755)
tmpfs on /dev/shm type tmpfs (rw,nosuid,nodev,relatime)
devpts on /dev/pts type devpts (rw,nosuid,noexec,relatime,gid=5,mode=620)
będę wdzięczny za wszelkie wskazówki!