OVH Community, your new community space.

Serwer dedykowany wolne działanie?


desavil
04-06-2012, 15:42
Nie dało się, chyba z miesiąc tak jak pisałem by się to instalowało, po 12 godzinach zrezygnowałem.

Przeniosłem usługi na stary serwer i na nim wszystko działa bez problemów.

taken
04-06-2012, 08:11
Zrobiłeś downgrade kernela do 2.6.32 tego co Ci podałem?

h8g923
04-06-2012, 00:04
Na jednym ze starszych serwerów identyczne objawy były spowodowane przez płytę główną. Po zgłoszeniu została wymieniona. ( Sami zdiagnozowali )

desavil
03-06-2012, 09:44
Daj znać jak toczy się sprawa

Też od początku myślę, że może to wina płyty głównej, kabla SATA, tylko trzeba to poprzeć jakimiś logami przy ew. zgłaszaniu interwencji.

Kod:
Seeker v2.0, 2007-01-15, http://www.linuxinsight.com/how_fast_is_your_disk.html
Benchmarking /dev/sda [1907729MB], wait 30 seconds........................
Results: 27 seeks/second, 36.54 ms random access time
Kod:
/dev/sda:
 Timing cached reads:     2 MB in  4.90 seconds = 417.65 kB/sec
 Timing buffered disk reads:   2 MB in  3.70 seconds = 553.91 kB/sec
Hmm?

redhot
03-06-2012, 03:36
Właśnie mam identyczne objawy na SP BestOf 2011...

CPU:
Kod:
  Current Frequency 3059.99 MHz [99.74 x 30.68] (Max of below)
        Core [core-id]  :Actual Freq (Mult.)      C0%   Halt(C1)%  C3 %   C6 %   C7 %  Temp
        Core 1 [0]:       3034.75 (30.43x)      2.87    14.5    4.21    78.4       0    35
        Core 2 [1]:       3059.99 (30.68x)       1.7    4.81    2.82    90.7       0    35
        Core 3 [2]:       3048.00 (30.56x)      1.61    1.88       1    95.5       0    32
        Core 4 [3]:       3037.99 (30.46x)         1       0       1    98.8       0    31
SMART jest ok, temperatury dysku ok.
Na i/o spokój, usługi wszystkie powyłączane.

A tutaj...
Kod:
# ./seeker 
Seeker v2.0, 2007-01-15, http://www.linuxinsight.com/how_fast_is_your_disk.html
Usage: seeker 
# ./seeker /dev/sda
Seeker v2.0, 2007-01-15, http://www.linuxinsight.com/how_fast_is_your_disk.html
Benchmarking /dev/sda [1907729MB], wait 30 seconds............................
Results: 12 seeks/second, 82.19 ms random access time
# ./seeker /dev/sdb
Seeker v2.0, 2007-01-15, http://www.linuxinsight.com/how_fast_is_your_disk.html
Benchmarking /dev/sdb [1907729MB], wait 30 seconds............................
Results: 14 seeks/second, 66.96 ms random access time
# hdparm -tT /dev/sda

/dev/sda:
 Timing cached reads:   17032 MB in  2.00 seconds = 8523.34 MB/sec
 Timing buffered disk reads:  24 MB in  3.02 seconds =   7.95 MB/sec
# hdparm -tT /dev/sdb

/dev/sdb:
 Timing cached reads:   19194 MB in  2.00 seconds = 9605.73 MB/sec
 Timing buffered disk reads:  74 MB in  3.10 seconds =  23.85 MB/sec
Jedyne co mi przychodzi na myśl to płyta główna, kontroler SATA.
Zaraz zaplanuję interwencję hardware.

desavil
03-06-2012, 00:04
Wiecie, że to się jeszcze instaluje :O
Ponad 2 godziny...

taken
02-06-2012, 22:16
Oczywiście najpierw daj apt-get update
później:
apt-get install linux-image-2.6.32-5-amd64

pozdr

desavil
02-06-2012, 22:12
Zrobiłem uname
Spróbuję z tą zmianą kernela i dam znać.

Kod:
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa
25  0    500 124084 302232 8433880    0    0     2   254   17   21 49  2 42  8
@edit, poprawiłem vmstat, bo przez przypadek z innego serwera mi się wkleił hehe.

No to sobie poczekamy z miesiąc, aż się ten kernel zainstaluje, hehe.

taken
02-06-2012, 22:10
No to standardem dla Debiana 6 jest:
root@WIZJA2:~# uname -a
Linux WIZJA2 2.6.32-5-amd64 #1 SMP Sun May 6 04:00:17 UTC 2012 x86_64 GNU/Linux
root@WIZJA2:~# cat /etc/debian_version
6.0.5


Moja rada to dać:
apt-get install linux-image-2.6.32-5-amd64
później reboot - i powinno być OK :-))

Pozdr

dzimi
02-06-2012, 22:06
Cytat Napisał desavil
Kod:
Tasks: 502 total,   1 running, 501 sleeping,   0 stopped,   0 zombie
Cpu(s): 64.7%us, 13.2%sy,  0.0%ni,  7.3%id, 13.9%wa,  0.0%hi,  1.0%si,  0.0%st
Mem:  24744184k total, 24615732k used,   128452k free,   294692k buffers
Swap:   523260k total,       84k used,   523176k free,  8815800k cached
masz wysokie iowaity. Zobacz iostat, vmstat (może ci coś po swapie jeździ), iotop, itp

Na chwilę obecną masz zajechany cpu i zapewne podsystem dyskowy (patrz %wa)

desavil
02-06-2012, 22:05
Debian 6.0, standardowo

Na starym dedyku, gdzie działało jest:
Linux ksXXX.kimsufi.com 3.2.13-xxxx-std-ipv6-64 #1 SMP Wed Mar 28 11:20:17 UTC 2012 x86_64 GNU/Linux

taken
02-06-2012, 22:04
Co to za Linux?
Na pewno miałeś tam też kernela 3.X ? a nie 2.6.32 ?
Pozdr

desavil
02-06-2012, 22:02
Kernel:
Linux ksXXX.kimsufi.com 3.2.13-grsec-xxxx-grs-ipv6-64 #1 SMP Thu Mar 29 09:48

Kod:
rootfs / rootfs rw 0 0
/dev/root / ext4 rw,relatime,errors=remount-ro,user_xattr,acl,barrier=1,data=ordered 0 0
tmpfs /lib/init/rw tmpfs rw,nosuid,relatime,mode=755 0 0
proc /proc proc rw,nosuid,nodev,noexec,relatime 0 0
sysfs /sys sysfs rw,nosuid,nodev,noexec,relatime 0 0
tmpfs /dev tmpfs rw,relatime,size=10240k,mode=755 0 0
tmpfs /dev/shm tmpfs rw,nosuid,nodev,relatime 0 0
devpts /dev/pts devpts rw,nosuid,noexec,relatime,gid=5,mode=620 0 0
/dev/sda2 /home ext4 rw,relatime,user_xattr,acl,barrier=1,data=ordered 0 0

taken
02-06-2012, 22:00
A może dałeś kernela 3.X ?
Bo mam takie szopki na jednym z serwerów z kernelem 3.X i musiałem robić downgrade do 2.6.32 - później doczytałem, że wina FS.

Daj cat /proc/mounts

desavil
02-06-2012, 21:57
Zmieniłem DNSy i dalej nic się nie zmieniło.
Kod:
nslookup www.wp.pl
Server:         8.8.8.8
Address:        8.8.8.8#53

Non-authoritative answer:
Name:   www.wp.pl
Address: 212.77.100.101

taken
02-06-2012, 21:54
Daj host www.wp.pl albo nslookup www.wp.pl czy czasem nie masz timeout z 127.0.0.1 :-)

desavil
02-06-2012, 21:52
Datacenter: RBX-2

DNS domyślne OVH, nigdy nie zmieniam:
nameserver 127.0.0.1
nameserver 213.186.33.99

Zaraz zmienię na googlowskie i zobaczymy.

taken
02-06-2012, 21:50
Kiedyś miałem podobny efekt okazało się, że to wina dns ;-)
Nawet głupie łączenie z SSH trwało bardzo długo.....

Arkoso
02-06-2012, 21:49
w którym DC serwer?

desavil
02-06-2012, 21:46
Już nie mam, bo przeniosłem wszystkie usługi na ten.
Tak jak pisałem w pierwszym poście, na poprzednim serwerze usługi działały płynnie bez problemów (chociaż również obciążenie było tak duże) żadnych problemów tego typu co tutaj. Przed wczoraj przeniosłem na nowy serwer i nie da się na nim w ogóle pracować, w usługach występują tzw. lagi, czego poprzednio nie było, a ten serwer jest o wiele mocniejszy od poprzedniego.

Tak jak mówię, po reinstalacji na czystym serwerze jest dokładnie to samo w SSH z tymi opóźnieniami. Mam przeczucie, że to jakaś usterka sprzętowa, tylko pytanie jaka.

taken
02-06-2012, 21:43
Też masz w 93% zapchany serwer tam?
Pokaż ?

desavil
02-06-2012, 21:40
W takim razie zapytam:
Dlaczego na słabszym serwerze, tak samo zapchanym z jeszcze wyższym użyciem procesora, wyższymi temperaturami takich problemów w ogóle nie było nigdy?

Tak samo tutaj na czystym serwerze dzieje się dokładnie to samo.

taken
02-06-2012, 21:37
Nie wiem czy widzisz, ale masz w 93% zapchany serwer to czego TY oczekujesz?
Nie wiem co ale coś Ci obciąża serwer jak widzisz masz:
Cpu(s): 64.7%us, 13.2%sy, 0.0%ni, 7.3%id, 13.9%wa, 0.0%hi, 1.0%si, 0.0%st
Czyli w skrócie masz 7.3% idle.. czyli 92,7% zasobów masz zjedzone przez coś.

Pozdr

desavil
02-06-2012, 20:46
Kod:
Tasks: 502 total,   1 running, 501 sleeping,   0 stopped,   0 zombie
Cpu(s): 64.7%us, 13.2%sy,  0.0%ni,  7.3%id, 13.9%wa,  0.0%hi,  1.0%si,  0.0%st
Mem:  24744184k total, 24615732k used,   128452k free,   294692k buffers
Swap:   523260k total,       84k used,   523176k free,  8815800k cached
Jeszcze podam wynik smart dla pewności, ale wydaje mi się że jest sprawny:
Kod:
=== START OF INFORMATION SECTION ===
Device Model:     ST2000DM001-9YN164
Serial Number:    S240247H
Firmware Version: CC4C
User Capacity:    2,000,398,934,016 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Sat Jun  2 21:43:49 2012 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                 ( 592) seconds.
Offline data collection
capabilities:                    (0x73) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        No Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        ( 255) minutes.
Conveyance self-test routine
recommended polling time:        (   2) minutes.
SCT capabilities:              (0x3085) SCT Status supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   118   099   006    Pre-fail  Always       -       185141360
  3 Spin_Up_Time            0x0003   092   092   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       25
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   055   055   030    Pre-fail  Always       -       859072645767
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always       -       2951
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       24
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   051   048   045    Old_age   Always       -       49 (Lifetime Min/Max 41/52)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       23
193 Load_Cycle_Count        0x0032   084   084   000    Old_age   Always       -       32538
194 Temperature_Celsius     0x0022   049   052   000    Old_age   Always       -       49 (0 16 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       27406186318539
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       10358638932233
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       4352081012253

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      1702         -
# 2  Short offline       Completed without error       00%      1691         -
# 3  Short offline       Completed without error       00%      1691         -
# 4  Short offline       Completed without error       00%      1690         -
# 5  Short offline       Completed without error       00%        13         -
# 6  Short offline       Completed without error       00%         2         -
# 7  Short offline       Completed without error       00%         2         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Wynik iowait podam za chwilę jak się skończy to upgrade robić.

dzimi
02-06-2012, 20:31
Jaka utylizacja cpu ? jaka utylizacja IO ? jakie iowait ? Nic konkretnego nie napisałeś.

desavil
02-06-2012, 20:29
Nie no, to już jest przegięcie.
Upgrade robi się już ponad 15min, z czymś takim jeszcze się nie spotkałem.

desavil
02-06-2012, 18:32
Właśnie niskie 60-70, a na tamtym serwerze gdzie działało wcześniej to ponad 99 stopni... procesora.

Aby wyeliminować problem z moim łączem, połączyłem się z innego serwera dedykowanego w OVH z SSH tego dedyka i to samo, wolno pokazuje informacje smart, jak robię update/upgrade również informacje powoli się pokazują. Może tutaj jest jakiś problem ze sprzętem, tylko co hmm, albo samą siecią - tylko pytanie jak to udowodnić, sprawdzić aby było wiarygodniej i ew. zgłaszać awarię. Przecież nie napiszę - ssh mi muli, i rachunek na 80zł mi wystawią.

PS. apt-get upgrade już mi się robi kilka minut...

Arkoso
02-06-2012, 18:16
Sprawdz temperatury

desavil
02-06-2012, 15:34
Witajcie!

Na jednym z moich serwerów dedykowanych zauważyłem dziwny problem. Po przeniesieniu swoich usług z innego serwera na trochę lepszy występują w działaniu usług tzw. lagi, chociaż zużycie procesora/pamięci jest znacznie mniejsze. Dodatkowo dziwne jest dla mnie to, że łącząc się przez np. ssh i wydając komendę, np. apt-get install pakiet lub smartctl -a /dev/sda informacje są wypisywane wolno z konsoli, np. w smart to część się pojawia po kilku sekundach dalsza i znów kilka sekund i dalsza. Przy czym na innych serwerach takich problemów niema - informacje pojawiają się od razu po wydaniu komendy. Jeżeli chodzi o ping, większych strat/zmian niż z innymi serwerami nie widzę - jest podobny. Dysk również jest sprawny (nawet szybszy od poprzedniego serwera).

Macie jakieś pomysły w czym może być problem, podać jakieś logi ewentualnie?
Pozdrawiam!