OVH Community, your new community space.

Uwalona kość RAM?


desavil
01-03-2013, 13:25
Po niecałych dwóch miesiącach znów to samo, padła 1 kość 8GB z 3, tzn. nie wykrywa jej po reboocie jak dzisiaj zrobiłem.
Może być problemem tego typu zachowania płyta główna?

Dziwne bardzo, bo rzadko się zdarza uszkodzenie pamięci RAM, tym bardziej w tak krótkim okresie czasu, a używam tej pamięci niecałe 10GB średnio.

borec
16-01-2013, 05:55
W godzinach pracy polskiego oddzialu jest support po polsku, poza nimi angielski.

desavil
15-01-2013, 23:09
Cytat Napisał Arkoso
A tak btw, ta pomoc techniczna telefoniczna to w jakim jezyku? Zdarzalo mi sie dzwonic do ovh, ale jedynie do biura.
Numery mają na stronie: dział techniczny oraz handlowy zawsze po polsku.
Kiedyś dzwoniłem na nr. zgłaszania awarii i odezwał się ktoś po polsku, później tylko po angielsku mówili.

Arkoso
15-01-2013, 20:17
A tak btw, ta pomoc techniczna telefoniczna to w jakim jezyku? Zdarzalo mi sie dzwonic do ovh, ale jedynie do biura.

borec
15-01-2013, 18:52
Cytat Napisał desavil
Tak sobie myślę teraz, że ja przecież zmieniłem netboot na kernel: 3.2.13-xxxx-std-ipv6-64-hz1000
A przedtem używałem bez hz1000, jakie to ma w ogóle znaczenie i czym się różnią te kernele, kiedy takiego używać?

Być może to ma wpływ na działanie.
1000HZ na serwerze nie ma sensu, procesor marnuje zasoby na generowanie tickow. Na serwerze generalnie powinno byc 100, ewentualnie 250HZ. Jajka 1000HZ sa pod serwery gier, gdzie potrzebna jest wieksza responsywnosc.

desavil
15-01-2013, 12:20
Tak sobie myślę teraz, że ja przecież zmieniłem netboot na kernel: 3.2.13-xxxx-std-ipv6-64-hz1000
A przedtem używałem bez hz1000, jakie to ma w ogóle znaczenie i czym się różnią te kernele, kiedy takiego używać?

Być może to ma wpływ na działanie.

minimarek
15-01-2013, 09:52
Cytat Napisał borec
Jakie 1x dual i 3x dual? Dual masz wtedy, jak masz 2 sparowane kości. RTFM.
Wcześniej miał 6 kości po 4GB. Mogły więc tworzyć 3 x Dual (3 pary kości mogły pracować w dualu). Mogły mieć nawet różne taktowania (wtedy taktowanie w danej parze zostało by wyrównane do kości, która pracuje z niższym). Teraz mając 3 kości para z nich może pracować w Dual Channel, a trzecia kość samodzielnie. Nie mamy jednak pewności, że pamięć RAM pracowała wcześniej i teraz pracuje w Dual Channel. To są jedynie przypuszczenia mogące pomóc w wyjaśnieniu problemu.

borec
15-01-2013, 00:07
Cytat Napisał minimarek
Wydaje mi się, że różnica w wydajności pomiędzy 1x Dual Chanel a 3x Dual Chanel w niektórych aplikacjach może być znacząca, szczególnie w tych, w których jest duży przepływ danych.
Jakie 1x dual i 3x dual? Dual masz wtedy, jak masz 2 sparowane kości. RTFM.

desavil
14-01-2013, 22:37
Dzwoniłem do działu technicznego i powiedzieli, że nie powinno to mieć dużego znaczenia.
A jak widzę problemy to mam otworzyć ponownie zgłoszenie i wysłać im logi, tak pytanie czego logi...

minimarek
14-01-2013, 16:14
Cytat Napisał borec
Skoro jest nieparzysta liczba kości, to nie ma siły, żeby wszystkie działały w dual channel. Ale nie wydaje mi się, żeby była aż tak zauważalna różnica w wydajności.
Wydaje mi się, że różnica w wydajności pomiędzy 1x Dual Chanel a 3x Dual Chanel w niektórych aplikacjach może być znacząca, szczególnie w tych, w których jest duży przepływ danych.

borec
14-01-2013, 10:56
Cytat Napisał Arkoso
Może nie działają w dual chanel? Hmm nie znam się na pamięciach, tylko sugeruję, jeśli źle prawię, poprawcie mnie
Skoro jest nieparzysta liczba kości, to nie ma siły, żeby wszystkie działały w dual channel. Ale nie wydaje mi się, żeby była aż tak zauważalna różnica w wydajności.

Arkoso
12-01-2013, 21:50
Może nie działają w dual chanel? Hmm nie znam się na pamięciach, tylko sugeruję, jeśli źle prawię, poprawcie mnie

desavil
12-01-2013, 18:15
Zgłosiłem wymianę, miałem 6 kości po 4GB, z tego dwie padły. Technik wymienił wszystkie. Na 3x 8GB.
Jedno co mnie zastanawia, to fakt iż usługi które oferuję zaczęły po wymianie tej pamięci znacznie gorzej działać niż wcześniej. Chociaż zużywają średnio ok. 6GB pamięci.

Obecnie mam tak:
Kod:
# dmidecode 2.9
SMBIOS 2.6 present.

Handle 0x000D, DMI type 16, 15 bytes
Physical Memory Array
        Location: System Board Or Motherboard
        Use: System Memory
        Error Correction Type: Multi-bit ECC
        Maximum Capacity: 192 GB
        Error Information Handle: Not Provided
        Number Of Devices: 6

Handle 0x000F, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x000D
        Error Information Handle: Not Provided
        Total Width: 72 bits
        Data Width: 64 bits
        Size: No Module Installed
        Form Factor: DIMM
        Set: None
        Locator: DIMM1A
        Bank Locator: BANK0
        Type: Other
        Type Detail: Other
        Speed: 1333 MHz (0.8 ns)
        Manufacturer: Manufacturer00
        Serial Number: SerNum00
        Asset Tag: AssetTagNum0
        Part Number: ModulePartNumber00

Handle 0x0011, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x000D
        Error Information Handle: Not Provided
        Total Width: 72 bits
        Data Width: 64 bits
        Size: No Module Installed
        Form Factor: DIMM
        Set: None
        Locator: DIMM1B
        Bank Locator: BANK1
        Type: Other
        Type Detail: Other
        Speed: 1333 MHz (0.8 ns)
        Manufacturer: Manufacturer01
        Serial Number: SerNum01
        Asset Tag: AssetTagNum1
        Part Number: ModulePartNumber01

Handle 0x0013, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x000D
        Error Information Handle: Not Provided
        Total Width: 72 bits
        Data Width: 64 bits
        Size: 8192 MB
        Form Factor: DIMM
        Set: None
        Locator: DIMM2A
        Bank Locator: BANK2
        Type: Other
        Type Detail: Other
        Speed: 1333 MHz (0.8 ns)
        Manufacturer: Manufacturer02
        Serial Number: 00000000
        Asset Tag: AssetTagNum2
        Part Number:

Handle 0x0015, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x000D
        Error Information Handle: Not Provided
        Total Width: 72 bits
        Data Width: 64 bits
        Size: 8192 MB
        Form Factor: DIMM
        Set: None
        Locator: DIMM2B
        Bank Locator: BANK3
        Type: Other
        Type Detail: Other
        Speed: 1333 MHz (0.8 ns)
        Manufacturer: Manufacturer03
        Serial Number: 00000000
        Asset Tag: AssetTagNum3
        Part Number:

Handle 0x0017, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x000D
        Error Information Handle: Not Provided
        Total Width: 72 bits
        Data Width: 64 bits
        Size: 8192 MB
        Form Factor: DIMM
        Set: None
        Locator: DIMM3A
        Bank Locator: BANK4
        Type: Other
        Type Detail: Other
        Speed: 1333 MHz (0.8 ns)
        Manufacturer: Manufacturer04
        Serial Number: 00000000
        Asset Tag: AssetTagNum4
        Part Number:

Handle 0x0019, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x000D
        Error Information Handle: Not Provided
        Total Width: 72 bits
        Data Width: 64 bits
        Size: No Module Installed
        Form Factor: DIMM
        Set: None
        Locator: DIMM3B
        Bank Locator: BANK5
        Type: Other
        Type Detail: Other
        Speed: 1333 MHz (0.8 ns)
        Manufacturer: Manufacturer05
        Serial Number: SerNum05
        Asset Tag: AssetTagNum5
        Part Number: ModulePartNumber05

Handle 0x001B, DMI type 16, 15 bytes
Physical Memory Array
        Location: System Board Or Motherboard
        Use: Flash Memory
        Error Correction Type: None
        Maximum Capacity: 4 MB
        Error Information Handle: Not Provided
        Number Of Devices: 1

Handle 0x001D, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x001B
        Error Information Handle: Not Provided
        Total Width: 8 bits
        Data Width: 8 bits
        Size: 4096 kB
        Form Factor: Other
        Set: None
        Locator:
        Bank Locator:
        Type: Flash
        Type Detail: Non-Volatile
        Speed: 33 MHz (30.3 ns)
        Manufacturer: MXIC
        Serial Number:
        Asset Tag:
        Part Number: 25L3205

WMP
11-01-2013, 12:33
To może twój ram przeskoczył do mnie?

desavil
11-01-2013, 09:07
Cytat Napisał WMP
Miałęm to samo całkiem nie dawno, po reboocie ram się pojawił
U mnie wręcz przeciwnie, po reboocie zniknął. Dzisiaj to zdiagnozuję i zobaczymy.

WMP
10-01-2013, 23:32
Miałęm to samo całkiem nie dawno, po reboocie ram się pojawił

redhot
07-01-2013, 22:57
Miałem kiedyś podobną sytuację - wymienili kość około godziny po zgłoszeniu, nie mają co testować, jeśli w rescue nie widać to nawet w BIOS-ie będziesz miał 16GB, zrobią coś z tym od razu.

desavil
07-01-2013, 20:08
Kod:
SMBIOS 2.6 present.

Handle 0x000D, DMI type 16, 15 bytes
Physical Memory Array
        Location: System Board Or Motherboard
        Use: System Memory
        Error Correction Type: Multi-bit ECC
        Maximum Capacity: 192 GB
        Error Information Handle: Not Provided
        Number Of Devices: 6

Handle 0x000F, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x000D
        Error Information Handle: Not Provided
        Total Width: 72 bits
        Data Width: 64 bits
        Size: No Module Installed
        Form Factor: DIMM
        Set: None
        Locator: DIMM1A
        Bank Locator: BANK0
        Type: Other
        Type Detail: Other
        Speed: 1333 MHz (0.8 ns)
        Manufacturer: Manufacturer00
        Serial Number: SerNum00
        Asset Tag: AssetTagNum0
        Part Number: ModulePartNumber00

Handle 0x0011, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x000D
        Error Information Handle: Not Provided
        Total Width: 72 bits
        Data Width: 64 bits
        Size: No Module Installed
        Form Factor: DIMM
        Set: None
        Locator: DIMM1B
        Bank Locator: BANK1
        Type: Other
        Type Detail: Other
        Speed: 1333 MHz (0.8 ns)
        Manufacturer: Manufacturer01
        Serial Number: SerNum01
        Asset Tag: AssetTagNum1
        Part Number: ModulePartNumber01

Handle 0x0013, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x000D
        Error Information Handle: Not Provided
        Total Width: 72 bits
        Data Width: 64 bits
        Size: 4096 MB
        Form Factor: DIMM
        Set: None
        Locator: DIMM2A
        Bank Locator: BANK2
        Type: Other
        Type Detail: Other
        Speed: 1333 MHz (0.8 ns)
        Manufacturer: Manufacturer02
        Serial Number: 00000000
        Asset Tag: AssetTagNum2
        Part Number:

Handle 0x0015, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x000D
        Error Information Handle: Not Provided
        Total Width: 72 bits
        Data Width: 64 bits
        Size: 4096 MB
        Form Factor: DIMM
        Set: None
        Locator: DIMM2B
        Bank Locator: BANK3
        Type: Other
        Type Detail: Other
        Speed: 1333 MHz (0.8 ns)
        Manufacturer: Manufacturer03
        Serial Number: 00000000
        Asset Tag: AssetTagNum3
        Part Number:

Handle 0x0017, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x000D
        Error Information Handle: Not Provided
        Total Width: 72 bits
        Data Width: 64 bits
        Size: 4096 MB
        Form Factor: DIMM
        Set: None
        Locator: DIMM3A
        Bank Locator: BANK4
        Type: Other
        Type Detail: Other
        Speed: 1333 MHz (0.8 ns)
        Manufacturer: Manufacturer04
        Serial Number: 00000000
        Asset Tag: AssetTagNum4
        Part Number:

Handle 0x0019, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x000D
        Error Information Handle: Not Provided
        Total Width: 72 bits
        Data Width: 64 bits
        Size: 4096 MB
        Form Factor: DIMM
        Set: None
        Locator: DIMM3B
        Bank Locator: BANK5
        Type: Other
        Type Detail: Other
        Speed: 1333 MHz (0.8 ns)
        Manufacturer: Manufacturer05
        Serial Number: 00000000
        Asset Tag: AssetTagNum5
        Part Number:

Handle 0x001B, DMI type 16, 15 bytes
Physical Memory Array
        Location: System Board Or Motherboard
        Use: Flash Memory
        Error Correction Type: None
        Maximum Capacity: 4 MB
        Error Information Handle: Not Provided
        Number Of Devices: 1

Handle 0x001D, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x001B
        Error Information Handle: Not Provided
        Total Width: 8 bits
        Data Width: 8 bits
        Size: 4096 kB
        Form Factor: Other
        Set: None
        Locator:
        Bank Locator:
        Type: Flash
        Type Detail: Non-Volatile
        Speed: 33 MHz (30.3 ns)
        Manufacturer: MXIC
        Serial Number:
        Asset Tag:
        Part Number: 25L3205

victor
07-01-2013, 20:02
a co chcesz testować, tą pamięc której nie ma? Resetuj do rescue na chwilę, zobacz czy tam też nie ma i do wymiany z ew. outputem z dmidecode

Arkoso
07-01-2013, 19:54
No pamięci ram potrafią się długo testować. Najwyżej nocy nie prześpisz

desavil
07-01-2013, 19:43
Wydaje mi się, że uszkodziła się chyba kość RAM, ponieważ wykonałem restart maszyny i przedtem w htop pokazywało ~24GB, a teraz 16101MB.
Zostaje już tylko rescue i ich test? Problem w tym, że to jest jedna z głównych maszyn produkcyjnych i nie chciałbym zbyt długiej niedostępności.

Serwer EG 24G, ze starej oferty.

Kod:
             total       used       free     shared    buffers     cached
Mem:         16101      15379        721          0         37      11292
-/+ buffers/cache:       4049      12051
Swap:            0          0          0
Kod:
MemTotal:       16487892 kB
MemFree:          646992 kB
Buffers:           38244 kB
Cached:         11653376 kB
SwapCached:            0 kB
Active:          8790088 kB
Inactive:        6180672 kB
Active(anon):    3279208 kB
Inactive(anon):      276 kB
Active(file):    5510880 kB
Inactive(file):  6180396 kB
Unevictable:           0 kB
Mlocked:               0 kB
SwapTotal:             0 kB
SwapFree:              0 kB
Dirty:             21616 kB
Writeback:             0 kB
AnonPages:       3279100 kB
Mapped:            22308 kB
Shmem:               308 kB
Slab:             446916 kB
SReclaimable:     315644 kB
SUnreclaim:       131272 kB
KernelStack:       38144 kB
PageTables:       106128 kB
NFS_Unstable:          0 kB
Bounce:                0 kB
WritebackTmp:          0 kB
CommitLimit:     8243944 kB
Committed_AS:   27149236 kB
VmallocTotal:   34359738367 kB
VmallocUsed:      309524 kB
VmallocChunk:   34359422132 kB
DirectMap4k:        3584 kB
DirectMap2M:    16764928 kB