[Ru_ngi] MCE Hardware Error

Viktor Kotliar Viktor.Kotliar at ihep.ru
Tue Jan 24 10:10:33 MSK 2023


Людмила, добрый день!

Похожие ошибки вроде встречались, но чаще как WARNING.  Я бы посмотрел 
лог через IPMI, также посмотрел какая коррекция ошибок включена в BIOS 
(я включаю все)
Ну и Bank5 поменять с другим модулем проверить, переедет ли ошибка. Наши 
инженеры на такие ошибки контакты памяти спиртиком протирают ещё и пыль 
уберают. За много лет накапливается что-то.

Может просто в centos6 не установлены программы работы с mce. Может 
можно посмотреть тут, есть ли ошибки по памяти

cat /sys/devices/system/edac/mc/mc*/ce_count

Удачи!
Виктор


24.01.2023 10:00, Liudmila Stepanova пишет:
> Добрый день,
> не могу установить ни CENTOS 7, ни  AlmaLinux-8 на дисковый сервер. 
> CENTOS 6 работает на нем без проблемм. Проверяла с CENTOS 6 утилитой 
> hw-probe -all -upload
> Логи hw-probe на сайте https://linux-hardware.org/?probe=23fe7b0642
> Тесты памяти проходят все без ошибок.
> При установки CENTOS 7
> mce Hardware Error TSC 0 ADDR .... CPU 0 Machine check 0 Bank5
> .............
> SoCKET APIC 0 microcode 0
> С уважением,
>      Людмила.


More information about the Ru_ngi mailing list