4GPU Server
8GPU Server
HGX Server
2GPU Workstation
4GPU Workstation
Compact AI
10GPU Server
Cloud
Open Source
NVIDIA
HCI
Backup
MLOps
HW/SW 유지보수
AS
메모리 장애점검 방법은 여러 가지가 있습니다 오늘은 그중 하나인 PCMemtest를 안내해 드립니다. 현재 사용하고 있는 서버의 메모리를 전문 엔지니어가 아니더라도 PCMemtest를 사용해 매우 간단하게 점검할 수 있습니다. PCMemtest는 시스템의 메모리 안정성을 검사하고 문제를 발견하는데 사용되는 강력한 도구입니다. PCMemtest는 주로 서버 및 PC 하드웨어를 테스트하고 디버그 하는데 사용되며, 메모리 모듈의 결함이나 오류를 식별하여 시스템의 안정성을 향상시키는데 도움을 줍니다.
설명하기 앞서 먼저 메모리가 불량일 때 증상들을 알려드리겠습니다.
위 증상들이 100% 메모리 문제라고는 말하지 못하지만 메모리가 불량일 경우에 위 증상이 나타납니다.
제가 사용하는 서버의 OS , 메모리의 스펙은 아래와 같습니다.
먼저 Ubuntu에서 필요한 패키지를 다운로드합니다.
[boot 방식이 legacy 타입일 경우]
[본인이 사용하고 있는 시스템의 부팅방식을 모를 경우 바이오스에서 부팅방식을 확인하는 방법과 /sys/firmware/efi라는 디렉토리가 존재한다면 UEFI 방식이고 존재하지 않는다면 legacy 방식입니다]
이전글
