IBM(레노버) 서버 RAID 구성 잘못 할 시 발생한 장애. 기타등등

2017년 12월

우리 고객 중 한 곳이 RAID 문제가 발생하더니 결국 그 날 RAID 컨트롤러가 깨지면서

데이터가 다 날라감.

다행히 이미지 복구(시만텍)가 있어 해당 백업으로 1박 2일 동안 다시 살림.(엔지니어 동행)

문제는 2주 후 동일 문제 발생.

이번에는 다행히 대비를 어느정도 하고 깨져버려서(하.. 하... 하...ㅜ.ㅜ) 로그 분석 결과

최초 구축 시 Strip Size 크기를 8K로 구성하여 발생함.

현재 64K로 수정 후 문제 없음.(물론 다시 재설정 및 이미지 복구.. 나의 황금 같은 주말 사라짐)

구축 시 확인해야 하는 중요한 사항이 되어 버림.

해당 8K로 구성 시 1년정도 문제가 크게 없었으나 RAID MANAGEMENT STUDIO에서 오류 메세지 계속 송출,

그 당시 엔지니어 왈 : 윈도우 오류일 수 있다..

그 말 믿고 놔뒀다가 다 날라감.

엔지니어도 잘 알아보고 확인해야한다는 것도 깨달음.