서버도 장비다 보니까 사용중에 에러가 생깁니다. 그중에 하나가 주로 이벤트 로그를 많이 살려 봅니다. 그 가운데에 다음과 같은 이벤트 오류가 떴다고 하면 펌웨어 업데이 조치를 취해야 합니다.



중간에 <경고>와 <오류> 메세지가 상당히 많이 기록됨을 알수 있습니다. 조금 더 자세히 살펴 보면 다음과 같은 이벤트 로그를 보여 주고 있습니다.



하드디스크 콘트롤러에 오류가 있다는 메세지를 보여줍니다. 그러면 관리자는 물리적인 서버에 문제가 있다고 판단을 하게 됩니다. 이러한 이벤트 오류가 발생을 하였을때 운영체제 문제인지, 아니면 하드웨어적인 서버 문제인지를 빨리 판단하는 것이 중요한데 위 메세지로는 우선 하드웨어에 문제가 있다고 보시면 되겠습니다.


특히 다음과 같이 이벤트 ID가 129로 나타날경우에는 콘트롤러 쪽에 무슨 문제가 있는 것처럼 보이는데 이럴때는 하드웨어적인 부분에서 펌웨어가 불안정하여 하드디스크가 인식을 했다 안했다 하는 에러 상황을 이벤트 로그로 보여 주고 있는 것입니다.

특히  이러한 부분들은 HP DL380(G5)와 윈도우2003 R2 버전에서 다음 서버에서도 일어나는 현상들이기도 합니다.

http://forums13.itrc.hp.com/service/forums/questionanswer.do?admit=109447627+1278462161749+28353475&threadId=1378213 

관련 내용에 대한 댓글들이 있는데 다른 분들도 비슷한 모양입니다. 우선 펌웨어 업데이트를 통하여 문제점이 개선 되는지는 조금 두고 봐야겠습니다.   참고 하시기 바랍니다.

그런데 조금 더 확인해 본 바로는 다음과 같은 상황에서는 디비쪽에 백업 받는시간에 일정하게 에러가 뿌려 진다는 것으로 봐서 해당 디비(오라클)와 백업간에 어떠한 충돌 문제인듯 합니다. 이번에는 백업을 하지 않고 동일 시간대에 체크를 해 보기로 하였으니, 추후 확인 해 보고 그결과를 알려 드리도록 하겠습니다. @엔시스.






댓글을 달아 주세요

  1. 호로상큼 2010.10.21 16:28  댓글주소  수정/삭제  댓글쓰기

    안녕하세요. 엔시스님. 까페랑 여기랑 눈팅만 하다가...

    서버에 문제가 발생해서 검색하다 들어와보니, 또 여기더군요; ㅎㅎ

    각설하고, 저희 서버 동일기종(DL380 G5)에도 이벤트ID : 11 번으로 같은 오류메시지가

    나오더군요...지금 해당 서버가 유휴서버라 백업용으로만 쓰고 있습니다.

    다른 2개의 서버에서 해당 서버로 백업이 되는거죠..

    엔시스님의 포스팅을 보고 연결을 다 해제하고 지켜보고 있기는 한데,

    당장 몇일 후에 이중화 작업때문에 써야 하는 상황이라...

    엔시스님은 추후에 어떻게 되셨는지 궁금합니다.

  2. 어응 2012.01.03 08:48  댓글주소  수정/삭제  댓글쓰기

    안녕하세요 엔시스님

    서버 이벤트 로그 찾다가 들어왔는데 비슷한 증상이네요

    이벤트 id 129 오류 메세지가 떳는데 현재는 HBA를 바꿔본 상태거든요

    그래도 이벤트 id 129 오류 메세지가 계속 뜨는걸로 봐서 HBA 문제 쪽이 아닌거 같은데

    혹시 펌웨어 업데이트 이후 해당 오류 메세지가 없어졌는지 궁금해서 글 올립니다.

    감사합니다.