최근 서버가 고사양으로 올라 가다보니 각종 CPU, 메모리에 열이 많이 발생을 한다. 또한 서버는 랙을 효율적으로 사용하려다 보니 사이즈가 작은 1U 사이즈를 많이 사용하다보니 이젠 서버 내부에 통풍을 잘 하여 어떻게 하면 서버에 열을 적게 발생 시킬 것인지에 대한 것이 관건이다.
얼마전 고객사 서버에 이상 현상이 발생이 되었다. 리눅스 시스템을 사용하고 있는데 자꾸 시스템이 HALT 된다는 것이다. 그때마다 서버를 리부팅 하기엔 비효율적이기 때문에 원인을 찾기에 몰두 하였다.
오랜시간을 두고 체크를 하던중 그쪽 시스템 담당자 (세르게이-러시아인)에게서 한통의 메일이 날라 왔다. 다행히 러시아어가 아닌 영어로 작성이 되어 그나마 알아 볼수 있었다. 물론 IT용어만 알고 있으면 어느정도 이해하는 부분이긴 하지만 말이다.
그중에 하나가 바로 다음과 같은 상황이다.
sensors
i5k_amb-isa-0000
Adapter: ISA adapter
Ch. 0 DIMM 0: +94.0,#!FC (low = +97.0,#!FC, high = +124.0,#!FC)
Ch. 0 DIMM 1:+105.5,#!FC (low = +97.0,#!FC, high = +124.0,#!FC)
Ch. 0 DIMM 2:+104.5,#!FC (low = +110.5,#!FC, high = +124.0,#!FC)
Ch. 0 DIMM 3: +96.5,#!FC (low = +110.5,#!FC, high = +124.0,#!FC)
Ch. 1 DIMM 0:+106.0,#!FC (low = +97.0,#!FC, high = +124.0,#!FC)
Ch. 1 DIMM 1:+102.5,#!FC (low = +97.0,#!FC, high = +124.0,#!FC)
Ch. 1 DIMM 2: +98.5,#!FC (low = +110.5,#!FC, high = +124.0,#!FC)
Ch. 1 DIMM 3: +81.5,#!FC (low = +110.0,#!FC, high = +124.0,#!FC)
Could you check our server RAM for errors please?
i5k_amb-isa-0000
Adapter: ISA adapter
Ch. 0 DIMM 0: +94.0,#!FC (low = +97.0,#!FC, high = +124.0,#!FC)
Ch. 0 DIMM 1:+105.5,#!FC (low = +97.0,#!FC, high = +124.0,#!FC)
Ch. 0 DIMM 2:+104.5,#!FC (low = +110.5,#!FC, high = +124.0,#!FC)
Ch. 0 DIMM 3: +96.5,#!FC (low = +110.5,#!FC, high = +124.0,#!FC)
Ch. 1 DIMM 0:+106.0,#!FC (low = +97.0,#!FC, high = +124.0,#!FC)
Ch. 1 DIMM 1:+102.5,#!FC (low = +97.0,#!FC, high = +124.0,#!FC)
Ch. 1 DIMM 2: +98.5,#!FC (low = +110.5,#!FC, high = +124.0,#!FC)
Ch. 1 DIMM 3: +81.5,#!FC (low = +110.0,#!FC, high = +124.0,#!FC)
Could you check our server RAM for errors please?
자세히 보면 알겠지만 화씨로 나타내는 온도이긴 하지만 상당히 놓게 나오는 것을 알수 있다. 메모리도 교체해 보았고 이런 저런 고민으로 있을때, 다음과 같이 조치를 취했더니..
서버를 내려서 확인해 본 결과 에어덕이 설치가 되어 있지 않았다. 에어덕이라 함은 서버에 쿨링팬에서 바람을 일으켜 서버 내부로 가져 올때 <오른쪽 그림 >에서 보듯이 검은색으로 바람에 통로를 잡아 주는 역할을 하는 것이다. 즉, 쿨링팬에서 바람이 나와서 <왼쪽 그림의 경우> 서버 내부 전체로 퍼지는 반면에 <오른쪽 그림>은 가이드를 덮어 줌으로 인해 집중적으로 메모리 있는 부분에 바람이 송풍이 되어 열을 식혀 주는 것이다.
그렇게 조치를 취하고 났더니 세르게이한테서 다음과 같은 연락이 왔다.
i5k_amb-isa-0000
Adapter: ISA adapter
Ch. 0 DIMM 0: +63.5,#!FC (low = +92.0,#!FC, high = +124.0,#!FC)
Ch. 0 DIMM 1: +66.5,#!FC (low = +100.5,#!FC, high = +124.0,#!FC)
Ch. 0 DIMM 2: +65.5,#!FC (low = +100.0,#!FC, high = +124.0,#!FC)
Ch. 0 DIMM 3: +59.5,#!FC (low = +98.5,#!FC, high = +124.0,#!FC)
Ch. 1 DIMM 0: +69.5,#!FC (low = +100.5,#!FC, high = +124.0,#!FC)
Ch. 1 DIMM 1: +70.0,#!FC (low = +100.5,#!FC, high = +124.0,#!FC)
Ch. 1 DIMM 2: +72.5,#!FC (low = +100.0,#!FC, high = +124.0,#!FC)
Ch. 1 DIMM 3: +66.0,#!FC (low = +99.5,#!FC, high = +124.0,#!FC)
Adapter: ISA adapter
Ch. 0 DIMM 0: +63.5,#!FC (low = +92.0,#!FC, high = +124.0,#!FC)
Ch. 0 DIMM 1: +66.5,#!FC (low = +100.5,#!FC, high = +124.0,#!FC)
Ch. 0 DIMM 2: +65.5,#!FC (low = +100.0,#!FC, high = +124.0,#!FC)
Ch. 0 DIMM 3: +59.5,#!FC (low = +98.5,#!FC, high = +124.0,#!FC)
Ch. 1 DIMM 0: +69.5,#!FC (low = +100.5,#!FC, high = +124.0,#!FC)
Ch. 1 DIMM 1: +70.0,#!FC (low = +100.5,#!FC, high = +124.0,#!FC)
Ch. 1 DIMM 2: +72.5,#!FC (low = +100.0,#!FC, high = +124.0,#!FC)
Ch. 1 DIMM 3: +66.0,#!FC (low = +99.5,#!FC, high = +124.0,#!FC)
위 에어덕을 설치 하지 않을때와 비교해 보면 확실히 온도가 낮아 졌다는 것을 알수 있다. 지금 상황으로 볼땐 딱 절반정도 그러니까 50% 정도 메모리에 발생하던 열을 낮추어 주는 효과가 있었다.
최근에 출시되는 서버들은 이러한 에어덕이 전부 장착이 되어 나오지만 위 서버는 약 2년전에 나온 모델이라서 에어덕이 설치가 되지 않았던 것이다.
혹시 리눅스 시스템이나 또는 윈도우 시스템에서 자주 다운이 되거나 시스템 HALT 되는 현상이 일어날때에는 서버를 한번 살펴 보길 바란다. 이번에도 다시한번 느낀 것이지만 세르게이와 메일로 주고 받으면서 짧은 영어로 소통하면서 받은 것을 느끼게 되었다. 이젠 먹고 살려면 영어를 해야 하는구나...하는 생각이 들었다.
'Server' 카테고리의 다른 글
스카시 하드디스크 에러와 백업관계 (3) | 2010.07.30 |
---|---|
HP DL380(G5) 이벤트 로그에서 이벤트 ID 11, 129번 증상 (4) | 2010.07.08 |
IBM X3850 서버에 메모리와 하드디스크 추가하기 (0) | 2010.04.22 |
이슬림 코리아 2188 서버 소개서 (0) | 2009.10.23 |
HP서버 미러링(RAID) 장애 보고서 (19) | 2009.10.21 |