⫸VMware

DRS/DPM 기능 원리

OSMU-PIPELINE 2022. 10. 19. 04:04
반응형

DRS (Distributed Resource Scheduler) 클러스터란

DRS
<DRS>

VMware vSphere에서 클러스터를 구성한다고 할 경우에는 보통 두 가지 기능을 묶어서 말하는데 바로 HA 클러스터와 DRS 클러스터 기능이다. 우리가 보통 운영체제에서 클러스터 서비스를 이용한다라고 표현하는 것은 대부분 HA 클러스터 기능, 즉 물리적인 서버에서 하드웨어적인 장애가 발생하였을 경우 서비스를 Failover 하는 기능을 의미한다. 

vSphere에서도 마찬가지로 HA 클러스터 기능을 가지고 있다. ESXi 서버의 물리적인 장애가 발생할 경우 장애가 발생한 ESXi 서버에서 작동 중이던 가상 머신을 HA 클러스터 내의 다른 ESXi 서버에게 Failover 시켜 주는 기능이다. 반면에 DRS클러스터 기능은 장애를 대비한 기능이라기보다는 전체 클러스터 내의 ESXi 서버들이 적절하게 리소스가 분산되어 그 밸런스를 유지하고 있는지에 대해서 초점을 맞추는 기능이다.

DRS 클러스터가 구축되면, vCenter 서버는 DRS 클러스터 내의 모든 ESXi 서버들의 현재 리소스 사용량을 모니터링하게 된다. 이때 만일 특정 ESXi 서버가 다른 ESXi 서버에 비해 리소스 사용량이 급증하거나 과도한 워크로드로 인해 상당한 부하를 안고 있을 경우, vCenter 서버는 해당 ESXi 서버에서 작동되고 있는 가상 머신들을 VMotion 기술을 이용하여 좀 더 리소스 여유가 있는 다른 ESXi 서버들 쪽으로 이동시켜서 스스로 전체 DRS 클러스터 내의 전체 리소스를 균형 있게 유지시켜 준다. 따라서 고가용성이라는 기능을 이용하고자 할 경우에는 HA 클러스터 기능을 사용하고, 리소스 밸런스를 자동화시키고 스스로 최적화시키는 기능을 이용하고자 할 경우에는 DRS 클러스터 기능을 사용한다. 또한 당연히 이 두 기능을 하나의 클러스터로 통합하여 사용할 수도 있다.

 

DRS 클러스터가 실제 리소스를 소비하는 가상 머신을 재배치하거나 이동시키는 경우는 크게 두 가지이다.

• 가상 머신을 Power on 할 때 - 가상 머신을 Power on 할 경우, vCenter 서버는 어느 ESXi 서버가 현재 가장 리소스 여유가 많은지 파악하여 그 ESXi 서버에서 가상 머신이 Power on 될 수 있도록 한다.

•가상 머신이 작동하는 도중 - 특정 가상 머신들의 CPU 및 메모리 사용량 증가로 인해 해당 가상 머신이 위치한 ESXi 서버의 리소스 사용량이 증가할 경우, vCenter 서버는 전체 DRS 클러스 내의 리소스 밸런스를 맞추기 위해 가상 머신을 좀 더 리소스 여유가 있는 다른 ESXi 서버로 VMotion 한다.

DPM 기능이란

DPM
<DPM>

DPM(Distributed Power Management) 기능은 별도의 클러스터 기능으로 따로 존재하는 것은 아니며 DRS 클러스터 구성시 같이 연동되어 작동되는 기술이다. DPM은 DRS 클러스터 내의 전체 리소스 사용량에 따라 ESXi 서버 자체를 Power off 하거나 Power on 함으로써 전력 비용을 절감시켜 주는 기술이다. DPM은 우선 전체 DRS 클러스터 내의 유휴 리소스 용량과 비교하여 만일 DRS 클러스터 내의 전체 리소스 용량이 매우 충분하다고 판단된다면 가상 머신들을 VMotion 실행함과 동시에 ESXi 서버들을 Stanby 모드로 전환하여 Power off 시킨다.  그렇게 함으로써 전력 비용을 절감시키고 전체 리소스 사용량을 극대화시켜 가상 머신을 통합시키게 된다. 만일 다시 가상 머신의 CPU 및 메모리 사용량이 증가하게 되고 I/O가 늘어날 경우, DPM은 스스로 ESXi 서버를 다시 Power on 시키고 VMotion을 통해 다시 가상 머신들을 적절하게 재배치시킨다. 현재 DPM이 ESXi 서버의 전원을 조정하기 위해서 크게 세 가지 프로토콜 방식을 활용하고 있다. 

  • IPMI(Intelligent Powere Management Interface)
  • HP iLO(integrated Lights-Out)
  • WOL(Wake-On-Lan)

IPMI나 WOL의 경우 대부분의 x86 시스템에서 기본적으로 제공하는 기능이며, HP 프로라이언트 서버에 장착된 iLO 포트의 경우는 오직 HP에서만 제공하는 내부 서버 관리용 포트이다. WOL과 같은 경우 WOL을 지원하는 네트워크 카드인지 여부를 먼저 확인해야 한다. 또한 두 개 이상의 네트워크 카드가 장착되어 있을 경우, 어떤 카드가 정확하게 WOL을 지원하는지의 여부도 확인해야 하며, 보통 BIOS에서 그 설정을 바꾸거나 확인할 수 있다. ESXi 서버에서는 UDP 방식을 통해 WOL 패킷을 전달하므로 라우팅이 된다 하더라도 브로드캐스트 방식의 UDP 패킷을 스위치에서 drop 시킬 수도 있기 때문에 반드시 면밀히 테스트를 거쳐야 한다. 또한 이러한 WOL 패킷은 VMotion용 네트워크를 통해 전달되어야 하기 때문에 WOL 이 사용 가능한 네트워크 카드는 반드시 VMotion용 네트워크 전용으로 설정해야 한다.

 

Standby Mode : 전력 비용을 절감시키기 위해 DPM은 ESXi 서버를 Power off 한다고 말했지만, 이것을 VMware에서는 Standby 모드로 전환시킨다고 표현한다. Standby 모드로 전환된다는 의미는 정확하게 말하면 ACPI S5 모드로 전환되었음을 의미한다. S1부터 S4까지 각각의 ACPI Power state가 정해져 있지만, S5는 S4 하이버네이션 모드 다음에 해당하는 가장 최저 전력 상태를 의미하며 WOL 기능에 의해 응답하기 위한 최소한의 하드웨어 컴포넌트들만 전력을 소비하는 형태이다. WOL에 의해 서버가 다시 ACPI S5 상태에서 빠져나오기 위해서는 VMotion용 네트워크를 통해 WOL패킷을 전달받아야 한다는 사실을 잊어서는 안 된다. IPMI 또는 HP의 iLO와 같은 전용 포트를 사용할 경우에는 WOL과 상관없이 작동시킬 수 있다. 또한 ACPI S5 상태의 서버를 정상적으로 다시 Power on 시키는 것은 DRS 클러스터 내의 다른 ESXi 서버에서 하는 것이며, vCenter 서버가 Power on 시키는 것은 아니다. 따라서 DPM 기능이 작동하여 모든 서버가 전부 Power off 될 수는 없으며 최소한 단 한 대의 ESXi 서버는 작동되고 있어야 한다. 

 

반응형

'⫸VMware' 카테고리의 다른 글

FT 작동 원리  (0) 2022.10.18
HA 개요 및 작동 원리  (0) 2022.10.14
Storage VMotion 작동 원리  (0) 2022.10.13
VMotion 작동 원리  (0) 2022.10.12
가상 머신 스냅샷  (0) 2022.10.11