LB가 Backend Health Probe상태도 이상 없는 상황에 Degraded Event가 발생했을 경우
아래와 같이 Azure 인프라단의 LB Platform 이슈를 의심해볼 수 있습니다.
(자세한 내용은 Case Open을 해서 확인이 필요합니다.)
Load Balancer 내부에 포함된 다중화된 MUX 중, 1개의 MUX 인스턴스에서 일시적으로 Health Probe Ping 응답이 없을 경우 가용성 Degrade로 Event를 발생시킵니다.
(MUX 관련 참고 문서 : https://learn.microsoft.com/ko-kr/azure/azure-local/concepts/software-load-balancer#how-software-load-balancer-works)
LoadBalancer는 안정적인 서비스를 제공하기 위하여 1개의 LoadBalancer내부에 MUX 인스턴스가 다중으로 구성되어 있습니다.
따라서 LoadBalancer 를 구성하고 있는 1개의 MUX 인스턴스에서 잠시 Ping 응답이 없었다고 하더라도
LoadBalancer 내부에 있는 나머지 MUX 인스턴스가 계속 동작하고 있기 때문에
실제 LoadBalancer 는 가용성이 떨어지더라도 계속 안정적으로 서비스를 제공할 수 있다고 보시면 됩니다.
LoadBalancer에서 Backend VM의 상태를 확인하기 위해 Health Probe를 보내는 것과 동일한 논리로
Azure 내부 인프라에서 LoadBalancer의 Public IP 로 Health Probe를 보내서 LoadBalancer 내부의 MUX 들의 상태를 확인하는데, 이 때 1개의 MUX 인스턴스의 일시적인 Health Probe 응답 실패가 Resource Health Degraded Alert를 발생시킬 수 있습니다.
하지만 다중화된 MUX 구조에서는 나머지 MUX 인스턴스가 정상 동작하고 있었기 때문에
실제 Client 의 서비스는 안정적으로 제공할 수 있습니다.