끄적이는 보송

[AWS] CloudWatch 누락된 데이터 포인트 Sample Count로 확인하기 본문

STUDY/AWS

[AWS] CloudWatch 누락된 데이터 포인트 Sample Count로 확인하기

끄적이는 보송 2023. 2. 9. 14:07
반응형

빌링 관련 CloudWatch Metric 확인할 일이 있었다. 내가 확인한 지표는 'EstimatedCharges'라는 계정에 과금되는 비용을 볼 수 있는 지표였으며, 주기는 6시간을 선택했다. 하지만 아래 지표 예시에도 볼 수 있듯이 그래프가 끊겨 누락된 데이터가 있는 것처럼 보였다.

과금은 꾸준히 발생하고 있다. 갑자기 서비스를 중단했다고 해도 말이 안 되는 게 정말 누락되었다면 그래프가 끊긴 시점과 시작되는 시점의 지표값이 동일해야 하지만 지표값은 꾸준히 상승하는 모습을 보였다. 왜 이런 일이 발생한 걸까?

반응형

원인은 내가 'EstimatedCharges' 지표의 주기 값을 6시간을 지정했던 것과 (AWS에선 6시간을 권장하는 듯 보이다. 확실하진 않음), 실제 CloudWatch에 쌓이는 'EstimatedCharges'의 Data point가 내 예상과 달리 규칙적으로 쌓이지 않는 것에 있었다.

Statistic을 'Sample count'로 변경하고 실제로 Data point가 언제 찍혔는지 확인해 보았다. 14:00~22:00 사이는 8시간 22:00~04:00 사이는 6시간의 갭이 보인다. 'EstimatedCharges'의 지표가 일정한 간격으로 쌓이지 않는다는 것을 의미한다. 관련해 Global Support에 문의하니 정상적인 현상이며, 몇몇 서비스는 이런 성격을 띤다고 한다.

*Sample count: 해당 기간 동안 발생한 Data point의 수다. 예를 들어, 우리가 흔히 CloudWatch로 확인하는 EC2의 CPU utilization도 이 sample count에 쌓이는 지표 값을 기반으로 MIN, MAX, AVG 등을 산출해 내는 것이다.
[+] https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Statistics-definitions.html

 

반응형
Comments