본문 바로가기

IT/클라우드

스케줄 기반 Auto Scaling / 부하 기반 Auto Scaling 비교

반응형

정의

  • 스케줄 기반 Auto Scaling(Schedule-Based Auto Scaling) : 사전에 정의된 시간, 요일, 날짜를 기준으로 인스턴스 수를 조정하는 방식.
    → “예상되는 트래픽 패턴에 맞춰 미리 확장/축소”
  • 부하 기반 Auto Scaling(Load-Based Auto Scaling) : CPU 사용률, 메모리 사용률, 네트워크 트래픽 등의 실제 시스템 부하를 모니터링하여 자동으로 인스턴스를 조정하는 방식.
    → “실시간 트래픽 변화에 따라 자동으로 확장/축소”

주요 차이점 비교

구분 스케줄 기반 Auto Scaling 부하 기반 Auto Scaling
확장 트리거(Trigger) 사전 설정된 시간, 날짜, 주기 CPU, 메모리, 네트워크, 요청 수 등 실시간 부하
확장 방식 예상되는 트래픽 패턴을 기반으로 선제적 확장 시스템 부하 증가 시 실시간으로 확장
적용 사례 이벤트, 프로모션, 업무 시간에 맞춰 사전 확장 예측 불가능한 트래픽 패턴이나 비정기적 부하 대응
운영 복잡성 상대적으로 단순(사전 설정만 필요) 상대적으로 복잡(모니터링 및 임계치 설정 필요)
확장 속도 설정된 시간에 맞춰 즉시 확장 모니터링 지표를 분석 후 확장(지연 가능성 존재)
비용 효율성 트래픽 패턴이 명확할 때 매우 효율적 패턴이 불규칙할 경우 더 유리
리소스 낭비 가능성 예상이 빗나가면 리소스 과다 할당 가능 적절히 설정하면 리소스 낭비 최소화
구성 예측성 매우 예측 가능(정해진 시간에만 확장/축소) 트래픽 상황에 따라 다르므로 예측이 어렵다
적용 기술 AWS Auto Scaling(스케줄링 정책) AWS Auto Scaling(동적 스케일링 정책), Kubernetes HPA

동작 방식

1. 스케줄 기반 Auto Scaling (Schedule-Based)

  • 시간 기반(Time-based)으로 인스턴스 수를 조정.
  • 일반적으로 트래픽 패턴이 일정한 서비스에 적합
    • 매일 오전 09:00에 인스턴스 5대 → 10대로 확장(근무시간 시작)
    • 매일 오후 06:00에 인스턴스 10대 → 5대로 축소(근무시간 종료)설정 요소:
  • 주요 기술
    • AWS Auto Scaling → Scheduled Actions
    • Google Cloud Managed Instance Groups → Scheduled Autoscaler

2. 부하 기반 Auto Scaling (Load-Based)

  • 시스템의 CPU 사용률, 메모리 사용률, 네트워크 I/O, 요청 수(Request Count)를 실시간으로 모니터링하여 인스턴스를 확장/축소
  • 예상 불가능한 트래픽 급증에 대응할 수 있는 유연한 확장 방식.
    • CPU 사용률이 70% 초과 시 인스턴스 2대 추가
    • 요청 수(Request Count)가 초당 1,000건 이상 시 인스턴스 추가
  • 주요 기술
    • AWS Auto Scaling → Dynamic Scaling Policies
    • Kubernetes → Horizontal Pod Autoscaler(HPA)

 장단점 분석


1. 스케줄 기반 Auto Scaling

  • 장점
    • 예상 가능한 트래픽 패턴에 맞춰 선제적 대응 가능.
    • 설정만 완료하면 운영 복잡도가 낮음.
    • 비용 관리 최적화 가능(불필요한 인스턴스 과잉 방지).
  • 단점
    • 예상과 다른 트래픽이 발생하면 리소스 낭비(과소/과잉 할당)
    • 트래픽 패턴이 명확해야 효과적
    • 트래픽 급증 시 실시간 대응 불가능.
  • 적합 사례
    • 근무 시간에만 트래픽이 몰리는 사내 시스템
    • 마케팅 이벤트, 쇼핑몰 세일과 같이 트래픽 패턴이 사전에 예상되는 경우.

2. 부하 기반 Auto Scaling

  • 장점
    • 실시간 트래픽 변화에 즉각 대응.
    • 비정기적 트래픽 급증에 유연하게 대처
    • 필요한 만큼만 리소스를 할당하여 비용 최적화.
  • 단점
    • 모니터링 및 임계치 설정 필요(설정이 복잡)
    • 모니터링→확장→적용까지 시간이 걸리므로 지연(Lag) 발생 가능
    • 지표 설정이 잘못되면 과도한 인스턴스 확장으로 비용 폭증 가능.
  • 적합 사례
    • SNS 플랫폼과 같이 트래픽이 불규칙한 경우
    • API 서비스처럼 요청량이 시간대별로 다르게 변동되는 경우.
반응형