102 lines
4.2 KiB
Markdown
102 lines
4.2 KiB
Markdown
# WebSocket 부하 제어 개선 — 구현 진행 상황
|
|
|
|
> 브랜치: `feat/websocket-load-control`
|
|
> 시작일: 2026-02-06
|
|
|
|
---
|
|
|
|
## DB 커넥션 풀 분배 설계 (총 250개)
|
|
|
|
| DataSource | AS-IS | TO-BE | 비고 |
|
|
|------------|-------|-------|------|
|
|
| **Query** | 60 (min 10) | 120 (min 20) | WebSocket 스트리밍 + REST API 주 사용 |
|
|
| **Collect** | 20 (min 5) | 80 (min 15) | 배치 Reader, 신호 수집 조회 |
|
|
| **Batch** | 20 (min 10) | 30 (min 5) | Spring Batch 메타데이터 |
|
|
| **예비** | - | 20 | 운영 여유분 |
|
|
| **합계** | 100 | 250 | DB 서버 500 중 250 사용 |
|
|
|
|
### 글로벌 동시 쿼리 제한 산정
|
|
- Query 풀 120개 / 쿼리당 평균 3커넥션 = 40
|
|
- 보수적 적용: **30개** (REST API, 헬스체크 등에 여유분 확보)
|
|
|
|
---
|
|
|
|
## Phase 1 — 긴급 안정화
|
|
|
|
- [x] **1.1** 글로벌 동시 쿼리 제한 (Semaphore + Fair Queue)
|
|
- ActiveQueryManager에 Fair Semaphore 기반 글로벌 동시 쿼리 제한 추가 (기본 30개)
|
|
- @Async 메서드 내에서 슬롯 획득 (인바운드 채널 블로킹 방지 설계)
|
|
- application-prod.yml에 websocket.query 설정 외부화
|
|
- 상태: **완료** (2026-02-06)
|
|
|
|
- [x] **1.2** 쿼리 완료 시 리소스 반환 보장
|
|
- ChunkedTrackStreamingService finally 블록에 releaseQuery() + releaseQuerySlot() 추가
|
|
- StompTrackStreamingService finally 블록에 releaseQuery() + releaseQuerySlot() 추가
|
|
- 세션별 쿼리 카운트 감소 누락 수정
|
|
- 상태: **완료** (2026-02-06)
|
|
|
|
- [x] **1.3** CachedThreadPool → 제한된 ThreadPoolExecutor 교체
|
|
- CancellableQueryManager: newCachedThreadPool → ThreadPoolExecutor(core:5, max:20, queue:100)
|
|
- CallerRunsPolicy로 큐 포화 시 자연 백프레셔
|
|
- 상태: **완료** (2026-02-06)
|
|
|
|
- [x] **1.4** DB 커넥션 풀 재분배 (prod)
|
|
- Query: 60→120(min 20), Collect: 20→80(min 15), Batch: 20→30(min 5)
|
|
- 총 230/250, 예비 20개
|
|
- 상태: **완료** (2026-02-06)
|
|
|
|
---
|
|
|
|
## Phase 2 — 취소 및 정리 로직 완성
|
|
|
|
- [x] **2.1** ChunkedTrackStreamingService 쿼리 취소 구현
|
|
- queryCancelFlags(ConcurrentHashMap<String, AtomicBoolean>) 추가
|
|
- streamChunkedTracks 시작 시 등록, 전략별 루프 전 확인, finally에서 정리
|
|
- cancelQuery()에 실제 플래그 설정 로직 구현 (기존 TODO 해소)
|
|
- isQueryCancelled()에 취소 플래그 통합 확인
|
|
- 상태: **완료** (2026-02-06)
|
|
|
|
- [x] **2.2** 쿼리 관리 시스템 통합
|
|
- StompTrackController의 중복 completeQuery() 제거
|
|
- 리소스 정리를 서비스 finally 블록에서 일괄 처리하도록 단일화
|
|
- 상태: **완료** (2026-02-06)
|
|
|
|
---
|
|
|
|
## Phase 3 — 백프레셔 고도화
|
|
|
|
- [x] **3.1** 콜백 기반 버퍼 추적
|
|
- CompletableFuture+Thread.sleep(100) → try-finally 즉시 감소로 전환
|
|
- 상태: **완료** (2026-02-06)
|
|
|
|
- [x] **3.2** 적응형 전송 지연
|
|
- ChunkedTrack: 버퍼 사용률(%) 기반 4단계 적응형 지연 (10~200ms)
|
|
- StompTrack: 큐 사용률 + 데이터 크기 복합 적응형 지연
|
|
- 상태: **완료** (2026-02-06)
|
|
|
|
---
|
|
|
|
## Phase 4 — 설정 외부화 및 모니터링
|
|
|
|
- [x] **4.1** WebSocketProperties 설정 클래스
|
|
- @ConfigurationProperties(prefix = "websocket")로 query/transport/backpressure 설정 바인딩
|
|
- 상태: **완료** (2026-02-06)
|
|
|
|
- [x] **4.2** 모니터링 엔드포인트
|
|
- GET /api/websocket/load-control — 글로벌 동시 제한, 대기 큐, 활성 쿼리 상세, 메모리
|
|
- 상태: **완료** (2026-02-06)
|
|
|
|
---
|
|
|
|
## 커밋 이력
|
|
|
|
| 날짜 | Phase | 커밋 메시지 | 해시 |
|
|
|------|-------|------------|------|
|
|
| 2026-02-06 | 1.1+1.2 | feat: 글로벌 동시 쿼리 제한(Semaphore) 및 리소스 반환 보장 | 78ff307 |
|
|
| 2026-02-06 | 1.3 | fix: CachedThreadPool → 제한된 ThreadPoolExecutor 교체 | 2191671 |
|
|
| 2026-02-06 | 1.4 | perf: DB 커넥션 풀 재분배 (총 250개, prod) | 122a247 |
|
|
| 2026-02-06 | 2.1 | feat: ChunkedTrackStreamingService 쿼리 취소 로직 구현 | e073007 |
|
|
| 2026-02-06 | 2.2 | refactor: 쿼리 생명주기 관리 서비스 finally 블록으로 단일화 | 28908e1 |
|
|
| 2026-02-06 | 3 | perf: 백프레셔 고도화 - 정확한 버퍼 추적 및 적응형 지연 | 7b7e283 |
|
|
| 2026-02-06 | 4 | feat: WebSocket 설정 외부화 및 부하 제어 모니터링 엔드포인트 | c92bf0e |
|