signal-batch/docs/implementation-progress.md
HeungTak Lee 60366816a6 docs: 구현 진행 문서 최종 업데이트 - 전 단계 완료
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-02-06 13:46:06 +09:00

102 lines
4.2 KiB
Markdown

# WebSocket 부하 제어 개선 — 구현 진행 상황
> 브랜치: `feat/websocket-load-control`
> 시작일: 2026-02-06
---
## DB 커넥션 풀 분배 설계 (총 250개)
| DataSource | AS-IS | TO-BE | 비고 |
|------------|-------|-------|------|
| **Query** | 60 (min 10) | 120 (min 20) | WebSocket 스트리밍 + REST API 주 사용 |
| **Collect** | 20 (min 5) | 80 (min 15) | 배치 Reader, 신호 수집 조회 |
| **Batch** | 20 (min 10) | 30 (min 5) | Spring Batch 메타데이터 |
| **예비** | - | 20 | 운영 여유분 |
| **합계** | 100 | 250 | DB 서버 500 중 250 사용 |
### 글로벌 동시 쿼리 제한 산정
- Query 풀 120개 / 쿼리당 평균 3커넥션 = 40
- 보수적 적용: **30개** (REST API, 헬스체크 등에 여유분 확보)
---
## Phase 1 — 긴급 안정화
- [x] **1.1** 글로벌 동시 쿼리 제한 (Semaphore + Fair Queue)
- ActiveQueryManager에 Fair Semaphore 기반 글로벌 동시 쿼리 제한 추가 (기본 30개)
- @Async 메서드 내에서 슬롯 획득 (인바운드 채널 블로킹 방지 설계)
- application-prod.yml에 websocket.query 설정 외부화
- 상태: **완료** (2026-02-06)
- [x] **1.2** 쿼리 완료 시 리소스 반환 보장
- ChunkedTrackStreamingService finally 블록에 releaseQuery() + releaseQuerySlot() 추가
- StompTrackStreamingService finally 블록에 releaseQuery() + releaseQuerySlot() 추가
- 세션별 쿼리 카운트 감소 누락 수정
- 상태: **완료** (2026-02-06)
- [x] **1.3** CachedThreadPool → 제한된 ThreadPoolExecutor 교체
- CancellableQueryManager: newCachedThreadPool → ThreadPoolExecutor(core:5, max:20, queue:100)
- CallerRunsPolicy로 큐 포화 시 자연 백프레셔
- 상태: **완료** (2026-02-06)
- [x] **1.4** DB 커넥션 풀 재분배 (prod)
- Query: 60→120(min 20), Collect: 20→80(min 15), Batch: 20→30(min 5)
- 총 230/250, 예비 20개
- 상태: **완료** (2026-02-06)
---
## Phase 2 — 취소 및 정리 로직 완성
- [x] **2.1** ChunkedTrackStreamingService 쿼리 취소 구현
- queryCancelFlags(ConcurrentHashMap<String, AtomicBoolean>) 추가
- streamChunkedTracks 시작 시 등록, 전략별 루프 전 확인, finally에서 정리
- cancelQuery()에 실제 플래그 설정 로직 구현 (기존 TODO 해소)
- isQueryCancelled()에 취소 플래그 통합 확인
- 상태: **완료** (2026-02-06)
- [x] **2.2** 쿼리 관리 시스템 통합
- StompTrackController의 중복 completeQuery() 제거
- 리소스 정리를 서비스 finally 블록에서 일괄 처리하도록 단일화
- 상태: **완료** (2026-02-06)
---
## Phase 3 — 백프레셔 고도화
- [x] **3.1** 콜백 기반 버퍼 추적
- CompletableFuture+Thread.sleep(100) → try-finally 즉시 감소로 전환
- 상태: **완료** (2026-02-06)
- [x] **3.2** 적응형 전송 지연
- ChunkedTrack: 버퍼 사용률(%) 기반 4단계 적응형 지연 (10~200ms)
- StompTrack: 큐 사용률 + 데이터 크기 복합 적응형 지연
- 상태: **완료** (2026-02-06)
---
## Phase 4 — 설정 외부화 및 모니터링
- [x] **4.1** WebSocketProperties 설정 클래스
- @ConfigurationProperties(prefix = "websocket")로 query/transport/backpressure 설정 바인딩
- 상태: **완료** (2026-02-06)
- [x] **4.2** 모니터링 엔드포인트
- GET /api/websocket/load-control — 글로벌 동시 제한, 대기 큐, 활성 쿼리 상세, 메모리
- 상태: **완료** (2026-02-06)
---
## 커밋 이력
| 날짜 | Phase | 커밋 메시지 | 해시 |
|------|-------|------------|------|
| 2026-02-06 | 1.1+1.2 | feat: 글로벌 동시 쿼리 제한(Semaphore) 및 리소스 반환 보장 | 78ff307 |
| 2026-02-06 | 1.3 | fix: CachedThreadPool → 제한된 ThreadPoolExecutor 교체 | 2191671 |
| 2026-02-06 | 1.4 | perf: DB 커넥션 풀 재분배 (총 250개, prod) | 122a247 |
| 2026-02-06 | 2.1 | feat: ChunkedTrackStreamingService 쿼리 취소 로직 구현 | e073007 |
| 2026-02-06 | 2.2 | refactor: 쿼리 생명주기 관리 서비스 finally 블록으로 단일화 | 28908e1 |
| 2026-02-06 | 3 | perf: 백프레셔 고도화 - 정확한 버퍼 추적 및 적응형 지연 | 7b7e283 |
| 2026-02-06 | 4 | feat: WebSocket 설정 외부화 및 부하 제어 모니터링 엔드포인트 | c92bf0e |