kcg-ai-monitoring

작성자	SHA1	메시지	날짜
htlee	45371315ba	feat: prediction 알고리즘 재설계 + 프론트 CRUD 권한 가드 보완 (#29 )	2026-04-13 11:08:11 +09:00
htlee	5c804aa38f	feat(backend): 워크플로우 연결 Step 1 — 백엔드 기반 확장 - V018 마이그레이션: prediction_events.features JSONB 컬럼 추가 - VesselAnalysis 직접 조회 API 5개 신설 (/api/analysis/*) - vessels 목록 (필터: mmsi, zone, riskLevel, isDark) - vessels/{mmsi} 최신 분석 (features 포함) - vessels/{mmsi}/history 분석 이력 - dark 베셀 목록 (MMSI 중복 제거) - transship 의심 목록 - PredictionEvent entity에 features JSONB 필드 추가 - EnforcementController vesselMmsi 필터 파라미터 추가 - event_generator.py INSERT에 features 컬럼 추가 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-09 10:43:53 +09:00
htlee	b15a94066a	docs: prediction 2차 개편 릴리즈 노트 + hourly snapshot 스크립트 - RELEASE-NOTES [Unreleased] 섹션에 dark 의심 점수화 + transship 재설계 변경사항 추가 - prediction/scripts/hourly-analysis-snapshot.sh: 시간별 상태 스냅샷 수집 (25개 섹션)	2026-04-09 09:55:46 +09:00
htlee	dac4a3bda2	fix(prediction): features JSONB 중첩 구조 sanitize AnalysisResult.to_db_tuple이 기존에 features dict 값을 모두 float로 변환했는데, dark_suspicion 구조를 넣으면서 dark_patterns(list) 등 비스칼라 타입이 포함되어 upsert 실패 (float argument not a list). _sanitize 재귀 함수로 JSON 호환 타입(str/int/float/bool/list/dict/None)을 그대로 보존하도록 변경.	2026-04-09 07:56:04 +09:00
htlee	e5d123e4c5	feat(prediction): dark 의심 점수화 + transship 베테랑 관점 재설계 12h 누적 분석 결과 dark/transship이 운영 불가 수준으로 판정되어 탐지 철학을 근본부터 전환. ## dark 재설계: 넓은 탐지 + 의도적 OFF 의심 점수화 기존 "필터 제외" 방식에서 "넓게 기록 + 점수 산출 + 등급별 알람"으로 전환. 해경 베테랑 관점의 8가지 패턴을 가점 합산하여 0~100점 산출. - P1 이동 중 OFF (gap 직전 SOG > 2kn) - P2 민감 수역 경계 근처 OFF (영해/접속수역/특정조업수역) - P3 반복 이력 (7일 내 재발) — 가장 강력 - P4 gap 후 이동거리 비정상 (은폐 이동) - P5 주간 조업 시간 OFF - P6 gap 직전 이상 행동 (teleport/급변) - P7 무허가 선박 가점 - P8 장기 gap (3h/6h 구간별) - 감점: gap 시작 위치가 한국 AIS 수신 커버리지 밖 완전 제외: - 어구 AIS (GEAR_PATTERN 매칭, fleet_tracker SSOT) - 한국 선박 (MMSI 440, 441) — 해경 관할 아님 등급: CRITICAL(70+) / HIGH(50~69) / WATCH(30~49) / NONE 이벤트는 HIGH 이상만 생성 (WATCH는 DB 저장만). 신규 함수: - algorithms/dark_vessel.py: analyze_dark_pattern, compute_dark_suspicion - scheduler.py: _is_dark_excluded, _fetch_dark_history (사이클당 1회 7일 이력 일괄 조회) pipeline path + lightweight path 모두 동일 로직 적용. 결과는 features JSONB에 {dark_suspicion_score, dark_patterns, dark_tier, dark_history_7d, dark_history_24h, gap_start_*} 저장. ## transship 재설계: 베테랑 함정근무자 기준 한정된 함정 자원으로 단속 출동을 결정할 수 있는 신뢰도 확보. 상수 재조정: - SOG_THRESHOLD_KN: 2.0 → 1.0 (완전 정박만) - PROXIMITY_DEG: 0.001 → 0.0007 (~77m) - SUSPECT_DURATION_MIN: 60 → 45 (gap tolerance 있음) - PAIR_EXPIRY_MIN: 120 → 180 - GAP_TOLERANCE_CYCLES: 2 신규 (GPS 노이즈 완화) 필수 조건 (모두 충족): - 한국 EEZ 관할 수역 이내 - 환적 불가 선종 제외 (passenger/military/tanker/pilot/tug/sar) - 어구 AIS 양쪽 제외 - 45분 이상 지속 (miss_count 2 사이클까지 용인) 점수 체계 (base 40): - 야간(KST 20~04): +15 - 무허가 가점: +20 - COG 편차 > 45°: +20 (나란히 가는 선단 배제) - 지속 ≥ 90분: +20 - 영해/접속수역 위치: +15 등급: CRITICAL(90+) / HIGH(70~89) / WATCH(50~69) WATCH는 저장 없이 로그만. HIGH/CRITICAL만 이벤트. pair_history 구조 확장: - 기존: {(a,b): datetime} - 신규: {(a,b): {'first_seen', 'last_seen', 'miss_count', 'last_lat/lon/cog_a/cog_b'}} - miss_count > GAP_TOLERANCE_CYCLES면 삭제 (즉시 리셋 아님) ## event_generator 룰 교체 - dark_vessel_long 룰 제거 → dark_critical, dark_high (features.dark_tier 기반) - transship 룰 제거 → transship_critical, transship_high (features.transship_tier 기반) - DEDUP: ILLEGAL_TRANSSHIP 67→181, DARK_VESSEL 127→131, ZONE_DEPARTURE 127→89 ## 공통 정리 - scheduler.py의 _gear_re 삭제, fleet_tracker.GEAR_PATTERN 단일 SSOT로 통합	2026-04-09 07:42:15 +09:00
htlee	2e5d55a27f	fix(prediction): dark 판정에 한국 AIS 수신 영역 필터 추가 16:00 cron 1차 분석 결과, lightweight path가 6,500척 중 5,250척(80%)을 dark로 판정. 좌표 검증 결과 모두 30~37°N/122~125°E (동중국해/서해)로 한국 AIS 수신소 도달 한계 영역에 위치하여 정상 운항 중에도 20~24h 통째로 수신이 끊기는 자연 gap이 발생. 핫픽스: lightweight path에서 dark 판정 직후 마지막 위치가 북위 32~39.5, 동경 124~132 (한반도 + EEZ + 접속수역 여유 포함) 밖이면 dark를 False로 강제. 한국 측 관심 영역의 dark 탐지는 그대로 유지. 근본 개편(STATIONARY 정박 필터, 진입 후 단절 패턴, gap 임계값 재조정 등)은 12시간 추적 데이터 수집 후 내일 진행.	2026-04-08 16:11:02 +09:00
htlee	0a4d023c76	fix(prediction): output 5종 이상 정상화 (stats/event/lightweight) 5가지 출력 이상 동시 해결: 1. stats_aggregator (이상 1, 5) - aggregate_hourly에 by_category, by_zone JSON 집계 추가 - hour_start를 KST 기준으로 변경 (대시보드 표기와 boundary 일치) 2. event_generator 룰 정리 (이상 2, 3, 4) - critical_risk 임계값 90→70 (risk.py CRITICAL 분류와 일치) - territorial_sea_violation, contiguous_zone_high_risk, special_zone_entry 신설 (실측 zone_code: TERRITORIAL_SEA/CONTIGUOUS_ZONE/ZONE_) - 잘못된 NLL/SPECIAL_FISHING_ 룰 제거 - HIGH_RISK_VESSEL 신규 카테고리 (50~69 MEDIUM, 70+ CRITICAL) - break 제거: 한 분석결과가 여러 카테고리에 동시 매칭 가능 3. dedup window prime 분산 (이상 5) - 30/60/120/360분 → 33/67/127/367분 - 5분 사이클 boundary와 LCM 회피하여 정시 일제 만료 패턴 완화 4. lightweight path 신호 보강 (이상 2, 3, 4 근본 해결) - vessel_store._tracks의 24h 누적 궤적으로 dark/spoof/speed_jump 산출 - 6,500 vessels(전체 93%)의 is_dark, spoofing_score가 비로소 채워짐 - compute_lightweight_risk_score에 dark gap, spoofing 가점 추가 (max 60→100 가능, CRITICAL 도달 가능) 시간 처리 원칙 적용: - DB 컬럼은 모두 timestamptz 확인 완료 - aggregate_hourly KST aware datetime 사용 - pandas Timestamp는 source-internal 비교만 (안전)	2026-04-08 15:18:18 +09:00
htlee	da37a00b8e	fix: prediction 5가지 이슈 수정 — 모든 파이프라인 정상 동작 ## 이슈 1: gear_correlation Decimal → float TypeError - prediction/algorithms/gear_correlation.py:785 - _load_all_scores()가 NUMERIC 컬럼을 Decimal로 읽어 float 상수와 연산 시 실패 - float() 명시 변환으로 수정 - 효과: gear correlation 24,474 raw metrics + 3,966 scores 정상 기록 ## 이슈 2: violation_classifier classified=0 문제 - prediction/output/violation_classifier.py - result.get('id')는 AnalysisResult에 없어 항상 None → 모든 UPDATE 건너뜀 - 존재하지 않는 permit_status/gear_judgment 필드에 의존 - (mmsi, analyzed_at) 기준 UPDATE로 변경 - 중국 선박(412/413) + EEZ 진입은 permit 없어도 EEZ_VIOLATION 판정 - 효과: classified=0 → classified=4~6/cycle ## 이슈 3: kpi_writer 모두 0 (tracking_active 외) - prediction/output/kpi_writer.py:27 - date.today() + timezone.utc 혼용 → 현재 시각이 UTC로는 아직 '어제'라 '오늘 >= today_start' 쿼리가 0 반환 - KST 기준으로 today_start 계산 - 효과: realtime_detection 0 → 7,107, illegal_transship 0 → 5,033 ## 이슈 4: stats_daily 오늘 0건 - prediction/output/stats_aggregator.py:96, 194 - aggregate_daily/monthly가 UTC 경계 사용 - KST 기준 자정으로 수정 - 효과: 2026-04-08 detections 0 → 543,656, events 0 → 5,253 ## 이슈 5: parent workflow 테이블 누락 컬럼 (V005 ↔ prediction 불일치) V016 마이그레이션으로 일괄 추가: - gear_parent_label_sessions: label_parent_name, normalized_parent_name, duration_days, actor, comment, metadata, updated_at 등 8개 컬럼 - gear_group_parent_resolution: parent_name, normalized_parent_name, selected_parent_name, confidence, decision_source, top_score, second_score, score_margin, stable_cycles, evidence_summary, episode_id, continuity_, prior_bonus_total, last_evaluated_at, last_promoted_at 등 17개 컬럼 - gear_parent_candidate_exclusions: normalized_parent_name, reason_type, duration_days, metadata, updated_at, active_from, active_until + candidate_mmsi GENERATED ALWAYS AS (excluded_mmsi) 별칭 - gear_group_parent_candidate_snapshots: parent_name 효과: gear parent inference: 925 groups, 301 direct-match, 1329 candidates, 188 review-required, 925 episode-snapshots 기록 — 전체 모선 워크플로우 정상 ## 검증 결과 (e2e) - analysis cycle: 6,824 vessels, 112초/cycle 정상 - vessel_analysis_results: 10분 13,650건, 총 125만건 - prediction_events: 1시간 138건, 총 12,258건 - prediction_alerts: 1시간 183건 - gear_correlation_scores: 3,966건 - gear_group_parent_resolution: 926건 - stats_hourly: 17행, stats_daily: 오늘 543,656건 - 백엔드 Flyway V016 정상 적용 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-08 06:47:53 +09:00
htlee	e12d1c33e2	fix: prediction e2e — 누락 테이블 12개 + 컬럼 매핑 + NUMERIC precision 통합 수정 - V014: fleet_vessels, fleet_tracking_snapshot, gear_identity_log, gear_correlation_scores/raw_metrics, correlation_param_models, group_polygon_snapshots, gear_group_episodes/episode_snapshots, gear_group_parent_candidate_snapshots, gear_parent_label_tracking_cycles, system_config 테이블 추가 - V015: 점수/비율 NUMERIC precision 일괄 확대 (score→7,4 / pct→12,2) + vessel_analysis_results UNIQUE(mmsi, analyzed_at) 인덱스 추가 - prediction kcgdb.py: timestamp→analyzed_at, zone→zone_code, is_leader→fleet_is_leader, is_transship_suspect→transship_suspect 매핑 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 15:00:29 +09:00
htlee	474e672683	feat: S3 prediction 신규 출력 모듈 5종 + scheduler 통합 분석 사이클 완료 후 자동 실행되는 출력 파이프라인: - event_generator: 분석결과 → 이벤트 자동 생성 (7개 룰, 카테고리별 dedup) - violation_classifier: 위반 유형 라벨링 (EEZ/DARK/MMSI/TRANSSHIP/GEAR/RISK) - kpi_writer: 실시간 KPI 6개 갱신 (오늘 기준 카운트) - stats_aggregator: hourly/daily/monthly 사전 집계 (UPSERT) - alert_dispatcher: CRITICAL/HIGH 이벤트 자동 알림 생성 scheduler.py에 출력 모듈 통합 (분석 8단계 완료 후 실행, non-fatal) DB 연동 테스트 통과 (alerts 8건 생성, KPI tracking_active=2) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 13:00:50 +09:00
htlee	e2fc355b2c	feat: S2 prediction 분석 엔진 모노레포 이식 iran prediction 47개 Python 파일을 prediction/ 디렉토리로 복제: - algorithms/ 14개 분석 알고리즘 (어구추론, 다크베셀, 스푸핑, 환적, 위험도 등) - pipeline/ 7단계 분류 파이프라인 - cache/vessel_store (24h 슬라이딩 윈도우) - db/ 어댑터 (snpdb 원본조회, kcgdb 결과저장) - chat/ AI 채팅 (Ollama, 후순위) - data/ 정적 데이터 (기선, 특정어업수역 GeoJSON) config.py를 kcgaidb로 재구성 (DB명, 사용자, 비밀번호) DB 연결 검증 완료 (kcgaidb 37개 테이블 접근 확인) Makefile에 dev-prediction / dev-all 타겟 추가 CLAUDE.md에 prediction 섹션 추가 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 12:56:51 +09:00

11 커밋