본문 바로가기
Professional Engineer/AI

컨셉 드리프트(Concept Drift)와 데이터 드리프트(Data Drift)

by 코드네임피터 2024. 9. 20.
반응형

컨셉 드리프트(Concept Drift)

- 머신러닝에서 입력 데이터로부터 예측하려고 하는 정답 라벨의 관계성이 모델 훈련때와 비교하여 변경되어 모델의 예측 성능이 저하되는 현상

 

원인: 정답라벨의 개념 변화(데이터와 라벨의 관계성 변화)

사례:금융사기 예측모델에서 금융사기의 정의가 바뀐 경우

해결방안: Online Learning, Feature dropping


데이터 드리프트(Data Drift)

- 모델의 훈련시 입력 데이터의 통계적 분포와 배포 환경에서 입력 데이터의 통계적 분포 차이로 인한 편향으로
모델의 예측 성능이 저하되는 현상

원인: 훈련과 배포환경의 입력데이터 분포 변화(입력데이터의 분포 변화)

사례:계절성에 따라 여름에 효과 있는 모델이 겨울에는 성능이 저하되는 경우

해결방안: 드리프트 모니터링, 모델의 재학습, 재배포

반응형

댓글