반응형
정의
- 데이터 간의 유사도를 정의하여 그 유사도가 가까운 것부터 순선 대로 묶어 가는 방법
- 유사도 측정을 통하여 군집을 형성함으로 물리적 거리가 가까운 항목들을 동일 집단으로 묶음으로 거리기반과 유사도 기반을 척도로 사용
- 거리 기반 척도 : 맨하튼 거리, 유클리드 거리, 마할라노 거리, 민코스프키거리, 해밍거리 등
- 유사도 기반 척도 : 자카드 계수, 코사인, 단순매칭계수, 피어슨상관관계계수 등
- 클러스터링 평가 지표로는 실루엣 계수(silhouette score)와 응집도(Inertia) 이용
키워드
- 교집합/합집합, -1,0,1, 군집내, 군집외
메커니즘
기술요소
자카드 유사도(Jaccard Similarity)
코사인 유사도(Cosine Similarity)
실루엣 계수(Silhouette Coefficient)
반응형
'Professional Engineer > AI' 카테고리의 다른 글
Random Forest 와 Adaboost (0) | 2024.09.20 |
---|---|
연합학습(Federated Learning) (0) | 2024.09.20 |
오토인코더(Autoencoder) (0) | 2024.09.20 |
VAE(Variational Autoencoder) (0) | 2024.09.20 |
데이터 라벨링, 어노테이션 (0) | 2024.08.02 |
댓글