본문 바로가기
Professional Engineer/AI

유사도(Similarity)

by 코드네임피터 2024. 9. 20.
반응형

정의

- 데이터 간의 유사도를 정의하여 그 유사도가 가까운 것부터 순선 대로 묶어 가는 방법

- 유사도 측정을 통하여 군집을 형성함으로 물리적 거리가 가까운 항목들을 동일 집단으로 묶음으로 거리기반과 유사도 기반을 척도로 사용
- 거리 기반 척도 : 맨하튼 거리, 유클리드 거리, 마할라노 거리, 민코스프키거리, 해밍거리 등
- 유사도 기반 척도 : 자카드 계수, 코사인, 단순매칭계수, 피어슨상관관계계수 등
- 클러스터링 평가 지표로는 실루엣 계수(silhouette score)와 응집도(Inertia) 이용

 

키워드

- 교집합/합집합, -1,0,1, 군집내, 군집외

 

메커니즘

 

기술요소

자카드 유사도(Jaccard Similarity)


코사인 유사도(Cosine Similarity)


실루엣 계수(Silhouette Coefficient)

반응형

'Professional Engineer > AI' 카테고리의 다른 글

Random Forest 와 Adaboost  (0) 2024.09.20
연합학습(Federated Learning)  (0) 2024.09.20
오토인코더(Autoencoder)  (0) 2024.09.20
VAE(Variational Autoencoder)  (0) 2024.09.20
데이터 라벨링, 어노테이션  (0) 2024.08.02

댓글