본문 바로가기
Professional Engineer/AI

U-Net

by 코드네임피터 2024. 9. 20.
반응형

정의

- 넓은 범위의 이미지 픽셀로부터 의미 정보를 추출하고 의미정보를 기반으로 각 픽셀마다 객체를 분류하는 U 모양의 아키텍처를 가지는 FCN(Fully-Convolution Network) 기반 인공지능 모델

 

키워드

- 이미지 세그멘테이션, Contracting, Bottle Neck, Expanding, Skip Connection

 

메커니즘

 

기술요소

수축 경로(Contracting Path)
- 3×3 Convolution Layer + ReLu + BatchNorm (No Padding, Stride 1) * 2번 수행
- 2×2 Max-polling Layer (Stride 2)
- 점진적으로 넓은 범위의 이미지 픽셀을 보며 의미정보(Context Information)을 추출

 

전환 구간(Bottle Neck)
- 3×3 Convolution Layer + ReLu + BatchNorm(No Padding, Stride 1) * 2번 수행
- Dropout Layer- 수축 경로에서 확장 경로로 전환

 

확장 경로(Expanding Path)
- 2×2 Deconvolution layer (Stride 2)
- 수축 경로와 동일한 특징맵을 추출하고 연결
- 3×3 Convolution Layer + ReLu + BatchNorm(No Padding, Stride 1) * 2번 수행
- 의미정보를 픽셀 위치정보와 결합 (Localization)하여 각 픽셀마다 어떤 객체에 속하는지 구분

 

참고

학습방법

Overlap-tile Strategy
- 큰 이미지를 겹치는 부분이 있도록 일정 크기로 분할, 모델의 Input으로 활용
- Input 값 중복

 

Mirroring Extrapolate
- 이미지 경계(Border)부분을 거울이 반사된 것처럼 확장하여 Input으로 활용
- 이미지 복사 후 좌우 반전

 

Weight Loss
- 모델이 객체간 경계를 구분할 수 있도록 Weight Loss를 구성하고 학습
- 픽셀 경계 가중치 맵 사용

 

Data Augmentation
- 적은 데이터로 모델을 잘 학습할 수 있도록 데이터 증강 방법을 활용
- 회전(Rotation), 이동(Shift), Elastic Distortion

 

반응형

'Professional Engineer > AI' 카테고리의 다른 글

딥러닝 모델 경량화 기술  (0) 2024.09.20
분류 알고리즘의 유형  (0) 2024.09.20
GNN(Graph Neural Network)  (0) 2024.09.20
SNN(Spiking Neural Network)  (0) 2024.09.20
XGBoost(eXtreme Gradient Boosting)  (0) 2024.09.20

댓글