운동하는 공대생
[Computer Vision] 컴퓨터 비전과 딥러닝 4장- 영역 분할 본문
영역 분할이란 영상에서 물체에 영억을 특정하는 방식이다. 이전까지 에지를 활용해서 경계선을 처리하는 방식에 대하여 알아보았는데 영역 분할은 에지들로만 영역을 분류하기에는 조금 부족함이 있어서 사용한다.
1 단순 영역 분할
가장 기본적이고 단순한 방식의 영역 분할은 이진화 알고리즘을 사용하거나 군집화 알고리즘을 사용하는 것이다. 군집화 알고리즘은 보통 (RGB) 값을 통해서 3개 값으로 표현된 화소의 샘플을 군집화하여서 분할한다.
2. 슈퍼 화소 분할
픽셀 화소 보다는 크고 영상의 물체보다는 작은 영역으로 분할하는 방식으로 이런 분할하는 화소를 슈퍼 화소(super-pixel)이라고 합니다.
-SLIC(Simple Linear Iterative Clustering)
k-means clustering 방식과 비슷하게 작동합니다. k-means처럼 중심점을 잡고 RGB값과 위치정보 x, y 값을 결합한 정보들을 가지고 군집을 형성하여 분할을 진행한다.

3. 최적화 분할
최적화 분할은 이전에 영역을 분할때 RGB값과 위치정보를 기반으로 분류를 하기 때문에 배경색과 비슷한 색상의 물체를 같이 분할하는 문제가 발생한다. 그래서 이것을 해결하기 위해서 최적화 분할을 진행하였다.
- 영상의 그래프 표현
이전에서 영상 데이터를 픽셀 단위로 데이터화하여 연산하는게 아니라 SLIC처럼 슈퍼화소 영역으로 분할을 하고 그 이후에 단일 픽셀이 아닌 슈포픽셀 단위로 연산을 진행한다. 그러면 계산해야 하는 효율이 증가한다. 두 노드를 연결하는 에지의 가중치로는 유사도를 사용한다.

- 정규화 절단 알고리즘
이전의 영상의 그래프 표현에서 했던 방식처럼 유사도를 임계치로 두고 두 영역사이의 절단을 하는 방식을 말한다.
만약 C1, C2 영역이 있다고 했을때 영역에 포함된 화소들의 유사도 (s)를 기준으로 유사도가 적게 나오면 좋은 분할이고 높게 나오면 안 좋은 분할이다. 이 말은 즉 분할한 영역에 포한된 노드들 사이의 유사도의 합이 높으면 유사도가 높은데도 분할을 했다는 말임으로 좋지 않은 분할이라 이야기하는 것이다.


왼쪽의 수식을 보면 cut() 이라는 함수를 아까 말했던 유사도(w) 들의 총합으로 표현하는 함수이다.
그리고 ncut() 은 두 영역사이의 원래 영역(C)에서 각자 분할을 하였을 때 분할을 최적화하는 문제를 푸는 목적 함수로 사용한다.
즉 이전 영역(c)에서 c1, c2 로 분할하기 위한 함수 ncut을 최소화해야 좋은 분할이라 이야기하는 게 가능하다.
이렇게 영역에 대한 분할은 딥러닝 이전에 각광을 받았지만 색상과 위치에 대한 한계 때문에 많은 발전은 없었다.
'Deep Learning > Computer Vision' 카테고리의 다른 글
[Computer Vision] 컴퓨터 비전과 딥러닝 5장- 매칭 (0) | 2023.07.22 |
---|---|
[Computer Vision] 컴퓨터 비전과 딥러닝 4장- 대화식 분할, 영역 특징 (0) | 2023.07.14 |
[Computer Vision] 컴퓨터 비전과 딥러닝 4장- 캐니 에지 (0) | 2023.07.13 |
[Computer Vision] 컴퓨터 비전과 딥러닝 4장- 에지 검출 (0) | 2023.07.13 |
[Computer Vision] 컴퓨터 비전과 딥러닝 - 3장 (0) | 2023.07.06 |