운동하는 공대생
[Computer Vision] 컴퓨터 비전과 딥러닝 - 3장 본문
1. Intro
컴퓨터 비전과 딥러닝 책의 3장 내용을 정리한 내용입니다.
3장에서는 이미지, 영상 데이터를 어떻게 데이터화시키는지를 설명하는 장이다. 이미지나 영상 데이터는 고차원은 다분광, 초분광 같은 영상들도 있지만 보통 RGB로 구성된 영상으로 예시를 많이 진행했다.
2. 이진 영상
2.1 이진화
이진화란 maxtrix 형식으로 표현된 데이터에서 임곗값 T를 기준으로 T 보다 크면 1 적으면 0 이런 식으로 데이터를 단순히 이진화시킨다.
2.2 오츄 알고리즘
전체 이미지에서 적정한 임곗값을 먼저 계산하여 임곗값을 정한다.
2.3 연결 요소
connected component labeling 이라고도 하며 근처에 있는 같은 데이터를 연결 지어서 분류해 주는 방식이다.
2.4 모 폴로지
영상을 변환하는 과정에서 하나의 물차가 여러 영역으로 분리되거나 다른 물체가 한 영역으로 붙는 경우 등이 발생한다. 이런 부작용을 줄이기 위한 방식이다.
고조 요소를 이용하여서 영역에 대한 조작을 하는데 이때 팽창, 침식, 열림, 닫힘 연산이 이루어진다.
입력 데이터 f에서 구조요소 S를 통해서 모 폴로지 연삭을 수행하면 (a) 왼쪽 오른쪽 모두를 1로 채우는 팽창 (b) 구조 요소에서 중심점 이외에 값을 0으로 대치하는 걸 침식 (c) 침식한 결과에 팽창 적용 (d) 팽창한 결과에 침식
이런 방식은 영역에 대한 경계를 명확하게 해 주거나 끊긴 영역을 연결해 주는 효과가 있다.
이제 영상 처리 연산에 3가지에 대하여 말해보겠다.
- 점 연산 : 이전 이진화와 같이 데이터의 정보를 변환하여 처리
- 영역 연산 : 모 \폴로지처럼 영역을 지정하여 연산
- 기하 연산 : 기하학적 변환에 따라 다른 곳에서 값을 받아오는 연산
3. 점 연산
3.1 명암 조절
명암을 조절하는 방식은 3가지가 있는데 밝게는 최댓값 L 보다는 넘지 않게 특정 값을 더하고 어둡게는 0 보다는 크게 그리고 반전은 최댓값에서 현재 값을 빼서 단순 선형 계산 방식으로 점 연산을 진행한다.
하지만 사람의 눈으로 일정 양의 명암 변화는 쉽게 수치적으로 인식하기 어렵다 그래서 감마 보정(gamma correction)이라는 방식이 생겼다. 이것을 1이면 원래 영상 유지, 1 보다 작으면 밝아지고 1보다 크면 어두워지는 방식으로 수치화를 한다.
3.2 히스토그램 평활화
히스토그램 평활화는 영상 데이터의 총합에 대한 정규화를 통해서 명함의 대비를 평활화하여 명함의 대비를 높이는 방식이다.
4 영역 연산
4.1 컨볼루션
커널 혹은 필터를 이미지에 대치시켜 곱 연산을 진행하고 이것을 합하는 과정이다.
2차원 컨볼루션 같은 경우에 feature map의 사이즈가 줄어드는 현상을 방지하기 위해서 0 값으로 채우는 padding 처리를 하기도 한다.
4.2 다양한 필터
1) 스무딩 필터
스무딩 필터는 잡음을 처리하는데 효과적이며 필터값의 평균을 곱하는 방식과 gaussian function을 이용한 방식으로 나뉜다. 하지만 이 방식은 잡음을 제거하다가 물체의 경계를 흐리는 블러링(blurring)이 생기는 부작용이 생긴다.
2) 샤프닝 필터
샤프닝 필터는 스무딩 필터와 반대로 흐린 영상을 조금 더 상세한 부분을 강조하기 위한 필터이다 샤프닝은 스무딩의 반대로 부작용으로 잡음을 확대한다.
3) 엠보싱 필터
엠보싱 필터(Embossing filter)는 영상 처리 기술 중 하나로, 영상에 입체적인 느낌을 부여하기 위해 사용된다. 이 필터는 영상의 각 픽셀을 기준으로 주변 픽셀과의 밝기 차이를 계산하여 입체적인 효과를 만들어내는 역할을 한다. 그래서 이 필터는 입체감을 부여하고 윤곽을 강조합니다.
'Deep Learning > Computer Vision' 카테고리의 다른 글
[Computer Vision] 컴퓨터 비전과 딥러닝 4장- 영역 분할 (0) | 2023.07.14 |
---|---|
[Computer Vision] 컴퓨터 비전과 딥러닝 4장- 캐니 에지 (0) | 2023.07.13 |
[Computer Vision] 컴퓨터 비전과 딥러닝 4장- 에지 검출 (0) | 2023.07.13 |
[Computer Vision] Semantic Segmentation (0) | 2023.06.28 |
[Computer Vision] Object Detection (0) | 2023.06.25 |