목록ML (51)
운동하는 공대생

0. Intro 지역 특징에 대한 탐색은 물체에 대학 지역 즉 여러 영상에서 어떤 물체를 탐지하거나 탐색하기 위해서 물체에 대한 부분을 표시하는걸 지역이라고 이야기를 한다. 이때 몇 가지 이 지역에 대한 특성들이 있다. -repeatability : 같은 물체가 서로 다른 두 영상에 나타났을 때 첫 번째 영상에서 검출된 특징이 두번째 영상에서도 같은 위치에 높은 확률로 검출 -invariance : 물체의 이동, 회전, 스케일, 조명 변환이 일어나도 값은 비슷해야한다. -discriminative power : 물체의 다른 곳에서 추출된 특징과 두드러지게 달라야 한다. -locality: 작은 영역을 중심으로 -적당한 양: 물체를 추적하기 위해서 적당한 양의 대응점이 존재해야 한다. -계산 효율: 실시간..

이전까지는 영역에 대한 분할을 자동적으로 영상 전체에서 진행을 하였다. 하지만 이런 분할을 사용자가 원하는 분할을 하지 못하는 문제가 있었고 이런 문제를 해결하기 위해서 대화식 분할의 아이디어가 되었다. 1. 대화식 분할 1.1 능동 외곽선 능동 외곽선의 원리는 초기 곡선에서 시작해서 최적의 상태를 능동적으로 찾아가는 방식이다. - 수식 E(internal) = 내부 에너지로 곡선이 매끄러운 모양이 되도록 유도 E(image) = 영상 에너지는 물체의 경계에 에지가 나타난다는 사실에 기반하여 곡선이 에지에 위치하도록 유도 E(domain) = 도메인 에너지는 분할하려는 특정 물체의 모양 정보를 잘 유지하도록 유도 이렇게 에너지들의 총합들을 계산하고 이것을 최소가 되도록 하여 최적화를 진행한다. 1.2 G..

영역 분할이란 영상에서 물체에 영억을 특정하는 방식이다. 이전까지 에지를 활용해서 경계선을 처리하는 방식에 대하여 알아보았는데 영역 분할은 에지들로만 영역을 분류하기에는 조금 부족함이 있어서 사용한다. 1 단순 영역 분할 가장 기본적이고 단순한 방식의 영역 분할은 이진화 알고리즘을 사용하거나 군집화 알고리즘을 사용하는 것이다. 군집화 알고리즘은 보통 (RGB) 값을 통해서 3개 값으로 표현된 화소의 샘플을 군집화하여서 분할한다. 2. 슈퍼 화소 분할 픽셀 화소 보다는 크고 영상의 물체보다는 작은 영역으로 분할하는 방식으로 이런 분할하는 화소를 슈퍼 화소(super-pixel)이라고 합니다. -SLIC(Simple Linear Iterative Clustering) k-means clustering 방식과..

이제 이전까지는 에지를 더욱 잘 표현하기 위한 여러 가지 방법을 이용하였다. 그렇다면 이제 원래의 영상에서 에지를 검출한 영상으로 변환을 했다면 이제 그 에지를 통해서 물체에 대한 경계를 어떻게 에지들의 연결을 통해서 표현하는지 그 연결 방식에 대하여 말을 하겠다. 1. 허프 변환 먼저 이론에 대하여 설명을 하겠다. 위의 그림처럼 두 점을 지나는 y=ax+b라는 방정식이 존재할 때 기울기 a , y절편 b를 식에서 표현한다. 이것을 다시 a, b라는 공간으로 변환을 하면 빨간색 선은 원래 x, y 공간에서 빨간 점을 지나는 모든 직선들의 조합들을 표시한 것이고 a, b 공간에서의 주황선은 원래의 공간 x, y에서의 주황색 점을 지나는 모든 선의 조합들이다. 즉, 각 점을 지나는 모든 직선 중 두 점을 모..

1. 에지 검출 에지 검출 알고리즘은 물체 영상에서 물체 경계가 변하면서 발생하는 명암의 급격한 변화의 특성을 활용한다. 먼저 영상을 미분하는 이유는 기존 영상에서 미분을 통해서 기준점에서의 변화량을 측정하는 게 가능해서 이다. 이렇게 변화량에 대한 차이를 영상의 컨볼루션을 취하여 에지 영상을 만든다. (위의 그림에서는 (-1,1) 필터로 컨볼루션 한다.) 1.1 에지 연산자 영상에서는 보통 한번의 에지의 변화만 있는 게 아니라 여러 화소에 걸쳐 명암이 변하는 램프 에지(ramp edge)가 발생한다. 1차 미분을 통해서 (c)처럼 에지 영상을 구하면 에지가 구분이 된다. 하지만 두께가 있는 에지가 검출되며 위치 찾기(localization)의 문제가 발생한다. 그렇게 다시 한번 2차 미분을 진행하면 연..

1. Intro 컴퓨터 비전과 딥러닝 책의 3장 내용을 정리한 내용입니다. 3장에서는 이미지, 영상 데이터를 어떻게 데이터화시키는지를 설명하는 장이다. 이미지나 영상 데이터는 고차원은 다분광, 초분광 같은 영상들도 있지만 보통 RGB로 구성된 영상으로 예시를 많이 진행했다. 2. 이진 영상 2.1 이진화 이진화란 maxtrix 형식으로 표현된 데이터에서 임곗값 T를 기준으로 T 보다 크면 1 적으면 0 이런 식으로 데이터를 단순히 이진화시킨다. 2.2 오츄 알고리즘 전체 이미지에서 적정한 임곗값을 먼저 계산하여 임곗값을 정한다. 2.3 연결 요소 connected component labeling 이라고도 하며 근처에 있는 같은 데이터를 연결 지어서 분류해 주는 방식이다. 2.4 모 폴로지 영상을 변환하..

1. Intro 이번에 새로운 프로젝트로 AutoML에 대한 인프라를 구축하는 프로젝트를 시작하게 되었습니다. 그래서 이번에 프로젝트를 들어가기 이전에 내용을 한번 정리하고 AutoML에 대하여 간단하게 설명하겠습니다. 2. What is AutoML AutoML은 "Automated Machine Learning"의 약어로, 기계 학습 모델을 자동으로 만들고 최적화하는 기술을 말합니다. 이 기술은 인공지능 모델을 개발하는 데 필요한 일련의 과정을 자동화하여, 개발자가 더 적은 노력으로 더 나은 결과물을 얻을 수 있도록 합니다. AutoML은 전통적인 기계 학습 모델 개발 방법의 몇 가지 한계를 극복할 수 있습니다. 기존에는 데이터 전처리, 특징 추출, 모델 선택 및 하이퍼파라미터 튜닝 등 다양한 작업을..

1. Features 이미지 상에서 존재하는 공통 특정 패턴에 대한 이미지를 모양을 정의한다. 각각 생성한 패턴의 이미지는 2차원의 작은 이미지 형태로 표시하며 패턴을 각각 이미지에 위치시켜서 이미지 패턴이 얼마나 겹치는지를 수치적으로 정의가 가능하다. 2. Convolution 각각의 생성한 패턴을 이미지에 매칭을 시켜서 수치적으로 환산을 하는 방식을 convolution 방식이라고 한다. 이 방식은 각각 생성한 패턴을 이미지에 대조해서 각 자릿수를 곱하여 총합의 평균으로 그 이미지와 패턴의 매칭되는 정도를 수치화한다. 이때 패턴과 이미지가 같은지 다른지를 각각의 픽셀 단위로 계산이 이루어지며 만약 같은 부분이라면 1 ( 1 * 1 =1 or -1 * -1 =1 )다르면 -1 ( 1 * -1 = -1 ..