목록혼공 (6)
운동하는 공대생

1. Bias-Variance Tradeoff Bias-Variance 문제를 이야기하기에 앞서 먼저 Underfitting, Overfitting 에 대하여 이야기를 먼저 해보겠다. 그림에서 보이는 것처럼 Overfitting 은 데이터를 설명하는 모델이 너무 데이터 편향적으로 학습을 진행하면서 발생하며 훈련 과정에서는 Loss 가 적지만 Test 하면서 모델의 성능이 떨어지는 문제가 발생합니다. Underfitting 은 데이터를 설명하는 모델이 충분히 데이터를 설명하지 못하며 보통 훈련하는 데이터의 양이 적거나 모델이 단순하면 발생합니다. 수학적 해석 Expected Loss 정답을 나타내는 y 값에서 모델이 예측하는 값의 차이로 계산이 된다. 여기서 식을 전개를 해본다면 결국에는 Variance,..

0. Intro 데이터는 보통 여러 차원(High-dimensional)으로 구성이 되어 있다. 이런 여러 고차원 데이터는 데이터를 분석하는 과정에서 시각화를 하거나 데이터에 대한 분석을 진행하기에 어려움이 존재한다. 그래서 이런 고차원의 데이터를 차원 축소 방식 PCA를 통해서 표현한다. 1. PCA PCA 의 추론 과정의 아이디어는 차원을 축소하는 axis 를 잡고 데이터와 axis 축의 projection을 구한다음 그 projection들의 값들의 분산이 최소가 되도록한다면 데이터들이 축소된 차원에서 분산이 가장 큰 특성을 가진 방향으로 축이 만들어진다는 아이디어이다. 더 자세하게 설명을 아래에서 해보겠다. 1.1 Maximum variance formulation PCA는 결국 차원을 축소하여..

0. Introduction 먼저 3차원 물체에 대한 영상에서 2차원으로 카메라가 정보를 습득하는 거처럼 3차원 영상을 2차원으로 변환을 진행을 하는 것을 투영변환(projective transformation)이라고 한다. 이때 3차원 영상이 2차원으로 투영 변환한 두 2차원 영상에 대하여 대응점을 매칭시키는 방식 중 하나가 호모그래피라고 한다. 사진을 예로 들면 X'를 표시하는 2차원 영상에서의 두 점을 매칭하는 것이다. 1. Homography 호모그래피는 3*3 행렬로 표현되며 대응점들의 행렬곱으로 표현이 가능하다. 아래의 식을 참고하면 2차원 공간상에서의 영상에서 특정 지점이 x, y로 표현이 된다면 서로 다른 두 영상에서 좌표를 매칭하는 행렬 즉 호모그래피가 존재하게 된다. 이제 이렇게 두 2..

영역 분할이란 영상에서 물체에 영억을 특정하는 방식이다. 이전까지 에지를 활용해서 경계선을 처리하는 방식에 대하여 알아보았는데 영역 분할은 에지들로만 영역을 분류하기에는 조금 부족함이 있어서 사용한다. 1 단순 영역 분할 가장 기본적이고 단순한 방식의 영역 분할은 이진화 알고리즘을 사용하거나 군집화 알고리즘을 사용하는 것이다. 군집화 알고리즘은 보통 (RGB) 값을 통해서 3개 값으로 표현된 화소의 샘플을 군집화하여서 분할한다. 2. 슈퍼 화소 분할 픽셀 화소 보다는 크고 영상의 물체보다는 작은 영역으로 분할하는 방식으로 이런 분할하는 화소를 슈퍼 화소(super-pixel)이라고 합니다. -SLIC(Simple Linear Iterative Clustering) k-means clustering 방식과..

이제 이전까지는 에지를 더욱 잘 표현하기 위한 여러 가지 방법을 이용하였다. 그렇다면 이제 원래의 영상에서 에지를 검출한 영상으로 변환을 했다면 이제 그 에지를 통해서 물체에 대한 경계를 어떻게 에지들의 연결을 통해서 표현하는지 그 연결 방식에 대하여 말을 하겠다. 1. 허프 변환 먼저 이론에 대하여 설명을 하겠다. 위의 그림처럼 두 점을 지나는 y=ax+b라는 방정식이 존재할 때 기울기 a , y절편 b를 식에서 표현한다. 이것을 다시 a, b라는 공간으로 변환을 하면 빨간색 선은 원래 x, y 공간에서 빨간 점을 지나는 모든 직선들의 조합들을 표시한 것이고 a, b 공간에서의 주황선은 원래의 공간 x, y에서의 주황색 점을 지나는 모든 선의 조합들이다. 즉, 각 점을 지나는 모든 직선 중 두 점을 모..

1. 에지 검출 에지 검출 알고리즘은 물체 영상에서 물체 경계가 변하면서 발생하는 명암의 급격한 변화의 특성을 활용한다. 먼저 영상을 미분하는 이유는 기존 영상에서 미분을 통해서 기준점에서의 변화량을 측정하는 게 가능해서 이다. 이렇게 변화량에 대한 차이를 영상의 컨볼루션을 취하여 에지 영상을 만든다. (위의 그림에서는 (-1,1) 필터로 컨볼루션 한다.) 1.1 에지 연산자 영상에서는 보통 한번의 에지의 변화만 있는 게 아니라 여러 화소에 걸쳐 명암이 변하는 램프 에지(ramp edge)가 발생한다. 1차 미분을 통해서 (c)처럼 에지 영상을 구하면 에지가 구분이 된다. 하지만 두께가 있는 에지가 검출되며 위치 찾기(localization)의 문제가 발생한다. 그렇게 다시 한번 2차 미분을 진행하면 연..