운동하는 공대생

GAN(Generative Adversarial Networks)(1/3) 본문

Deep Learning

GAN(Generative Adversarial Networks)(1/3)

운동하는 공대생 2022. 10. 18. 14:05
728x90
반응형

Intro

이전 Synthetic Data  글에서 합성 데이터에 대한 이야기를 했었다. 이런 합성 데이터를 생성을 하기 위해서 최근 가장 주목을 받고 있는 GAN(Generative Adversarial Networks)이라는 개념을 설명을 하겠다.

 

Synthetic Data(합성 데이터)

What is Synthetic Data 머신러닝 모델을 만들고 적용을 시켜 예측을 하다 보니 데이터의 양이 너무 적어서 예측의 정확도가 좋지 않은 경우가 생각보다 많이 있었다. 이런 상황에서 예측의 정확도를

seungwoni.tistory.com

 

 GAN이 처음 등장한 2014년 이미지 생성을 위해 GAN이론이 등장하게 되었다. 이 이론은 현재 데이터 분야에서 아주 주목을 받고 있는 이론이며 지금까지도 관련 논문이 지속적으로 연구가 되고 있다.

Prior information

GAN 이론에 들어가기 앞서 GAN 이론의 이해를 돕기 위한 선행 정보를 이야기를 해보겠다.

확률 분포(probability distribution)

정의: 확률 분포(確率 分布, probability distribution)는 확률 변수가 특정한 값을 가질 확률을 나타내는 함수를 의미한다. 예를 들어, 주사위를 던졌을 때 나오는 눈에 대한 확률변수가 있을 때, 그 변수의 확률분포는 이산 균등 분포가 된다.
출처

 

확률 분포 - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전.

ko.wikipedia.org

 

 확률 분포의 가장 쉬운 예시로는 주사위를 예로 들수 있다. 주사위를 굴렸을 때 눈금이 1 이 나올 확률은 전체의 1/6 확률이다 이때 이 상황에서 확률 변수 x(주사위 눈금)에 대하여 확률 분포는 1/6 인 셈이다.

이산 확률 분포(discrete probability distribution)

 이산 확률 분포는 위의 예시에서 주사위의 상황에 해당이 된다. 주사위를 굴려서 나오는 눈금의 확률은 각각 1/6로 일정하며 연속적이지 않으며 값의 경우가 셀 수 있는 가산의 수(자연수의 집합)인 경우가 이산 확률 분포 케이스라고 볼 수 있다.

연속 확률 분포(continuous probability distribution)

 연속 확률 분포는 이산 확률 분포와는 다르게 연속적인 수(키, 시간, 달리기 성적)등을 확률로 나타낸 값이며 확률 변수 x의 개수를 정확하게 측정을 하는 것이 어렵다. 이런 연속 확률 분포의 적용 사례는 우리 주변에서 찾아보자면 IQ를 예시로 드는 것이 가능하다. IQ는 확률 변수가 연속적인 값으로 가산의 수 가 아니다. 그래서 이를 정규 분포로 나타내어서 상위 그룹과 하위그룹으로 나누어 확률의 분포를 나타낸다.

정규 분포 예시 사진

Probability Distribution in image

 위 사진처러 2개 이상의 변수가 적용되어 분포를 나타낸 것이 다변수 확률 분포라고 한다. 이는 GAN이론에서 이미지 데이터를 선택하는 방식에서 중요하게 다뤄진다. 

728x90
반응형

'Deep Learning' 카테고리의 다른 글

[Deep Learning] 다층 퍼셉트론 이론과 역전파  (0) 2022.12.15
Deep Learning(딥러닝)  (0) 2022.11.17
GAN(Generative Adversarial Networks)(3/3)  (0) 2022.10.21
GAN(Generative Adversarial Networks)(2/3)  (0) 2022.10.18
Softmax fuction  (0) 2022.10.06
Comments