갑자기 이렇게 확률분포에 대한 내용을 작성하게 된 이유는 GAN에 대한 논문을 리뷰하기 위해서이다.
최근 취업준비한다는 핑계로 작년에 공부해왔던 딥러닝 논문, CS231n 등에 대해 잊어버리는 것 같아서 복습차원에서 다시 리뷰해보고자 한다.
GAN을 본격적으로 리뷰하기 전에 확률분포에 대한 개념이 꼭 필요하다.
[확률분포]
확률분포는 확률변수가 특정한 값을 가질 확률을 나타내는 함수를 의미한다.
예로 주사위를 던졌을 때 나올 수 있는 수를 확률변수 X라고 한다면
- 확률변수 X는 1, 2, 3, 4, 5, 6의 값을 가질 수 있다.
- P(X=1)은 1/6
- P(X=1) = P(X=2) = P(X=3) = P(X=4) = P(X=5) = P(X=6)
이러한 확률분포는 도수분표표와 같은 이산확률분포, 정규분포와같은 연속확률분포 두 가지로 크게 구분할 수 있다.
이산확률분포
주사위의 확률값을 확률분포로 나타내면 다음과 같이 이산확률분포로 나타낼 수 있다.
연속확률분포
하지만 키, 몸무게 같이 연속적인 것들에 대해서는 다음과 같이 연속확률분포로 나타낼 수 있다.
확률변수 X의 개수를 정확히 셀 수 없다면 연속확률분포로 생각하면 된다.
EX 정규분포
IQ에 대한 Data라고 생각했을 때 평균이 100, 표준편차가 24인 분포가 정규분포를 따른다고 가정해보겠다.
이때 표준편차가 24이기에 2시그마 즉 148에 해당하는 값은 상위 2%내에 든다고 말할 수 있다.
(표준 정규분포에서 2시그마에 해당하는 값을 보면 0.0228로 약 2%라고 생각할 수 있기 때문)
그렇다면 이러한 확률분포와 GAN이 무슨 연관이 있는지 알아보겠다.
이미지 데이터에 대한 확률분포
이미지 데이터도 벡터나 행렬의 형태로 데이터를 가지고 있을 수 있기 때문에 다차원 특징 공간의 한 점으로 표현될 수 있다. 따라서 이러한 점들이 분포를 형성하게 되고 우리는 이것을 확률분포를 이용할 수 있게 된다.
IQ같은 경우는 하나의 값을 가지는 1차원 데이터로 표현할 수 있지만, 이미지의 경우는 고차원 공간상에 존재하기 때문에 다차원 특징 공간이라고 할 수 있다.
다변수 확률분포 예시
여러 개의 특징을 학습할 수 있다. 다음시간에는 본격적으로 GAN에 대해 알아보고자 한다.
댓글