여러가지공부

확률분포함수, 누적분포함수, 가우시안분포란? 정말 쉬운 예제로 이해해보기(PDF, CDF, Gaussian)

끄적끄적아무거나 2021. 5. 26. 11:17
반응형

확률분포함수, 누적분포함수, 가우시안분포란?


확률분포함수란? (PDF, Probability distribution function)

 

어떤 일련의 사건을 확률변수(random variable)를 이용해서 확률값을 실수로 표현하고, 분포 그래프를 알면 해당 이벤트의 확률적 특성을 알 수 있게 된다.

그림1

그림1과 같이 간단히 동전을 예로 들어 설명하면 동전을 던졌을 때 앞면과 뒷면이 나올 확률을 확률분포함수(PDF, Probability distribution function)로 표현할 수 있다. 여기서 앞면이냐 뒷면이냐가 확률변수(random variable) 이다. PDF는 소문자 f(x)를 사용해서 x값 중에 확률변수 값이 정해지면 그 변수가 나올 확률을 아래 그림처럼 표현해준다. 참고로 그림3은 대칭 그래프이다.

그림3

확률분포함수(PDF, Probability distribution function) 특징은 아래와 같이 크게 3가지로 정의할 수 있다.

그림4

그림4의 수식에서 전체 적분이 1이라는 의미는 확률상 100프로라는 의미이다. 0은 발생안한다는 의미이다. 그리고 대문자 F(x)로 표기한 것은 누적분포함수(CDF, Cumulative distribution function)이다. 

 

 


누적분포함수란? (CDF, Cumulative distribution function)

 

간단히 말하면 앞서 설명한 앞서 설명한 확률분포함수(PDF, Probability distribution function) 의 적분 값이다. 

 

F(x) = P(X ≤ x) 

 

위 수식으로 표현 되는데 의미는 P는 X라는 확률 변수를 넣었을때 발생할 확률 값인데 X ≤ x 로 함으로써 X까지 발생할 모든 확률을 합친 값이다. CDF를 그래프로 표기하면 아래와 같다. 

그림5

그림5와 같이 x값이 무한대로 가면 1에 수렴하고 마이너스 무한대로 가면 0에 수렴한다. 즉, 무한대로 간다는 것은 모든 확률변수를 포함하므로 무조건 발생하기때문에 1인것이다. 

 

 


가우시안 분포란? (Gaussian distribution)

 

가우시안(Gaussian distribution) 분포는 다른 표현으로 정규분포(Normal distribution)이라고도 한다. 자연 현상에서 나타나는 확율을 수식적으로 표현하면 가우시안 분포를 수렴함을 확인하였다. 이에 대한 자세한 증명은 나의 이해 범위를 넘어가서 설명을 못하지만 코딩과 진동을 공부하는 나의 입장에서 모든 자연계의 확율은 가우시안 분포를 따라간다고 이해하는 정도면 될 듯하다. 

 

그림6

그림6과 같이 가우시안 분포 식이 나온다. 앞서 확률밀도함수의 f(x)에 대입하면 된다. 

 

가우시안 확률 분포

위 그림은 위키피디아에서 가져온 그림으로 가우시안 확률 분포이다. y축을 f(x)로 생각하면 된다. σ 는 분산이고 그림에서는 u이고 식에서는 m인 값은 평균값이다. 평균이 0이고 분산이 1인 가우시안 분포식을 표준정규분포(Standard normal distribution)이라고 하고 적분 값을 Q함수라고 한다. 

 

 

 

반응형