파이썬(Python)/numpy

[Python]확률밀도함수란? 데이터 셋 구현하기(Probability Density Function)

끄적끄적아무거나 2022. 1. 17. 09:07
반응형

 

목차

     

     

     

     

     

    확률밀도함수란(Probability Density Function, PDF)? 

    By Jhguch at en.wikipedia, CC BY-SA 2.5, https://commons.wikimedia.org/w/index.php?curid=14524285

     

     

    확률밀도함수란 연속 확률 변수를 나타내는 함수라고 합니다. 

    예를 들어 설명하면 어떤 통계학자가 테스트에 대한 시험을 동일 조건으로 여러번 진행하여 만들어진 데이터 셋으로 만든 확률 밀도에 대한 그래프를 만들고 다음 실험에서 특정 값이 발생할 확률 정보를 PDF(Probability Density Function)를 통해 알 수 있게 됩니다.

     

    위 그래프는 Normal distribution 그래프로 평균값이 u이고 분산값이 시그마(σ)일 때로 자연 현상에서 가장 많이 수렴되는 확률 밀도 입니다. 가령 비행기가 날아갈때 공기 저항에 의한 진동에 대한 확률 밀도 함수에 대한 그래프를 그리면 표준 분포(Normal distribution)를 따라 갑니다.

     

     

     

    파이썬으로 확률밀도함수(Probability Density Function, PDF) 데이터 만들기

     

    예제 코드>>

    from numpy import random
    
    x_list = []
    for _ in range(5):
        x_list.append(random.randint(1,10))
    
    pdf_list = random.choice(x_list, p=[0.05, 0.05, 0.2, 0.3, 0.4], size=(100))
    
    print(x_list)
    print(pdf_list)

    3~5번 라인: 1~10사이 랜덤값 5개로 리스트 만들기

    7번 라인: 5개 리스트 값에 확률 밀도 적용해서 데이터 만들기

     

     

    결과>>

    [6, 4, 5, 8, 1]
    [5 8 1 4 6 5 5 6 1 8 8 1 5 8 8 1 1 8 1 1 1 4 5 1 8 5 5 5 6 1 8 5 8 1 1 8 6
     1 8 1 5 5 8 8 5 8 8 5 8 1 8 8 5 1 1 8 8 1 8 1 8 8 6 1 8 5 1 8 1 5 1 8 5 8
     1 4 1 4 1 1 1 8 1 5 8 1 5 8 6 5 5 1 8 8 1 8 1 1 8 5]

     

     

    반응형