반응형

파이선 135

[Python]정규분포(가우시안분포)란? 파이썬 랜덤으로 만들고 그래프 그리기(Normal/Gaussian Distribution)

목차 [Python]정규분포(가우시안분포)란? 정규 분포란 영어로는 "Normal Distribution"라고 합니다. 그리고 가우시안 분포(Gaussian Distribution)이라는 이름으로도 사용됩니다. 정규 분포는 독립적(Independent)이고 랜덤(random)으로 생성된 변수(Variable)을 표현한 분포입니다. 벨 형태의 그래프는 통계에서 흔하게 볼 수 있는 형태 입니다. 가령 비행기가 하늘을 날아가면서 발생하는 진동의 분포를 그래프로 그리면 시간이 흐름에 따라 가우시안 분포에 수렴하게 됩니다. 위 수식은 정규 분포 수식으로 확율 밀도를 표현한 식입니다. 수식은 평균값(mean)을 중심으로 표준편차(standard deviation)에 의해 그래프의 퍼짐 정도가 결정 됩니다. 파이썬을..

[Python]확률밀도함수란? 데이터 셋 구현하기(Probability Density Function)

목차 확률밀도함수란(Probability Density Function, PDF)? 확률밀도함수란 연속 확률 변수를 나타내는 함수라고 합니다. 예를 들어 설명하면 어떤 통계학자가 테스트에 대한 시험을 동일 조건으로 여러번 진행하여 만들어진 데이터 셋으로 만든 확률 밀도에 대한 그래프를 만들고 다음 실험에서 특정 값이 발생할 확률 정보를 PDF(Probability Density Function)를 통해 알 수 있게 됩니다. 위 그래프는 Normal distribution 그래프로 평균값이 u이고 분산값이 시그마(σ)일 때로 자연 현상에서 가장 많이 수렴되는 확률 밀도 입니다. 가령 비행기가 날아갈때 공기 저항에 의한 진동에 대한 확률 밀도 함수에 대한 그래프를 그리면 표준 분포(Normal distrib..

[Python] 리스트 값에 필터 적용하기(Numpy, Filter, Mask, 조건 걸기)

목차 파이썬 리스트(List)에 필터 사용하기 리스트의 값을 사용자가 원하는 조건에 맞는 값만 출력하기 위해서는 Numpy의 Filtering 기술을 사용하면 됩니다. Filter를 적용하는 방법은 다양하게 있는 데 예제를 통해 차례 차례 알아 보겠습니다. 파이썬 리스트(List)에 필터 사용하기: True, False 사용하기 예제>> import numpy as np import random x_list = [] for _ in range(3): x_list.append(random.randint(1,10)) numpy_list = np.array(x_list) mask = [True, False, True] print(numpy_list) print(numpy_list[mask]) 4~6번 라인: ..

[Python]리스트 안의 내용 검색 (Numpy, where, search, 값 위치 찾기)

목차 [Python]리스트 안의 내용 검색 리스트의 value(값)을 검색하고 index로 위치 정보를 확인하는 방법으로 파이썬의 넘파이(Numpy)라는 라이브러리에서 제공하는 아래의 method를 사용하시면 됩니다. Numpy.where(조건, 조건에 맞는 값을 바꿀 형태, 조건에 맞지 않는 값 바꿀 형태) 위에서 조건 값만을 입력 할 경우 index 위치 정보만 얻을 수 있습니다. 위 조건 값을 모두 입력할 경우 원하는 조건에 맞추어 리스트(list)안의 값을 변경할 수 있습니다. 아래 예제를 통해 쉽게 이해하실 수 있습니다. Where을 사용해서 값 검색하고 변경도 해보기 검색 예제>> import numpy as np import random a_list = [] for _ in range(10)..

[Python]날짜 더하기 빼기(Numpy, Datetime)

목차 Numpy Dtype Datetime 파이썬의 Numpy라는 라이브러리를 사용해서 데이터 종류를 Datetime으로 설정하면 날짜에 대한 처리를 파이썬에서 할 수 있습니다. 정의 방법은 아래와 같습니다. today = np.array(["2022-01-11"],dtype="datetime64[D]") Numpy에서 데이터 타입 명을 datetime64 라고 설정하면 날짜의 형태로 데이터를 저장합니다. datetime64 라고 사용하는 이유는 datetime 라는 이름은 이미 파이썬에서 사용하고 있어서 Numpy에서는 datetime64를 사용합니다. [D]는 Day를 의미하고 Day 단위로 계산이 가능 합니다. 날짜 더하기 빼기 예제 예제 코드>> import numpy as np Date1 = n..

[Python]Numpy에서 dtype이란? (데이터 종류, Type)

목차 Python Basic Data Type (파이썬 데이터 종류) 파이썬의 데이터 종류는 아래와 같습니다. 정수 실수 Boolean 문자열(string) 복소수 아래는 데이터 종류를 확인하는 예제입니다. 파이선 데이터 종류 확인 예제코드>> print(type(1)) print(type(1.1)) print(type(True)) print(type("hi")) print(type(1+1j)) 결과>> Numpy Data Type (넘피 데이터 종류) 다음은 파이썬의 라이브러리 넘파이(Numpy)에서 제공하는 데이터 종류에 대해 알아 보겠습니다. integer, 표기방법: i Unsigned integer, 표기방법: u float, 표기방법: f complex, 표기방법: c boolean, 표기방법..

[Python]리스트와 Numpy 배열 슬라이싱 방법 (List, slicing, 나누기)

목차 [Python]리스트와 Numpy 배열 슬라이싱 방법 : Syntax 리스트(List)나 Numpy 배열을 조각 내거나 합칠 때 Index 를 사용해서 할 수 있고 동일한 문법이 적용 됩니다. 인덱스(Index) 값은 아래와 같이 정의 됩니다. [start:end] [start:end:step] 콜론으로 2개만 값이 들어가면 시작점과 끝점이고 1개가 더 있을 경우는 step 간격으로 시작 끝점을 표기 한것 입니다. 아래 예제를 통해 이해해보도록 하겠습니다. [Python]리스트와 Numpy 배열 슬라이싱 방법 : [start : end] 예제 코드>> import numpy as np import random a_list = [] for _ in range(10): a_list.append(rand..

[Python]리스트안의 동일 값 개수, 집합, 정렬하기(Numpy.unique)

목차 Numpy Unique 란? 앞서 포스트에서 Numpy를 사용하면 시간을 절얄하고 왜 효율적인지에 대해 설명하였습니다. 이번장에서는 Numpy로 사용할 수 있는 효율적인 함수에 대해 알아보겠습니다. Unique() Numpy Unique 는 Numpy 배열의 값을 검색해서 동일 값을 정리해거나, 정렬, 개수 확인 등을 해줍니다. Sytax는 아래와 같습니다. numpy.unique(배열값, return_index=False, return_inverse=False, return_counts=False, axis=None) 내부에 option 값은 아래 예제를 통해 쉽게 이해하도록 하겠습니다. 리스트(list) 안의 정렬하고 동일 값(Same value, element) 구하기 return_index ..

[Python] Percent, Percentile 이란? 파이썬으로 쉽게 구해보기

목차 Percent, Percentile 이란? Percentile 이란 우리나라말로는 백분위라고 합니다. 통계에서 주로 사용되는 용어로 간단하게 말하면 전체 데이터를 100이라고 하면 백분위를 구하고 싶은 값을 x라고 하면 x 미만에 놓여 있는 사례가 전체 100중에 몇인가가 백분위(Percentile)이라고 할 수 있습니다. 예를들어 한반에 30명이 있고 165cm의 백분위를 구하면 165cm 미만의 학생의 수를 30명으로 나누고 100을 곱하면 백분위가 됩니다. Percent는 백분율이라고 합니다. 전체 수량에서 백분율을 구하고 싶은 데이터가 전체 수량에서 차지하는 비율입니다. 비율에 100을 곱하면 백분율이 됩니다. 파이썬으로 Percentile, Percent 예제 구현하기 Percentile ..

[Python] 리스트에서 가장 많이 나온 값 찾는 scipy의 mode (반복 횟수)

목차 [Python] Scipy.stats mode함수 파이썬의 라이브러리 중에 Scipy는 수학적 계산을 돕는 라이브러리 입니다. Scipy 내에 통계 관련 stats이 있고 stats에서 mode라는 함수가 있습니다. mode 함수는 입력 값으로 받은 list 값 중에 가장 많이 반복되어 나온 값을 출력하고 몇번 반복되었는지를 알려 줍니다. 사용법은 아래와 같습니다. stats.mode(리스트 입력값) 출력 값은 ModeResult 클래스로 나오므로 배열을 사용해서 원하는 값을 불러 올 수 있습니다. 아래 예제를 통해 쉽게 이해하실 수 있습니다. [Python] 리스트에서 가장 많이 나온 값 찾기 예제 코드>> import random from scipy import stats a_list = [] ..

반응형