반응형

여러가지공부 216

선형회기와 표준 오차(Linear Regression, Standard Error)

목차 표준 오차(Standard Error)란? 표준 오차를 이해하기 위해서는 기본적인 모집단(Population)과 표본 집단(Sample)에 대한 평균, 분산, 표준 분산에 대해 이해가 필요 합니다. 해당 카테고리에 내용들을 정리해 놓았으니 참조하시길 바랍니다. 그림과 같이 모집단에서 중복 순열로 샘플들을 뽑아내면 각 샘플에서의 평균을 구할 수 있습니다. 모집단의 평균기호에 바 기호를 붙여서 샘플의 평균 기호를 표기하였습니다. 여기서 샘플들의 평균을 모아서 아래와 같이 평균을 내면 모집단의 평균이 됩니다. 그리고 표본 집단의 평균으로 분선을 구하였더니 수식2와 같이 모집단의 분산에 n으로 나눠준 값이 나왔습니다. 앞서 포스터(https://scribblinganything.tistory.com/687..

t 분포란? 자유도 n-1 사용 이유 쉽게 풀이(t-distribution)

목차 t 분포(t-distribution)란? 앞서 포스트에서 표본(Sample) 집단에서의 표본 평균, 표본 분산을 구하는 방법에 대해 알아보았습니다. 모(Population) 집단에서 표본 집단을 가지고 표준 정규 분포(Standard Normal Distribution)으로 만들면 아래와 같이 나옵니다. 수식1과 같이 X를 표준화하면 표준 정규 분포를 얻을 수 있습니다. 하지만 여기서 문제는 모집단의 표준편차(σ)를 구하기가 힘들다는 것입니다. 표본을 사용하는 이유가 모집단으로 데이터를 다 처리하기 힘들기 때문에 표본을 만든 것이기 때문에 수식1과 같이 모집단의 표준편차를 사용해서 정립하는 것이 현실에 맞지 않기 때문입니다. 그래서 모집단의 표준편차가 아닌 표본 집단의 표준편차(S)를 사용해서 표준..

정규 분포란? 표준화(X, Z값 변환) 쉽게 정리하기(수식, 테이블, Normal Distribution, Standard Distribution)

목차 정규분포란(Normal Distribution)? 그림1과 같이 벨 모양과 같이 생긴 형태의 그래프를 정규분포 그래프라고 합니다. 정규분포는 평균값(μ)과 분산(σ^2)에 의해 그래프 특성이 결정 됩니다. 평균에 의해 벨의 중심점이 결정됩니다. 그리고 분산 값에 의해 퍼짐 정도가 결정 됩니다. 그래프의 수식은 위 수식1과 같이 결정 됩니다. 또는 간단하게 아래 수식2와 같이 표현합니다. 평균(Mean)과 분산(Variance)만 있으면 그래프를 그릴 수 있기 때문입니다. 정규분포를 사용하는 이유와 언제 사용 하나? 사실 고등학교때는 무턱대고 위 수식으로 문제를 푸는 것에 집중했지만 사회를 나와서 이과를 다니다 보니 산업의 많은 분야에서 정규분포를 사용함을 알았습니다. 제가 생각하는 정규분포의 이용은..

모집단과 표본집단의 평균,분산,표준편차, n-1로 나누는 이유, 수식 정리(mean, variance, standard deviation)

목차 모집단(Population)과 표본집단(Sample) 수식 정리 모집단/표본집단 평균(Population / Sample Mean) 모집단/표본집단 분산(Population / Sample Variance) 모집단/표본집단 표준편차(Population / Sample Standard Deviation) 모집단이란 실제 가지고 있는 모든 데이터 샘플을 의미 합니다. 표본 집단은 모집단 중에 일부를 샘플로 취해서 모집단의 평균, 분산, 표준 분산을 추정하는 목적으로 사용 됩니다. 표본집단(Sample) n-1 샘플로 나누는 이유 우선 수식을 떠나서 개념적으로 쉽게 이해해보도록 하겠습니다. 표본 집단을 사용하는 사용자가 N개의 모집단 데이터에서 n개의 샘플을 가져온다고 생각해보겠습니다. 여기서 우리는 평..

[머신러닝]소프트맥스 회귀란?(Softmax Regression)

목차 해당 포스트(Machine Learning)는 유투브 혁펜하임의 강의 내용을 듣고 제 생각대로 정리한 내용이라 틀린 내용이 있을 수 도 있습니다. Machine Learning 소프트 맥스 회귀란? 앞서 로지스틱 회귀 이론에 대해 알아보았습니다(https://scribblinganything.tistory.com/682). 로지스틱 회귀란 입력 값을 받고 이 값이 해당 라벨에 포함되는지를 확률적인 값으로 출력 해주었습니다. 예제로 여자 사람의 사진일 경우 1에 가까운 값을 출력 하고 그 외는 0에 가까운 값을 출력하는 로직이었습니다. 소프트 맥스 회기란 앞서 로지스틱이 하나의 출력만을 구분 지었다면 이번에는 출력을 벡터(Vector) 형식으로 보내서 여자 사람, 남자 사람, 고양이 등을 벡터에 값으..

베이즈 이론(Bayes Theorem)이란? 수식, 사용목적, 쉽게 이해하기

목차 베이즈 이론(Bayes Theorem)이란? 베이즈 이론을 이해하기 위해서는 조건부 확률에 대해 이해하여야 합니다. 수식1을 조건부 확률(Conditional Probability)라고 합니다. A라는 사건이 발생했을 때의 조건에서의 B라는 사건이 발생할 확률입니다. 동일하게 B라는 사건이 발생했을 때의 조건에서 A라는 사건이 발생할 확률은 수식2와 같이 표현할 수 있습니다. 수식1과 수식2를 이용하면 아래와 같이 구할 수 있습니다. 수식3을 이용해서 아래와 같은 수식을 만들어 낼 수 있습니다. 위 수식4가 이번 포스터의 목적인 베이즈(Bayes) 이론의 수식 입니다. 여기서 수식4에 대한 명명을 아래와 같이 하고 있습니다. P(B|A) : 사후 확률(Posterior) P(B) : 사전 확률(Pr..

마르코브(Markov Chain) 체인이란? 파이썬(Python) 예제 실습

목차 마르코브(Markov Chain) 체인이란? 마르코브 체인은 통계적(Stochastic) 모델로 다음 상태의 사건이 발생할 확률에 대해 정의 합니다. 마르코브 체인을 설명할 때 중요한 요소는 아래의 두가지 입니다. 현재 상태(Current State) 다음 행동(Next Action) 마르코브 체인의 핵심은 각 이벤트의 확률은 이전 상태(State)에만 영향을 받는 다는 것입니다. 이것이 가능한 이유는 현재 상태가 과거의 확률적인 정보를 다 포함하고 있기 때문입니다. 예를 들어 위 그림1과 같이 음식을 먹을 확률이 정해져 있을 경우 현재 상황이 3월 20일인 상태(State)로 가정하고 20일에 한식을 먹고 3월 21일에 한식을 먹을 확률을 행렬로 표현하면 아래와 같습니다. 그림2의 행(Row)이 ..

[머신러닝]로지스틱회귀란?(Logistic Regression, 시그모이드 함수)

목차 해당 포스트(Machine Learning)는 유투브 혁펜하임의 강의 내용을 듣고 제 생각대로 정리한 내용이라 틀린 내용이 있을 수 도 있습니다. Machine Learning 로지스틱회귀란?(What is Logistic Regression?) 앞서 퍼셉트론(Perceptron)에 대해 살펴 보았습니다(https://scribblinganything.tistory.com/674). 퍼셉트론이란 활성화 함수에 스텝 함수를 넣어서 -1 아니면 1이 되게 출력을 하였습니다. 로지스틱 회귀는 퍼셉트론과 유사한데 활성화 함수에 넣는 값이 Step Function이 아닌 시그모이드 함수(Sigmoid Function)를 넣어서 출력을 처리 합니다. 위 그림과 같은 형태가 시그모이드 함수의 그래프 입니다. 그..

[선형대수학] 행렬의 Rank란? (Matrix)

해당 포스트(Linear Algebra)는 유투브 혁펜하임의 강의 내용을 듣고 제 생각대로 정리한 내용이라 틀린 내용이 있을 수 도 있습니다. [선형대수학] 행렬의 Rank란? (Matrix) 행렬에서 rank의 의미는 행렬이 가지는 독립적인 Column이나 Row의 수를 의미 합니다. 독립(Independent)의 의미는 https://scribblinganything.tistory.com/676 포스트를 통해 참조 하시면 됩니다. 독립적인 벡터가 결국 표현할 수 있는 차원의 수를 의미 했습니다. 그렇기 때문에 독립적인 Column의 수는 Rank이고 Rank의 개수가 Column Space를 표현하는 차원의 수를 의미 합니다. 예를 들어 알아보겠습니다. 위 수식1의 독립 Column 벡터의 수는 앞서..

[선형대수학]직교행렬, Orthogonal, Orthonormal의 의미, 역행렬, 항등행렬, 대각행렬(Inverse, Identity, Diagonal Matrix)

목차 해당 포스트(Linear Algebra)는 유투브 혁펜하임의 강의 내용을 듣고 제 생각대로 정리한 내용이라 틀린 내용이 있을 수 도 있습니다. 직교행렬(Orthogonal Matrix)이란? 위 벡터(Vector)들은 Orthonormal 벡터라고 불립니다. Orthonormal은 서로가 직각을 이뤄서 Orthogonal 하고 Normalized 되어서 크기가 1인 벡터를 의미 합니다. Orthogonal 행렬이란 이러한 Orthonormal 한 벡터를 모은 행렬을 의미합니다. 위 수식1로 직교행렬을 만들면 위 수식2와 같이 만들 수 있습니다. 역행렬(Orthogonal)과 항등행렬(Identity)이란? 수식3과 같이 어떤 함수에 항등행렬을 곱하면 자기 자신이 나오게 만들어 주는 행렬을 항등행렬이..

반응형