여러가지공부/통계적학습(Statistical Learning)

선형회기 R제곱 통계값이란?(Linear Regression, R2, R^2, R Square)

끄적끄적아무거나 2023. 3. 29. 08:04
반응형

 

목차

     

     

     

     

     

    선형회기 R제곱 통계값이란?(Linear Regression, R2, R^2)

     

     

    R제곱 통계값은 선형 회기 모델이 종속 변수에 대한 모델링을 얼마나 잘 표현해주었는지를 알려주는 적합도입니다. 결정계수라고 불리는 R제곱 값은 전체 변동량 중에서 선형 회기 모델에 의해 표현 되어지는 비율을 얘기합니다. 

     

    수식으로 표현하면 아래와 같습니다. 

     

     

    수식1

     

     

     

    수식1에서 RSS는 Sum of Squared Residual 로 SSR로 표현하기도 합니다. 

     

    수식2

     

    RSS는 실제 데이터 값에서 추정값을 빼고 제곱을 취한 값으로 이를 Residual이라고 합니다.

     

     

     

     

    수식1에서 TSS는 Total Sum of Square로 데이터 값에서 평균을 빼고 제곱을 취한 값입니다. TSS의 의미는 선형회기 모델이 만들어지기 전에 데이터의 예측 예러를 가장 잘 표현하는 방식으로 데이터의 평균 값을 취했기 때문에 TSS는 평균과 실제 데이터 사이 차를 의미합니다.

     

     

    수식3

     

    R제곱 값이 1에 가까울 수록 모델의 예측이 잘되었다는 것을 의미 합니다.

    반응형