36. 단순 회귀 분석


r

Overview

회귀 분석에서 단순 회귀 분석에 대해 알아본다.


단순 회귀 분석

제품의 적절성(독립 변수)이 제품의 만족도(종속 변수)에 영향을 주는가에 대한 회귀 분석 수행

귀무 가설 : 제품 적절성은 제품의 만족도에 영향을 미치지 않는다.
연구 가설 : 제품 적절성은 제품의 만족도에 영향을 준다.


선형 회귀 모델 구하기

선형 회귀 모델은 stats 패키지에서 제공하는 lm() 함수를 사용하여 만들 수 있다.

반환 값은 선형 회귀 모델 클래스의 lm 인스턴스이다.

  • 사용 형식 : lm(formula = y ~ x, data = df)
  • formula : 종속변수 ~ 독립변수 형태로 지정한 포뮬러 지정
  • data : 포뮬러를 적용시키고자 하는 데이터 지정

lm() 함수의 리턴 값

회귀 계수 = 절편 + 기울기 Call:
lm(formula = ydata ~ xdata, data = myframe)
Coefficients:
(Intercept) xdata
0.7789 \(\gets\) 절편 0.7393 \(\gets\) 기울기

회귀 모델에 대해 세부적인 내용을 확인하기 위해 summary() 함수를 이용

# 선형 회귀 분석 결과 보기 summary(result)
# Call: 
사용된 포뮬러에 대한 정보
# lm(formula = ydata ~ xdata, data = myframe)
# Residuals: 
잔차에 대한 정보
# Min 1Q Median 3Q Max
# -1.99669 -0.25741 0.00331 0.26404 1.26404
# Coefficients: 
독립 변수(설명 변수) 평가 영역
Estimate 열은 절편과 계수의 추정치
Pr(>|t|) 열은 p-value 
귀무 가설은 절편이 0
p-value 값이 0.05 보다 크면 무의미
바로 뒤에 * 또는 *** 표시된 문자열은 p-value  범위
*, **, ***등이 있다면 유의미한 
# Estimate Std. Error t value Pr(>|t|)
# (Intercept) 0.77886 0.12416 6.273 1.45e-09 ***
# xdata 0.73928 0.03823 19.340 < 2e-16 ***
# ---
# Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
F 통계량
R-squared  결정 계수 또는 상관 계수
독립 변수와 종속 변수와의 상관 관계를 의미해주는 변수
1  가까울수록 가장 이상적인 
# Residual standard error: 0.5329 on 262 degrees of freedom
# Multiple R-squared: 0.5881, Adjusted R-squared: 0.5865
조정 결정 계수 조정 결정 계수 : 결정 계수에 대하여 오차를 감안하여 조정된 결정 계수
# F-statistic: 374 on 1 and 262 DF, p-value: < 2.2e-16
R-squared: 0.5881 값이 독립 변수와 종속 변수와의 상관 관계를 의미
1 가까울수록 변수의 모델이  되었다는 의미
유의 확률이 0.05이상인 경우에는 회귀선이 모델에 부적합
예시에서는 p-value(< 2.2e-16)이므로 적합

단순 회귀 분석 결과 제시 방법

제품의 가격과 품질을 결정하는 제품 적절성은 제품 만족도에 정(正)의 영향을 미칠 것이라는 연구 가설을 검정한 결과, 검정 통계량 t = 19.340, p = <2e-16으로 통계적 유의 수준 하에서 영향을 미치는 것으로 나타났다.

따라서, 연구 가설을 채택한다.

회귀 모형은 상관 계수 R=0.588로 두 변수 간에 다소 높은 상관 관계를 나타내고 있다.

R2=.587 로 제품 적절성 변수가 제품 만족도를 58.7% 설명하고 있다.

또한 회귀 모형의 적합성은 F=374(p=<2.2e-16)으로 회귀선이 모형에 적합하다고 볼 수 있다.


논문 보고서 제시 예제

단순 회귀 분석 결과를 논문/보고서에 제시한 예는 다음과 같다.

아래 예시는 제품 적절성에 따른 제품 만족도 영향 분석을 한 예시이다.

제품 만족도분석 통계량summary() 함수에서 구할 수 있다.

회귀식lm()함수에서 구할 수 있다.

fig01




© 2019. by RaP0d

Powered by aiden