스타의 도서관/통계학

R을 이용한 통계 분석 - 단순회귀분석

스타(star) 2012. 12. 1. 04:52
단순회귀모형은 이 모형을 회귀계수로 볼 때도 선형이고, 독립변수로 볼 때도 선형이며, 독립변수가 단 하나뿐이므로 단순회귀 모형이라고 합니다.

이번에는 R을 이용해서 간단히 회귀 분석을 해보도록 하겠습니다.



market.txt


이번에 사용할 데이터 입니다. 광고료에 따른 효과에 관한 데이터 파일입니다.


#데이터를 market이라는 변수에 넣기

> market <- read.delim("~/Documents/market.txt")


#market.out이라는 이름으로 회귀 분석하기

> market.out <- lm(Y~X, data=market)

> summary(market.out)


이를 입력하면 다음과 같은 출력 결과물들을 얻게 됩니다.


하나씩 분석해 보겠습니다.


회귀모형 잔차의 다섯수치요약입니다. 최소, 1사분위수, 중앙값, 3사분위수, 최대값을 보여줍니다.


추정값은 적합된 회귀계수를 나타냅니다. 표준 오차는 회귀계수의 표준 오차를, t값은 회귀곗가 0인지를 검정하기 위한 t-통계량이고, Pr(>|t|)는 회귀계수가 0인지를 검정하기 위한 유의확률을 나타냅니다. 따라서 적합된 모형은

Y = -2.2696 + 2.6087X

이고, 기울기 b1의 표준오차 는 0.3878, 귀무가설 H0:b1=0에 대한 검정 통계량은 6.726이고, 유의확률 p값은 0.000149로서 유의수준 a=0.001에서 유의하다는걸 나타냅니다.




오차분산 시그마제곱의 추정값 MSE의 제곱근이 2.631임을 보여줍니다. 결정계수R제곱은 0.8497이고, F에 대한 검정통계량은 45.24입니다.


마지막으로 그래프를 그리면 다음과 같네요. 산점도와 적합된 회귀직선만 표시해 보겠습니다.

>plot(market)