정량적 데이터 분석에 대한 기본 통계 접근법
선형 회귀 모델은 두 변수 또는 요인 간의 관계를 보여 주거나 예측하는 데 사용됩니다. 예상되는 요소 (방정식이 해결 하는 요소)를 종속 변수. 종속 변수의 값을 예측하는 데 사용되는 요소를 독립 변수라고합니다.
좋은 데이터가 항상 완전한 이야기를 말하는 것은 아닙니다. 회귀 분석은 일반적으로 변수간에 상관 관계가 존재 함을 입증하므로 연구에 사용됩니다.
그러나 상관 관계는 인과 관계와 동일하지 않습니다 . 데이터 포인트에 잘 맞는 간단한 선형 회귀 분석의 라인조차도 인과 관계에 대해 확실한 것을 말하지 못할 수 있습니다.
단순 선형 회귀 분석에서 각 관측치 는 두 개의 값으로 구성됩니다. 하나의 값은 종속 변수에 대한 것이고 하나의 값은 독립 변수에 대한 값입니다.
- 단순 선형 회귀 분석 회귀 분석의 가장 간단한 형태는 종속 변수와 하나의 독립 변수를 사용합니다. 이 간단한 모델 에서 직선은 종속 변수와 독립 변수 간의 관계를 근사합니다.
- 다중 회귀 분석 회귀 분석에서 둘 이상의 독립 변수가 사용되면 모델은 더 이상 단순한 선형 변수가 아닙니다.
단순 선형 회귀 모델
간단한 선형 회귀 모델은 다음과 같이 표현됩니다. y = ( β 0 + β 1 + Ε
수학적 관례에 따라 간단한 선형 회귀 분석에 포함 된 두 가지 요인을 x 및 y 로 지정합니다.
y 가 x 와 관련되는 방식을 설명하는 방정식을 회귀 모델이라고 합니다. 선형 회귀 모델에는 Ε 또는 그리스 문자 엡실론으로 표시되는 오류 항이 포함됩니다. 오류 항은 x 와 y 사이의 선형 관계로 는 설명 할 수없는 y 의 변동성을 설명하기 위해 사용됩니다.
또한 연구 대상 인구를 나타내는 매개 변수가 있습니다. ( β 0 + β 1 x )로 표시되는 모델의 매개 변수 .
단순 선형 회귀 모델
간단한 선형 회귀 방정식은 다음과 같이 표현됩니다. Ε ( y ) = ( β 0 + β 1 x ).
단순 선형 회귀 방정식은 직선으로 그래프 화됩니다.
( β 0는 회귀선의 y 절편입니다.
β 1은 기울기입니다.
Ε ( y )는 주어진 x 값에 대한 y 의 평균값 또는 예상 값입니다.
회귀 선은 양의 선형 관계, 음의 선형 관계 또는 관계 없음을 나타낼 수 있습니다. 단순 선형 회귀 분석에서 그래프로 표시된 선이 평평한 경우 (경사가 아닌 경우) 두 변수 간에는 아무런 관계가 없습니다. 회귀선이 그래프의 y 절편 (축)에서 선의 아래쪽 끝을 위쪽으로 기울이고 선의 상단이 x 절편 (축)에서 멀리 그래프 필드로 위쪽으로 확장되면 양의 선형 관계가 존재합니다 . 회귀선이 그래프의 y 절편 (축)에서 선의 상단을 따라 아래로 기울고 그래프 필드의 아래쪽에서 x 절편 (축)을 향해 아래쪽으로 확장되면 음의 선형 관계가 존재합니다.
추정 된 선형 회귀 식
모집단 의 매개 변수를 알고 있다면 간단한 선형 회귀 식 (아래에 표시)을 사용하여 x 의 알려진 값에 대한 y 의 평균값을 계산할 수 있습니다.
Ε ( y ) = ( β0 + β1x )이다.
그러나 실제로 매개 변수 값은 알 수 없으므로 모집단 샘플 의 데이터를 사용하여 추정해야합니다. 모집단 매개 변수는 샘플 통계를 사용하여 추정됩니다 . 샘플 통계 는 b 0 + b 1로 표시됩니다. 샘플 통계가 모집단 매개 변수로 대체되면 추정 회귀 방정식이 형성됩니다.
추정 된 회귀 방정식은 다음과 같습니다.
( ŷ ) = ( β0 + β1x
( ŷ )는 y 모자 로 발음됩니다.
추정 된 회귀 방정식의 그래프를 추정 회귀선이라고합니다.
b 0는 y 절편입니다.
b 1은 기울기입니다.
ŷ )는 주어진 x 값에 대한 y 의 예상 값입니다.
중요 참고 사항 : 회귀 분석은 변수 간의 인과 관계 를 해석하는 데 사용되지 않습니다. 그러나 회귀 분석은 변수가 어떻게 관련 되어 있는지 또는 변수가 어느 정도 관련 되어 있는지를 나타낼 수 있습니다.
그렇게 할 때 회귀 분석은 지식이 풍부한 연구원 이 더 자세히 보도록 하는 분명한 관계를 만드는 경향이 있습니다.
또한 알려진 것으로 : 이항 변수 회귀 분석, 회귀 분석
예 : 최소 자승법 은 표본 데이터 를 사용 하여 추정 회귀 방정식의 값을 찾는 통계적 절차입니다. Least Squares Method는 1777 년에 태어나 1855 년에 사망 한 Carl Friedrich Gauss가 제안했습니다. Least Squares Method는 여전히 널리 사용되고 있습니다.
출처 :
Anderson, DR, Sweeney, DJ, Williams, TA (2003). 비즈니스 및 경제 통계 통계 (제 3 에디션) 메이슨, 오하이오 : 남서부, 톰슨 학습.
______. (2010). 설명 된 : 회귀 분석. MIT 뉴스.
McIntyre, L. (1994). 다중 회귀 소개에 대한 담배 데이터 사용. 통계학 저널, 2 (1).
Mendenhall, W. 및 Sincich, T. (1992). 공학 및 과학 통계 (제 3 판), 뉴욕, 뉴욕 : Dellen Publishing Co.
Panchenko, D. 18.443 응용 통계, 2006 년 가을, 14 장, 단순 선형 회귀. (매사추세츠 공과 대학 : MIT OpenCourseWare)