≣ 목차
회귀분석을 해야 하는 이유
- 변수 간 관계 이해
- 독립변수가 종속변수에 어떤 영향을 미치는지 파악할 수 있다.
- 변수 간의 관계의 방향(양의 관계/음의 관계)과 크기를 정량적으로 확인
- 예측 및 추정
- 독립변수의 값이 주어졌을 때 종속변수를 예측하는 데 사용된다.
- ex) 광고비(독립변수)가 증가하면 매출(종속변수)이 얼마나 증가하는지 추정 가능
- 주요 변수 식별
- 여러 독립변수 중 종속변수에 가장 큰 영향을 미치는 변수(중요 변수)를 식별할 수 있다.
- 이를 통해 효율적인 자원 배분, 정책 결정
- 통계적 검정
- 독립변수와 종속변수 간의 관계가 통계적으로 유의미한지 검정한다.
- 회귀분석 결과를 통해 가설 검정 수행
선형회귀
선형회귀란?
- `종속변수`와 하나 이상의 `독립변수` 간의 `선형 관계`를 모델링하는 통계 기법
- = 데이터를 가장 잘 설명할 수 있는 직선을 찾는 것
- 단순선형회귀
- 독립변수가 1개
- ex) 집 크기(㎡) → 집값(₩)
- 다중선형회귀
- 독립변수 여러개
- ex) 집 크기(㎡), 방 개수, 위치 → 집값(₩)
선형회귀 수식
- 단순선형회귀
y = β0 + β1x + ϵ
-
- : 종속변수
- x: 독립변수
- β0: 절편(intercept, y축과 만나는 점)
- : 기울기(slope, 독립변수 변화에 따른 종속변수의 변화)
- ϵ: 오차항(error term)
- 다중선형회귀
y = β0 + β1x1 + β2x2 + ⋯ +βnxn+ϵ
-
- : 여러 독립변수
'데이터 분석 > 통계' 카테고리의 다른 글
통계) 1종오류, 2종오류, 검정력 (0) | 2025.01.16 |
---|---|
통계) 선형회귀의 평가지표 - MSE, R-square (0) | 2025.01.14 |
통계) Numpy 자주 쓰는 함수 (0) | 2025.01.06 |