본문 바로가기
데이터 분석/통계

통계) 회기분석을 해야 하는 이유 / 선형회귀

by engwoon 2025. 1. 13.

목차

    회귀분석을 해야 하는 이유

    • 변수 간 관계 이해
      • 독립변수가 종속변수에 어떤 영향을 미치는지 파악할 수 있다.
      • 변수 간의 관계의 방향(양의 관계/음의 관계)과 크기를 정량적으로 확인
    • 예측 및 추정
      • 독립변수의 값이 주어졌을 때 종속변수를 예측하는 데 사용된다.
      • ex) 광고비(독립변수)가 증가하면 매출(종속변수)이 얼마나 증가하는지 추정 가능
    • 주요 변수 식별
      • 여러 독립변수 중 종속변수에 가장 큰 영향을 미치는 변수(중요 변수)를 식별할 수 있다.
      • 이를 통해 효율적인 자원 배분, 정책 결정
    • 통계적 검정
      • 독립변수와 종속변수 간의 관계가 통계적으로 유의미한지 검정한다.
      • 회귀분석 결과를 통해 가설 검정 수행

    선형회귀

    선형회귀란?

    • `종속변수`와 하나 이상의 `독립변수` 간의 `선형 관계`를 모델링하는 통계 기법
    • = 데이터를 가장 잘 설명할 수 있는 직선을 찾는 것
    • 단순선형회귀
      • 독립변수가 1개
      • ex) 집 크기(㎡) → 집값(₩)
    • 다중선형회귀
      • 독립변수 여러개
      • ex) 집 크기(㎡), 방 개수, 위치 → 집값(₩)

     

    선형회귀 수식

    • 단순선형회귀
    y = β0​ + β1​x + ϵ
      • : 종속변수
      • x: 독립변수
      • β0: 절편(intercept, y축과 만나는 점)
      • : 기울기(slope, 독립변수 변화에 따른 종속변수의 변화)
      • ϵ: 오차항(error term)
    • 다중선형회귀
     y = β0 + β1x1 + β2x2 + +βnxn+ϵ
      • : 여러 독립변수