통계) 1종오류, 2종오류, 검정력 ≣ 목차 가설에 따른 오류 발생1종 오류 & 2종 오류 `1종 오류` : 귀무가설이 맞는데 틀리다고 함 (대립가설 채택)`2종 오류` : 귀무가설이 틀린데 맞다고 함 (귀무가설 채택)-> 1,2종 오류를 모두 관리할 수 없음. 보통 1종 오류가 더 위험하니 유의수준(α)로 관리한다. 검정력 1-β1-β : 옳게 판단할 영역 = `검정력`귀무가설이 틀렸을 때, 귀무가설을 기각시킬 확률2종오류가 최소일 때, 가장 커진다. 2025. 1. 16. 통계) 선형회귀의 평가지표 - MSE, R-square ≣ 목차 MSE (Mean Squared Error)정의모델이 예측한 값과 실제 값 간의 `오차 제곱의 평균`을 계산한 값수식:`에러` = `실제 데이터 - 예측 데이터`에러 제곱해서 모두 양수로 만든 뒤, 합치기데이터(n)만큼 나누기 특징MSE 값이 작을수록 모델의 예측이 실제 값과 더 가까움을 의미한다.어떤 모델을 만들던 MSE 지표를 최소화하는 방향으로 진행하고 평가해야함.제곱을 하기 때문에 오차의 크기가 큰 데이터 포인트에 더 큰 페널티를 부여한다.값의 단위가 원래 데이터의 단위의 제곱이므로 해석 시 주의가 필요함데이터의 단위가 중요하지 않을 때, 모델 비교 지표로 활용된다.R-square정의모델이 데이터를 얼마나 잘 설명하는지 `비율`로 나타낸 지표'선형회귀'만의 평가지표수식: 특징`R² =1`.. 2025. 1. 14. 통계) 회기분석을 해야 하는 이유 / 선형회귀 ≣ 목차회귀분석을 해야 하는 이유변수 간 관계 이해독립변수가 종속변수에 어떤 영향을 미치는지 파악할 수 있다.변수 간의 관계의 방향(양의 관계/음의 관계)과 크기를 정량적으로 확인예측 및 추정독립변수의 값이 주어졌을 때 종속변수를 예측하는 데 사용된다.ex) 광고비(독립변수)가 증가하면 매출(종속변수)이 얼마나 증가하는지 추정 가능주요 변수 식별여러 독립변수 중 종속변수에 가장 큰 영향을 미치는 변수(중요 변수)를 식별할 수 있다.이를 통해 효율적인 자원 배분, 정책 결정통계적 검정독립변수와 종속변수 간의 관계가 통계적으로 유의미한지 검정한다.회귀분석 결과를 통해 가설 검정 수행선형회귀선형회귀란?`종속변수`와 하나 이상의 `독립변수` 간의 `선형 관계`를 모델링하는 통계 기법= 데이터를 가장 잘 설명할 .. 2025. 1. 13. 통계) Numpy 자주 쓰는 함수 ** 통계 라이브 세션 1회차 ** ≣ 목차 기술통계와 추론통계기술통계데이터를 요약하고 설명하는 방법 - 평균, 중앙값, 분산, 표준편차 등 이용데이터에 대한 대략적인 특징을 간단하고 쉽게 알 수 있다. (단, 이상치 존재 가능)ex) 회사의 매출 데이터를 요약하기 위해 매출, 매출의 표준편차 등 계산추론통계표본 데이터를 통해 모집단의 특성을 추정하고 가설을 검정하는 방법 - 신뢰구간, 가설검정 등 이용데이터의 일부를 가지고 전체를 추정하는 것이 핵심ex) 일부 고객의 설문조사를 통해 전체 고객의 만족도를 추정가설의 종류`귀무가설(H0)`: 검정하고자 하는 가설이 "틀렸음"을 나타냄.program이 성적에 영향을 미치지 않는다.`대립가설(H1)`: 주장하는 바를 나타냄.program이 성적에 영향을 미친.. 2025. 1. 6. 이전 1 다음