자격증

빅분기 실기 Statsmodels의 model.summary() 해석

goatlife 2025. 11. 25. 21:53

📌 1. OLS Regression Results 예시 출력

아래는 Statsmodels 의 model.summary()로 자주 나오는 형태를 기반으로 작성된 예시입니다.

📘 2. 각 지표의 해석

아래는 빅분기 시험에 자주 나오는 해석 포인트 중심으로 정리했습니다.

🔹 (1) Dep. Variable

종속변수(예측하려는 값)
예: Survived → 살아남았는지(0/1)

🔹 (2) R-squared (결정계수)

모델이 종속변수 변동을 얼마나 설명하는지 비율
0~1 사이이며, 1에 가까울수록 모델이 잘 설명함

예: R-squared = 0.512
→ “생존 여부를 51.2% 정도 설명한다”

🔹 (3) Adj. R-squared (수정된 결정계수)

R² 에 변수 개수에 따른 패널티를 부여해 조정한 값
변수 개수가 많을 때 모델의 진짜 성능을 보여줌
시험에서 해석 포인트:

값이 R²보다 약간 작으며, 모델 과적합 여부 확인 가능

🔹 (4) F-statistic & Prob(F-statistic)

전체 회귀모델이 유의한가? 즉,
독립변수들이 종속변수 예측에 의미가 있는가?

예: Prob(F) = 2.45e-45
→ 0.05보다 매우 작으므로 모델 전체는 유의함

🔹 (5) coef (회귀계수, β값)

각 독립변수가 종속변수에 미치는 영향(방향·크기)

예시 해석

Gender = 0.2541
- 성별이 1 증가(예: 여성 =1이면)하면 생존 확률이 0.2541 증가
SibSp = -0.0413
- 가족 수가 많을수록 생존 확률 감소

👉 계수가 양수면 + 영향, 음수면 - 영향.

🔹 (6) std err

계수의 표준오차
값이 작을수록 안정적인 추정

🔹 (7) t 값

회귀계수가 0이 아니라는 증거의 강도
|t|가 클수록 해당 변수는 종속변수에 유의함

🔹 (8) P>|t| (p-value, 유의확률)

해당 독립변수가 유의한지 판단하는 핵심 지표
0.05 미만이면 “유의하다”

예

변수	p-value	해석
Gender	0.000	매우 유의
SibSp	0.001	유의
Parch	0.168	유의하지 않음
Fare	0.000	매우 유의

🔹 (9) 95% 신뢰구간 [0.025, 0.975]

계수가 이 구간 안에 있을 확률 95%
구간에 0을 포함하면 → 유의하지 않을 가능성

예:Parch는 구간이 [-0.006 ~ 0.037], 0 포함 → 유의 X

🔹 (10) Omnibus / Prob(Omnibus)

잔차가 정규성을 띠는지 검정
p-value가 0.05보다 크면 “정규성 만족”

🔹 (11) Jarque-Bera (JB)

정규성 검정의 또 다른 방법
p-value가 0.05보다 크면 “잔차는 정규분포”

시험 팁:

둘 다 정규성이 깨지면 선형회귀의 가정이 위배됨.

🔹 (12) Skew (왜도)

잔차의 비대칭 정도
0이면 완전 대칭(정규)

🔹 (13) Kurtosis (첨도)

잔차의 뾰족한 정도
3이면 정규분포
3보다 높으면 꼬리가 두꺼움(과도한 이상치 가능)

🔹 (14) Durbin-Watson (DW)

잔차의 자기상관(연관성) 검정
값 범위: 0 ~ 4
- 2 → 자기상관 없음 (적합)
- 0에 가까움 → 양의 자기상관
- 4에 가까움 → 음의 자기상관

예: DW = 1.934 → 거의 2, 자기상관 없음

🔹 (15) Cond. No. (조건수)

다중공선성 여부 판단
30 이상이면 공선성 의심
100 이상이면 매우 심각

예: Cond. No = 72.3
→ 약간 높은 편, 일부 다중공선성 가능

🔥 + 추가 : 상관계수(Correlation coefficient) 의미

OLS Summary에는 없지만, 분석에서 자주 묻는 부분이므로 추가 설명.

상관계수 r (Pearson correlation)

-1 ~ +1
1에 가까울수록 강한 양의 상관
-1에 가까울수록 강한 음의 상관
0에 가까울수록 관계가 약함
단, “인과관계” 아님 → 단지 함께 움직일 뿐

📌 3. 요약: 시험에서 꼭 해석해야 하는 부분

구분	의미
R-squared	모델 설명력
Adj. R-squared	설명력 + 변수 개수 조정
Prob(F)	모델 전체 유의성
coef	변수의 영향 방향·크기
p-value (P>	t
Durbin-Watson	자기상관 검정
Cond. No	다중공선성 여부

LIST

저작자표시 비영리 동일조건 (새창열림)

'자격증' 카테고리의 다른 글

귀무가설 대립 가설 쉽게 이해하기(빅데이터 분석기사 실기) (0)	2025.11.24
[빅데이터 분석기사 3과목 정리] 핵심 이론 & 기출 예상문제 총정리 (4)	2025.09.09
빅데이터 분석기사 필기 후기 (1)	2025.09.09
빅데이터분석기사 시험 준비 완벽 가이드(feat. 독합합격전략) 📚 (6)	2025.08.04
정보처리기사 시험 준비 완벽 가이드 📚 (38)	2025.07.25

현재글빅분기 실기 Statsmodels의 model.summary() 해석

GOAT LIFE

'GOAT'하게 하루를 보내기 위한 블로그 경제공부, 최신AI, 교육 자료 위주의 컨텐츠를 작성합니다.

AI관련주, ARKInvest, 주식, 20년장기투자, 재테크, 스테이블코인, 빅데이터분석기사필기요약, CBDC, 장기투자, 스토리북, 빅데이터분석기사예상문제, 포트폴리오, 투자전망, 엔비디아, 캐시우드, 빅데이터분석기사실기 #빅분기실기3유형, 부동산, 빅데터분석기사실기 #model.summary #써머리해석 #통계분석 #파이썬통계, 미국주식, 빅데이터분석기사필기,

Today :
Yesterday :

GOAT LIFE

빅분기 실기 Statsmodels의 model.summary() 해석

📌 1. OLS Regression Results 예시 출력

📘 2. 각 지표의 해석

🔹 (1) Dep. Variable

🔹 (2) R-squared (결정계수)

🔹 (3) Adj. R-squared (수정된 결정계수)

🔹 (4) F-statistic & Prob(F-statistic)

🔹 (5) coef (회귀계수, β값)

🔹 (6) std err

🔹 (7) t 값

🔹 (8) P>|t| (p-value, 유의확률)

🔹 (9) 95% 신뢰구간 [0.025, 0.975]

🔹 (10) Omnibus / Prob(Omnibus)

🔹 (11) Jarque-Bera (JB)

🔹 (12) Skew (왜도)

🔹 (13) Kurtosis (첨도)

🔹 (14) Durbin-Watson (DW)

🔹 (15) Cond. No. (조건수)

🔥 + 추가 : 상관계수(Correlation coefficient) 의미

📌 3. 요약: 시험에서 꼭 해석해야 하는 부분

'자격증' 카테고리의 다른 글

'자격증'의 다른글

티스토리툴바

« 2026/04 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

빅분기 실기 Statsmodels의 model.summary() 해석

📌 1. OLS Regression Results 예시 출력

📘 2. 각 지표의 해석

🔹 (1) Dep. Variable

🔹 (2) R-squared (결정계수)

🔹 (3) Adj. R-squared (수정된 결정계수)

🔹 (4) F-statistic & Prob(F-statistic)

🔹 (5) coef (회귀계수, β값)

🔹 (6) std err

🔹 (7) t 값

🔹 (8) P>|t| (p-value, 유의확률)

🔹 (9) 95% 신뢰구간 [0.025, 0.975]

🔹 (10) Omnibus / Prob(Omnibus)

🔹 (11) Jarque-Bera (JB)

🔹 (12) Skew (왜도)

🔹 (13) Kurtosis (첨도)

🔹 (14) Durbin-Watson (DW)

🔹 (15) Cond. No. (조건수)

🔥 + 추가 : 상관계수(Correlation coefficient) 의미

📌 3. 요약: 시험에서 꼭 해석해야 하는 부분

'자격증' 카테고리의 다른 글

'자격증'의 다른글

관련글

티스토리툴바