본문 바로가기
메타코드 서포터즈/빅데이터분석기사

[빅데이터분석기사] 필기 3과목 메타코드 강의 | #4 다중회귀분석 개념 정리 및 요약

by goemgoem-i 2024. 2. 10.
반응형

이번 글도 3과목 개념 정리 입니다

회귀분석의 개념 정리는 아래 링크 참고하세요!

 

[메타코드M 빅데이터 분석 기사 필기] 3과목 회귀분석설명 개념 정리 및 요약

이번 개념 정리도 빅데이터분석기사 3과목입니다 오늘 배울 내용은 회귀분석에 대해서 자세히 알아볼까 합니다 https://mcode.co.kr/mypage/lecture_view?wm_id=9478 메타코드M 빅데이터 , AI 강의 플랫폼 & IT

toonovel.tistory.com

 

 

저번 강의 회귀분석에 이어 다중회귀분석에 대해서 개념 정리를 해볼까 합니다

해당 강의는 아래 링크 참고하세요!

https://mcode.co.kr/mypage/lecture_view?wm_id=993&lecture_id=5&lecture_sub=14&lecture_num=2

 

메타코드M

빅데이터 , AI 강의 플랫폼 & IT 현직자 모임 플랫폼ㅣ메타코드 커뮤니티 일원이 되시기 바랍니다.

mcode.co.kr

 

 

3과목 다중회귀분석

다중회귀 분석시 변수를 선택하는 방법

 

회귀식 Y = B0 + B1X1 + B2X2...

 

1. 전진 선택법 : 하나씩 변수를 넣어보기 ( 변수 선택하면 변경 불가)

2. 후진 제거법 : 다 넣고 하나씩 빼기 ( 변수 선택하면 변경 불가)

3. 단계저 방법 : 모든 조합 고려가능 ( 시간이 오래걸림)

 

정규화 회귀(과적합 피하기)

 

1. 릿지회귀 : 회귀계수가 0에 가깝게, L2 규제

2. 라쏘회귀 : 회귀계수를 0이 된다(변수 선택 효과), L1 규제

3. 엘라스틱넷 : 랏지, 라쏘 결합

 

영향점 진단

 

영향점이란? 보통 이상치로 회귀 직선에 크게 영향을 주는 데이터

 

영향점 진단방법:

- Leverage H( 레버리지)

- COOK's distance(쿡의 거리)

- dfbetas

- dffits

 

다중공선성

 

독립변수x값에 상관관계가 존재하는 것

분산팽창지수(vif) 10 이상이면 다중공선성 존재

->다중공선성 있는 변수를 제거

 

 

 

후기

 

 

이번 정리는 이전 회귀분석 설명에 이어서 다중회귀분석에 대한 개념을 배웠는데요 

다음 강의에서는 앞서 배운 내용들을 바탕을 활용해서 문제를 풀어볼까 합니다

개념 설명을 간단하게 해줘서 이해는 쉽게 되었는데 막상 문제 풀면 정확하게 풀수 있을지 ㅋㅋㅋㅋ

 

그럼 다음 후기로 가져올게요

반응형