본문 바로가기
자격증/빅데이터분석기사

빅데이터분석기사 실기 2과목 회귀모델 데이터 모델링

by goemgoem-i 2024. 11. 17.
반응형

https://toonovel.tistory.com/entry/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-2%EA%B3%BC%EB%AA%A9

 

빅데이터분석기사 실기 2과목 분류모델 데이터 전처리 및 모델링 진행

2과목에서는 1과목에서 배운 내용을 바탕으로 데이터 결측치 및 이상치를 처리하고 분류모델을 적용해서 정확도 값을 산출해보자   https://www.kaggle.com/datasets/shashwatwork/web-page-phishing-detection-datas

toonovel.tistory.com

이전에 2과목 분류모델을 올렸었는데 마지막 모델링 돌리는 부분 빼고는 완전 동일해서 

회귀모델 성능 값 출력하는 방식만 간단하게 정리해볼려고한다 

지금까지 데이터는 피싱 데이터를 활용했지만 해당 데이터는 이진분류 데이터라서 

sklearn에 있는 데이터를 활용해서 모델링을 진행해보겠다

 

 

이전 분류 모델에선 RandomForestClassifier 를 사용했는데

여기선 회귀 모델이라 RandomForestRegressor 를 사용했다

 

분류 모델과 동일하게 x_val을 모델링 해주고

 

분류모델에선 from sklearn.metrics import accuracy_score, f1_score, roc_auc_score 였는데 

회귀모델에선 from sklearn.metrics import r2_score, mean_squared_error 를 불러온다

 

이때 r2, mse,rmse 세가지를 출력해볼 수 있는데

rmse의 경우 mse에 0.5를 제곱한 값으로 rmse = mse ** 0.5 를 작성하면 된다 

반응형