본문 바로가기
자격증/빅데이터분석기사

빅데이터분석기사 실기 합격 독학 공부방법 꿀팁 9회시험 난이도 및 후기

by goemgoem-i 2024. 12. 31.
반응형

이전에 작성한 필기에 이어서 실기 합격 후기도 가져왔습니다

요즘 빅분기가 난이도가 올라가고  있다는 이야기도 많고

일년에 두번 밖에 없다고 하니까 살 떨리면서 공부하고 있었는데

이렇게 한방에 합격하니 지금까지 공부한 자격증 합격들보다 제일 기쁘다!!

 

 

빅데이터분석기사 독학 필기 합격 후기 수원공업고등학교

11월 30일에 빅데이터분석기사 실기시험이 있었죠 를 미리 적을려고 했는데 이미 결과 발표가 나버렸네요 시험 후기는 이거 다음에 적어서 올리겠습니다~  합격기준 총 120분 80문제로 4과목으

toonovel.tistory.com

이전 필기 합격 후기는 위에 블로그 참고하면 된다

 

 

 

 

빅데이터분석기사 실기

 

총 3유형으로 평균 60점만 넘으면 되고

과락이 없어서 보통은 1과목과 2과목을 많이 판다

 

[언어]

빅데이터분석기사는 다른 기사 자격증과는 다르게

직접 코딩을 작성해야한다

 

보통 파이썬을 많이 하고 

많이 하는 분야를 선택해야 자료도 많고 도움주는 분들도 많기에

파이썬으로 강의를 하는 걸 참고했다

1,2,3 과목 전부 파이썬으로 코딩 작성

 

 

 

 

 

공부방법

실기는 책 구매보다는

차라리 강의 구매 하시는 걸 추천하길래

 

 

[강의]

나는 메타코드 강의를 봤다

내 블로그 카테고리에 메타코드 서포터즈를 보면 빅분기 요점정리 해둔 부분이 있는데

그때 본 강의자료가 있어서 따로 추가 구매하진 않았다

덕분에 겁나 헷갈렸음(재작년꺼라,,)

 

 

[1과목]

https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr

 

Big Data Certification KR

퇴근후딴짓 의 빅데이터 분석기사 실기 (Python, R tutorial code) 커뮤니티

www.kaggle.com

https://www.datamanim.com/dataset/99_pandas/pandasMain.html

 

판다스 연습 튜토리얼 — DataManim

판다스 연습 튜토리얼 9회 빅분기 실기 대비 강의, 블로그만으로는 도저히 안되겠다ㅠ 하시는분들에게 추천합니다. 아 제발 광고 한번씩만 눌러주세요 ㅠㅠ 두번은 더 좋구요 빅분기, adp 정보공

www.datamanim.com

여기서 1과목 연습을 완벽하게 한다면 큰 문제 없을 것 같다

물론 난 거의다 못풀고 들어갔다,,

그랬다가 완전 망했지..

 

 

[2과목]

import pandas as pd
import numpy as np


train = pd.read_csv('https://raw.githubusercontent.com/Datamanim/datarepo/main/krdatacertificate/ep6_p2_train.csv')
test = pd.read_csv('https://raw.githubusercontent.com/Datamanim/datarepo/main/krdatacertificate/ep6_p2_test.csv')


# #이상치 확인
print(train.describe())
print(test.describe())
print(train.describe(include = ‘chategory’))
print(test.describe(include = ‘chategory’))


# 원핫인코할게 있는지 확인
print(train.info())
print(test.info())



#결측치 확인
train.isnull().sum()
test.isnull().sum()


#결측치 대체
train['범주형변수’] = train[’범주형변수’].fillna(mode[0], inplace=True)
test['범주형변수’] = test[’범주형변수’].fillna(mode[0], inplace = True)
train['수치형변수’] = train[’수치형변수’].fillna(mean 또는 median. inplace= True)
test['수치형변수’] = test[’수치형변수’].fillna(mean 또는 median, inplace = True)

train_target= train.pop('General_Health') #train에서 종속변수만 빼서 traget새로 생성



#수치형으로 변경 -> 문자형 나오면 get_dummies 진행
train_pre = pd.get_dummies(train)
test_pre = pd.get_dummies(test)  
train_pre = train_pre.reindex(columns = test_pre.columns, fill_value = 0)

print(train_pre.shape)
print(train_target.shape)
print(test_pre.shape)


#train과 target만 가지고 모델링진행
from sklearn.model_selection import train_test_split
x_train, x_val, y_train, y_val = train_test_split(train_pre, train_target,
                                            test_size=0.3, random_state=2022)
                                            

from sklearn.ensemble import RandomForestClassifier #/ RandomForestRegressor
model = RandomForestClassifier()
model.fit(x_train, y_train)

y_pred = model.predict(x_val)

from sklearn.metrics import f1_score
f1 = f1_score(y_val, y_pred, average = 'macro') # y변수 세개
print(f1) #=> 성능확인        



#predict 예측값 제출
y_result = model.predict(test_pre)
print(y_result[:5])

그냥 이거 외우면 된다

그리고 이것저것 찾으면서 알게된건데 

 

여기서 행 또는 열을 삭제하는 건 안하는 걸 추천한다

그냥 무지성 get_dummies를 사용해도

만점 받는데 큰 문제 없다는 이야기도 많다 (나도 그랬고)

 

 

 

[3과목]

교재를 사지 않는 걸 추천하는건 

양이 너무 많아서 뭘 공부할 지 감이 안올것 같기 때문이다

 

보통 강의를 보면 3과목에서 핵심되는 내용만 다룬다

 

1) ttest 검정

- ttest 모수 한 개

- 대응표본/ 쌍체 t검정 모수 두개

- 독립표본 t검정 모수 두개

- anova(분산분석) 모수 3개 (A집단 vs b집단 vs c집단)

 

2) 카이제곱 검정

- 적합도 검정

- 독립성 검정

 

3) 로지스틱회귀분석

 

4) 다중회귀분석

 

5) 상관분석

 

 

대표적으로 나오는 내용은 총 5가지이다

애초애 매번 나오는 형태로 나오니까 

기출문제 풀어보면서 문제 푸는 방식을 익히는 걸 추천한다

 

 

 

 

 

참고 링크

[시험환경 링크]

 

구름EDU - 모두를 위한 맞춤형 IT교육

구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 강의, 기업/

edu.goorm.io

시험 환경에서 코드를 쳐보고 

문제를 푸는 연습을 하는 걸 추천한다

 

 

[문제풀기]

https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr

 

Big Data Certification KR

퇴근후딴짓 의 빅데이터 분석기사 실기 (Python, R tutorial code) 커뮤니티

www.kaggle.com

 

https://www.datamanim.com/dataset/99_pandas/pandasMain.html

 

판다스 연습 튜토리얼 — DataManim

판다스 연습 튜토리얼 9회 빅분기 실기 대비 강의, 블로그만으로는 도저히 안되겠다ㅠ 하시는분들에게 추천합니다. 아 제발 광고 한번씩만 눌러주세요 ㅠㅠ 두번은 더 좋구요 빅분기, adp 정보공

www.datamanim.com


데이터마님과 퇴근후딴짓 이분들 문제를 다 풀면,,

내생각엔 만점이 아닐까 싶다

난이도는 퇴근후 딴짓 보다 데이터 마님이 더 어렵게 느껴졌다

 

 

 

[질문하는곳]

https://open.kakao.com/o/g45YB3sg

 

adp,빅분기 실기대비 2 datamanim

#빅분기#adp#datamanim

open.kakao.com

 

 

https://cafe.naver.com/sqlpd?iframe_url_utf8=%2FArticleRead.nhn%3FreferrerAllArticles%3Dfalse%26menuid%3D8%26page%3D1%26boardtype%3DL%26clubid%3D21771779%26articleid%3D19570

 

데이터 전문가 포럼 (빅데이터분석기사... : 네이버 카페

빅데이터분석기사, ADP, ADsP, SQLP, SQLD, DAP, DAsP, BIS 자격증 취득 등 데이터 전문가 커뮤니티입니다.

cafe.naver.com

 

 

데이터전문가 포럼과 데이터마님 오픈채팅방 두가지다

이 중에서 제일 도움 많이 받은곳은 오픈채팅방이다

시험 이주전부터 여기서 붙어 살았다

 

사람들도 답변 빠르게 해주고 나와 같은 문제점 또는

새로운 문제점들을 빠르게 확인할 수 있어서 넘 좋았다

시험기간에는 데이터마님 오픈채팅방을 강추한다

 

 

 

 

 

 

꿀팁 및 주의사항

잘하시는 분들은,, 딱히 도움되는 말은 아니지만

 

 

첫번째.

저처럼 잘하지 못하는 분들은 

3과목 무조건 챙기는 걸 추천하다 

 

과락이 없다보니 많은 분들이 3과목 어렵다고 공부 안하시고 그냥 넘기시는데

이번에 1과목이 역대급으로 어려웠어서

내가  3과목 공부 안했으면 무조건 떨어졌을 거다

 

 

두번째.

1과목이 엄청 어렵게 나와서 식을 모른다

그럼 포기하지 말고 노가다로 풀어라.

 

언제까지 과락이 없을 지는 모르겠지만 

1과목은 한 문제당 10점이다

그렇기 때문에 한시간을 투자해서라도 한문제는 무조건 푸는게 중요하다 

 

어떤 식으로 노가다로 푸냐

df.loc로 풀면된다

 

문제를 정말 세분화해서 하나하나씩 행열값을 찾고 해당하는 값을 또 하나하나 찾는 수 밖에 없다

찌질하지만 점수를 보면 1과목에 겨우 한문제 맞았는데

스크린 보면서 행열 하나씩 찾아서 직접 하나하나 개수를 세서 한문제 겨우 통과했다 

 

노가다로 풀면 드럽게 오래 걸리지만 

진짜 풀리긴 풀린다

식이 기억이 안나면 빠르게 포기하고 그냥 노가다로 푸는 방식으로 바꾸는 걸 추천한다 ㅎㅎ

 

 

 

 

후기

8회에서 합격률이 60퍼여서 

이번에 1과목이 어렵게 나온 걸 수도 있지만 

그래도 모든 과목은 꼭 공부하고

최대한 빠르게 합격하는걸 추천한다

 

빅분기가 원래는 기사 중에서 쉬운 시험에 속했는데

요즘에 필기가 점점 어려워진다는 이야기와 함께 실기도 어려워지는거 아니냐라는 말이 많이 보인다

1년에 두번밖에 없는 시험이니 꼭 한번에 합격할 수 있으면 좋겠다!!

 

반응형