이전에 작성한 필기에 이어서 실기 합격 후기도 가져왔습니다
요즘 빅분기가 난이도가 올라가고 있다는 이야기도 많고
일년에 두번 밖에 없다고 하니까 살 떨리면서 공부하고 있었는데
이렇게 한방에 합격하니 지금까지 공부한 자격증 합격들보다 제일 기쁘다!!
이전 필기 합격 후기는 위에 블로그 참고하면 된다
빅데이터분석기사 실기
총 3유형으로 평균 60점만 넘으면 되고
과락이 없어서 보통은 1과목과 2과목을 많이 판다
[언어]
빅데이터분석기사는 다른 기사 자격증과는 다르게
직접 코딩을 작성해야한다
보통 파이썬을 많이 하고
많이 하는 분야를 선택해야 자료도 많고 도움주는 분들도 많기에
파이썬으로 강의를 하는 걸 참고했다
1,2,3 과목 전부 파이썬으로 코딩 작성
공부방법
실기는 책 구매보다는
차라리 강의 구매 하시는 걸 추천하길래
[강의]
나는 메타코드 강의를 봤다
내 블로그 카테고리에 메타코드 서포터즈를 보면 빅분기 요점정리 해둔 부분이 있는데
그때 본 강의자료가 있어서 따로 추가 구매하진 않았다
덕분에 겁나 헷갈렸음(재작년꺼라,,)
[1과목]
https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr
https://www.datamanim.com/dataset/99_pandas/pandasMain.html
여기서 1과목 연습을 완벽하게 한다면 큰 문제 없을 것 같다
물론 난 거의다 못풀고 들어갔다,,
그랬다가 완전 망했지..
[2과목]
import pandas as pd
import numpy as np
train = pd.read_csv('https://raw.githubusercontent.com/Datamanim/datarepo/main/krdatacertificate/ep6_p2_train.csv')
test = pd.read_csv('https://raw.githubusercontent.com/Datamanim/datarepo/main/krdatacertificate/ep6_p2_test.csv')
# #이상치 확인
print(train.describe())
print(test.describe())
print(train.describe(include = ‘chategory’))
print(test.describe(include = ‘chategory’))
# 원핫인코할게 있는지 확인
print(train.info())
print(test.info())
#결측치 확인
train.isnull().sum()
test.isnull().sum()
#결측치 대체
train['범주형변수’] = train[’범주형변수’].fillna(mode[0], inplace=True)
test['범주형변수’] = test[’범주형변수’].fillna(mode[0], inplace = True)
train['수치형변수’] = train[’수치형변수’].fillna(mean 또는 median. inplace= True)
test['수치형변수’] = test[’수치형변수’].fillna(mean 또는 median, inplace = True)
train_target= train.pop('General_Health') #train에서 종속변수만 빼서 traget새로 생성
#수치형으로 변경 -> 문자형 나오면 get_dummies 진행
train_pre = pd.get_dummies(train)
test_pre = pd.get_dummies(test)
train_pre = train_pre.reindex(columns = test_pre.columns, fill_value = 0)
print(train_pre.shape)
print(train_target.shape)
print(test_pre.shape)
#train과 target만 가지고 모델링진행
from sklearn.model_selection import train_test_split
x_train, x_val, y_train, y_val = train_test_split(train_pre, train_target,
test_size=0.3, random_state=2022)
from sklearn.ensemble import RandomForestClassifier #/ RandomForestRegressor
model = RandomForestClassifier()
model.fit(x_train, y_train)
y_pred = model.predict(x_val)
from sklearn.metrics import f1_score
f1 = f1_score(y_val, y_pred, average = 'macro') # y변수 세개
print(f1) #=> 성능확인
#predict 예측값 제출
y_result = model.predict(test_pre)
print(y_result[:5])
그냥 이거 외우면 된다
그리고 이것저것 찾으면서 알게된건데
여기서 행 또는 열을 삭제하는 건 안하는 걸 추천한다
그냥 무지성 get_dummies를 사용해도
만점 받는데 큰 문제 없다는 이야기도 많다 (나도 그랬고)
[3과목]
교재를 사지 않는 걸 추천하는건
양이 너무 많아서 뭘 공부할 지 감이 안올것 같기 때문이다
보통 강의를 보면 3과목에서 핵심되는 내용만 다룬다
1) ttest 검정
- ttest 모수 한 개
- 대응표본/ 쌍체 t검정 모수 두개
- 독립표본 t검정 모수 두개
- anova(분산분석) 모수 3개 (A집단 vs b집단 vs c집단)
2) 카이제곱 검정
- 적합도 검정
- 독립성 검정
3) 로지스틱회귀분석
4) 다중회귀분석
5) 상관분석
대표적으로 나오는 내용은 총 5가지이다
애초애 매번 나오는 형태로 나오니까
기출문제 풀어보면서 문제 푸는 방식을 익히는 걸 추천한다
참고 링크
[시험환경 링크]
시험 환경에서 코드를 쳐보고
문제를 푸는 연습을 하는 걸 추천한다
[문제풀기]
https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr
https://www.datamanim.com/dataset/99_pandas/pandasMain.html
데이터마님과 퇴근후딴짓 이분들 문제를 다 풀면,,
내생각엔 만점이 아닐까 싶다
난이도는 퇴근후 딴짓 보다 데이터 마님이 더 어렵게 느껴졌다
[질문하는곳]
https://open.kakao.com/o/g45YB3sg
데이터전문가 포럼과 데이터마님 오픈채팅방 두가지다
이 중에서 제일 도움 많이 받은곳은 오픈채팅방이다
시험 이주전부터 여기서 붙어 살았다
사람들도 답변 빠르게 해주고 나와 같은 문제점 또는
새로운 문제점들을 빠르게 확인할 수 있어서 넘 좋았다
시험기간에는 데이터마님 오픈채팅방을 강추한다
꿀팁 및 주의사항
잘하시는 분들은,, 딱히 도움되는 말은 아니지만
첫번째.
저처럼 잘하지 못하는 분들은
3과목 무조건 챙기는 걸 추천하다
과락이 없다보니 많은 분들이 3과목 어렵다고 공부 안하시고 그냥 넘기시는데
이번에 1과목이 역대급으로 어려웠어서
내가 3과목 공부 안했으면 무조건 떨어졌을 거다
두번째.
1과목이 엄청 어렵게 나와서 식을 모른다
그럼 포기하지 말고 노가다로 풀어라.
언제까지 과락이 없을 지는 모르겠지만
1과목은 한 문제당 10점이다
그렇기 때문에 한시간을 투자해서라도 한문제는 무조건 푸는게 중요하다
어떤 식으로 노가다로 푸냐
df.loc로 풀면된다
문제를 정말 세분화해서 하나하나씩 행열값을 찾고 해당하는 값을 또 하나하나 찾는 수 밖에 없다
찌질하지만 점수를 보면 1과목에 겨우 한문제 맞았는데
스크린 보면서 행열 하나씩 찾아서 직접 하나하나 개수를 세서 한문제 겨우 통과했다
노가다로 풀면 드럽게 오래 걸리지만
진짜 풀리긴 풀린다
식이 기억이 안나면 빠르게 포기하고 그냥 노가다로 푸는 방식으로 바꾸는 걸 추천한다 ㅎㅎ
후기
8회에서 합격률이 60퍼여서
이번에 1과목이 어렵게 나온 걸 수도 있지만
그래도 모든 과목은 꼭 공부하고
최대한 빠르게 합격하는걸 추천한다
빅분기가 원래는 기사 중에서 쉬운 시험에 속했는데
요즘에 필기가 점점 어려워진다는 이야기와 함께 실기도 어려워지는거 아니냐라는 말이 많이 보인다
1년에 두번밖에 없는 시험이니 꼭 한번에 합격할 수 있으면 좋겠다!!
'자격증 > 빅데이터분석기사' 카테고리의 다른 글
빅데이터분석기사 독학 필기 합격 후기 수원공업고등학교 (4) | 2024.12.16 |
---|---|
빅데이터분석기사 전처리 문제 풀기 loc와 iloc의 차이점 (0) | 2024.11.20 |
빅데이터분석기사 실기 2과목 회귀모델 데이터 모델링 (0) | 2024.11.17 |
빅데이터분석기사 실기 1과목 날짜시간 데이터 index (0) | 2024.11.16 |
빅데이터분석기사 실기 1과목 데이터 표준화, min-max scaling,데이터 합치기 (0) | 2024.11.15 |