본문 바로가기
자격증/빅데이터분석기사

빅데이터분석기사 실기 1과목 데이터산포도 분산, 표준편차, iqr, 절댓값 , 최대최소, 합계

by goemgoem-i 2024. 11. 12.
반응형

지난 블로그에 이어서 산포도를 나타내는 함수들에 대해서 연습해볼 예정이다 

 

빅데이터분석기사 실기 1과목 head, info, describe, shape, dtypes, astype, 최소값/최대값/최빈값 정리 캐

빅데이터분석가 실기는 실기라고 읽고 암기라도 쓴다,,,사실 누가 이걸 외워서 하나,,모르면 그냥 구글링하고 챗한테 질문하는거지 ㅎ아무튼 고생고생해서 딴 필기 또 볼 순 없으니 1과목부터

toonovel.tistory.com

 

 

앞으로 작성할 코드의 참고 데이터는 kaggle의 "web page phishing detection dataset" 이다

https://www.kaggle.com/datasets/shashwatwork/web-page-phishing-detection-dataset

 

Web page Phishing Detection Dataset

Detect Phishing in Web Pages

www.kaggle.com

 

 

 

var() / std() 
분산 / 표준편차 

 

분산은 var()

표준편차는 std()

 

 

IQR / abs()
사분위수  / 절댓값

 

Q1 = df['변수명'].quantile(0.25)

Q2 = df['변수명'].quantile(0.5)

Q3 = df['변수명'].quantile(0.75)

 

 

 

max() / min() / sum(numeric_only=True)
최대 최소 범위 구하기

.max() 최댓값  - 해당 변수의 가장 큰 값

.min() 최솟값 - 해당 변수의 가장 작은 값

범위 = 최댓값 - 최솟값

 

.sum(numeric_only=True) 합계 - 해당 변수의 모든 값의 총합

 

 

 

주의) 이번 시험 부터 corr 이나 sum 함수 사용시 numeric_only=True 설정 필수!!! 안쓰면 에러남 

반응형