빅데이터분석기사 실기 1과목 날짜시간 데이터 index
날짜 시간 데이터는 별도의 파일이 따로 없기 때문에 dataframe 을 새로 생성해서 연습해보겠다 #데이터 만들기df = pd.DataFrame( { '날짜': ['20230105', '20230105', '20230223', '20230223', '20230312', '20230422', '20230405'], '물품': ['A', 'B', 'A', 'B', 'A', 'B','A'], '판매수' : ['5','10', '15', '15', '20', '25', '40'], '개당수익': [500, 600, 500, 600, 600, 700, 600]})df 1) 날짜 다루기먼저 df로 전체적인 데이터 파악 df.info()로 데이터 특성 파악날자가 object라서 숫자로..
2024. 11. 16.
빅데이터분석기사 실기 1과목 실기 데이터 결측치, 이상치, 중복값 처리
빅데이터분석기사 실기 1과목 데이터산포도 분산, 표준편차, iqr, 절댓값 , 최대최소, 합계지난 블로그에 이어서 산포도를 나타내는 함수들에 대해서 연습해볼 예정이다 빅데이터분석기사 실기 1과목 head, info, describe, shape, dtypes, astype, 최소값/최대값/최빈값 정리 캐빅데이터분석가toonovel.tistory.com(이전에 작성한 개념) 이번에는 데이터 결측치 / 이상치 / 중복값을 확인하고 처리하는 과정을 진행하겠다이전 1과목 실기 파트에서 연습했던 데이터 셋은 kaggle의 "web page phishing detection dataset" 을 사용했지만https://www.kaggle.com/datasets/shashwatwork/web-page-phishin..
2024. 11. 14.