본문 바로가기
반응형

자격증13

빅데이터분석기사 실기 1과목 날짜시간 데이터 index 날짜 시간 데이터는 별도의 파일이 따로 없기 때문에 dataframe 을 새로 생성해서 연습해보겠다 #데이터 만들기df = pd.DataFrame( { '날짜': ['20230105', '20230105', '20230223', '20230223', '20230312', '20230422', '20230405'], '물품': ['A', 'B', 'A', 'B', 'A', 'B','A'], '판매수' : ['5','10', '15', '15', '20', '25', '40'], '개당수익': [500, 600, 500, 600, 600, 700, 600]})df   1) 날짜 다루기먼저 df로 전체적인 데이터 파악    df.info()로 데이터 특성 파악날자가 object라서 숫자로.. 2024. 11. 16.
빅데이터분석기사 실기 1과목 데이터 표준화, min-max scaling,데이터 합치기 앞으로 작성할 코드의 참고 데이터는 kaggle의 "web page phishing detection dataset" 이다https://www.kaggle.com/datasets/shashwatwork/web-page-phishing-detection-dataset Web page Phishing Detection DatasetDetect Phishing in Web Pageswww.kaggle.com 데이터 scaling 데이터 표준화StandardScaler() (기본값 - 평균 / 분산) 한 값들로 변경됨    최소최대 정규화MinMaxScaler 최대최소 정규화는 0과 1사이의 값이 나옴     데이터 합치기  1) 행기준 합치기df,loc[행범위, 열범위] df_sum = pd.concat( [.. 2024. 11. 15.
빅데이터분석기사 실기 1과목 실기 데이터 결측치, 이상치, 중복값 처리 빅데이터분석기사 실기 1과목 데이터산포도 분산, 표준편차, iqr, 절댓값 , 최대최소, 합계지난 블로그에 이어서 산포도를 나타내는 함수들에 대해서 연습해볼 예정이다  빅데이터분석기사 실기 1과목 head, info, describe, shape, dtypes, astype, 최소값/최대값/최빈값 정리 캐빅데이터분석가toonovel.tistory.com(이전에 작성한 개념)  이번에는 데이터 결측치 / 이상치 / 중복값을 확인하고 처리하는 과정을 진행하겠다이전 1과목 실기 파트에서 연습했던 데이터 셋은 kaggle의 "web page phishing detection dataset" 을 사용했지만https://www.kaggle.com/datasets/shashwatwork/web-page-phishin.. 2024. 11. 14.
빅데이터분석기사 실기 1과목 groupby, 인덱싱, 열 추가/제거, 필터링, 정렬, np.where(조건문) 이번에는 데이터를 통합하고 인덱싱 필터링 정렬을 진행해보겠다계속 참고해온 데이터는 kaggle의 "web page phishing detection dataset" 인데https://www.kaggle.com/datasets/shashwatwork/web-page-phishing-detection-dataset Web page Phishing Detection DatasetDetect Phishing in Web Pageswww.kaggle.com그룹화하기엔 맞는 데이터가 아니라서 seaborn의 iris 데이터도 활용해서 연습해보겠다 iris 데이터 불러오기   groupby()그룹화문제가 species를 기준으로 중앙값/ 평균의 그룹을 구하라~ 이런식이면sns.groupby('species').mea.. 2024. 11. 13.
반응형