본문 바로가기
반응형

분류 전체보기104

빅데이터분석기사 실기 1과목 데이터 표준화, min-max scaling,데이터 합치기 앞으로 작성할 코드의 참고 데이터는 kaggle의 "web page phishing detection dataset" 이다https://www.kaggle.com/datasets/shashwatwork/web-page-phishing-detection-dataset Web page Phishing Detection DatasetDetect Phishing in Web Pageswww.kaggle.com 데이터 scaling 데이터 표준화StandardScaler() (기본값 - 평균 / 분산) 한 값들로 변경됨    최소최대 정규화MinMaxScaler 최대최소 정규화는 0과 1사이의 값이 나옴     데이터 합치기  1) 행기준 합치기df,loc[행범위, 열범위] df_sum = pd.concat( [.. 2024. 11. 15.
빅데이터분석기사 실기 1과목 실기 데이터 결측치, 이상치, 중복값 처리 빅데이터분석기사 실기 1과목 데이터산포도 분산, 표준편차, iqr, 절댓값 , 최대최소, 합계지난 블로그에 이어서 산포도를 나타내는 함수들에 대해서 연습해볼 예정이다  빅데이터분석기사 실기 1과목 head, info, describe, shape, dtypes, astype, 최소값/최대값/최빈값 정리 캐빅데이터분석가toonovel.tistory.com(이전에 작성한 개념)  이번에는 데이터 결측치 / 이상치 / 중복값을 확인하고 처리하는 과정을 진행하겠다이전 1과목 실기 파트에서 연습했던 데이터 셋은 kaggle의 "web page phishing detection dataset" 을 사용했지만https://www.kaggle.com/datasets/shashwatwork/web-page-phishin.. 2024. 11. 14.
빅데이터분석기사 실기 1과목 groupby, 인덱싱, 열 추가/제거, 필터링, 정렬, np.where(조건문) 이번에는 데이터를 통합하고 인덱싱 필터링 정렬을 진행해보겠다계속 참고해온 데이터는 kaggle의 "web page phishing detection dataset" 인데https://www.kaggle.com/datasets/shashwatwork/web-page-phishing-detection-dataset Web page Phishing Detection DatasetDetect Phishing in Web Pageswww.kaggle.com그룹화하기엔 맞는 데이터가 아니라서 seaborn의 iris 데이터도 활용해서 연습해보겠다 iris 데이터 불러오기   groupby()그룹화문제가 species를 기준으로 중앙값/ 평균의 그룹을 구하라~ 이런식이면sns.groupby('species').mea.. 2024. 11. 13.
빅데이터분석기사 실기 1과목 데이터산포도 분산, 표준편차, iqr, 절댓값 , 최대최소, 합계 지난 블로그에 이어서 산포도를 나타내는 함수들에 대해서 연습해볼 예정이다  빅데이터분석기사 실기 1과목 head, info, describe, shape, dtypes, astype, 최소값/최대값/최빈값 정리 캐빅데이터분석가 실기는 실기라고 읽고 암기라도 쓴다,,,사실 누가 이걸 외워서 하나,,모르면 그냥 구글링하고 챗한테 질문하는거지 ㅎ아무튼 고생고생해서 딴 필기 또 볼 순 없으니 1과목부터toonovel.tistory.com  앞으로 작성할 코드의 참고 데이터는 kaggle의 "web page phishing detection dataset" 이다https://www.kaggle.com/datasets/shashwatwork/web-page-phishing-detection-dataset Web p.. 2024. 11. 12.
반응형