Groupby1 Big Data 분석 - Data Handling Data Handling - 이론 Data 구조 Pandas Pandas : 데이터를 수집하고 정리하는데 최적화된 도구 numpy 기반으로 작성된 라이브러리 import pandas as pd Series & Dataframe Series : 1차원 배열 구조로 index와 values로 구성 Dataframe : spreadsheet 형식의 자료구조로 index, columns, values 형태로 구성 데이터 읽기 및 저장 함수 설명 read_csv 쉼표로 구분된 데이터를 읽어올 때 사용 read_table 테이블 형태의 데이터로 저장되어 있는 파일을 불러 올 때 사용 read_excel 엑셀 형식의 데이터를 읽어옴 read_html 웹 문서 내의 데이터를 읽어옴 특정 컬럼만 불러오기 데이터 내용.. 2022. 5. 18. 이전 1 다음