plot2 Big Data 분석 - 탐색적 분석(시각화) 탐색적 분석 탐색적 분석 다양한 시각화, 통계 분석을 이용해 데이터의 패턴, 특성, 변수 간의 관계 파악 등 데이터를 종합적으로 이해하는 과정 그래프와 정보를 통합한 인포그래픽스 사용이 증가하는 추세임 자료 형태별 그래프 연속형 : 측정 도구로 측정하는 데이터 등간 척도 : 속성을 평가할 수 있는 균일한 간격을 두고 측정하는 척도, 절대 영점이 없음 비율 척도 : 절대 영점이 있는 등간 척도로 사칙 연산이 가능함 이산형 : 사람이 직접 셀 수 있는 데이터 명목형 : 이름뿐인 척도로 숫자로 표현되지만 수량적 의미를 갖지 않고 카테고리 구분을 위한 용도 순서형 : 관찰 대상이 지니는 속성에 따라 순위를 결정하는 척도 그래프 Y X Z 패키지 함수 Bar Chart 범주형 pandas bar Histogram.. 2022. 5. 19. 변수간 관계 탐색(산점도, pairs, 상관계수, 상관행렬, 상관행렬 히트맵) 다양한 변수가 있는 경우 변수간 어떤 관계를 갖고 있는지 살펴볼 필요가 있다. 두 변수간 양의 상관관계, 음의 상관관계 그리고 아무 관련이 없는 변수 관계일 수 있다. 변수 관계를 파악하여 추후 데이터 분석에 활용할 수 있을 것이다. 1. 산점도 그래프 산점도 그래프란 plot() 함수로 데이터를 x축, y축에 점의 형태로 표시한 그래프이다. 양의 선형, 음의 선형, 무관 세가지 변수간 관계를 파악하기에 용이하다. 아래 그래프는 근무년수 대비 연봉의 관계를 파악한 것이다. 양의 선형관계를 가짐을 알 수 있다. A_salary 2021. 7. 25. 이전 1 다음