본문 바로가기

전체 글120

상관 분석 상관 분석이란 확률론과 통계학에서 두 변수간 선형적 혹은 비선형적 관계를 갖고 있는지 분석하는 방법이다. 상관분석에 상관계수라는 용어가 중요한데 상관계수(Correlation, Correlation coefficient)는 두 변수가 서로 독립적이거나 상관관계일 수 있는데 두 변수간의 관계의 정도를 의미한다. 다만 주의해야할 점이 상관계수를 통해 상관관계의 정도를 알 수 있는 것이지 두 변수간 원인과 결과 관계인 인과관계를 설명해 주지는 못한다. 상관계수에는 피어슨 상관계수와 스피어만 상관계수가 있는데 이 두가지를 알아보도록 하겠다 1. 피어슨 상관계수 두 변수간의 선형적인 관계를 측정하여 두 변수의 공분산과 각각의 표준편차의 값을 통해 -1부터 1까지의 값으로 나타낸 것을 피어슨 상관계수라고 한다. 두.. 2021. 7. 27.
추론통계(귀무가설과 대립가설, 유의 확률, t-검정, 분산분석) 기술 통계(Descriptive statistics)란 측정이나 실험을 통해 수집한 데이터를 그래프나 숫자 등으로 요약하고 표현하여 데이터의 특성을 규명하는 통계적 방법이다. 다시말해, 데이터의 특성을 이해하기 쉽게 기술하는 통계로 평균, 중앙값, 분산, 사분위수 등을 규명하고 파이그래프, 막대그래프, 히스토그램 등의 그래프로 보여준다. 추론 통계란 소수의 대상을 가지고 연구하는 것이 경제적이고 효율적인 경우 모집단에서 추출한 표본 데이터를 가지고 해당 모집단의 특성 등을 추론하는 통계적인 방법이다. 모집단의 전수조사가 가능한 경우 문제가 되지 않지만 그렇지 않은 경우가 많기에 추론 통계가 사용된다. 아래에는 추론 통계와 관련된 다양한 개념에 대해 알아보도록 하겠다. 1. 귀무가설과 대.. 2021. 7. 27.
QGIS를 이용한 공간분석 _ 5(래스터 데이터 편집, 래스터 데이터 자르기) 다양한 벡터 데이터를 래스터 데이터로 변환하는 것을 학습하고자 한다. 그리고 변환한 래스터 데이터를 설정한 값에 따라 분류를 실행하는 작업을 해볼 것이다. 1. 벡터 데이터를 래스터 데이터로 변환 먼저, 메뉴바의 레스터에 변환창에서 래스터화(벡터를 래스터로)를 실행한다. 래스터화에서 입력 레이어에 서울시 동 데이터를 넣고 번인 값에 사용할 필드로 숫자형 벡터 데이터를 넣어 준다. 아래의 예시에서 면적 필드를 선택한다. 산출 레스터의 크기 단위를 픽셀로 선택하여 픽셀로 지도에 시각화 할 것이다. 너비/수평 해상도와 높이/수직 해상도 크기를 결정해 주는데 숫자가 커질수록 자세하게 표현된다. 다음으로 산출물 영역에는 서울시 동별 데이터 전체를 사용하기 위해 레이어에서 계산에서 파일을 선택해 준다. 위에서 구두.. 2021. 7. 26.
QGIS를 이용한 공간분석 _ 4(디지털 지도 제작) 디지털 지도를 제작하기 위해서 공간 데이터와 연결된 속성 테이블에서 기존의 필드를 활용하거나 새로운 필드를 제작할 필요가 있다. 아래에 두가지 예시를 보여줄 것인데 서울시 동별 면적 지도와 서울시 1인 가구 비율에 대해 디지털 지도로 살펴보고자 한다. 지도를 구성하는 주요 요소에 몇가지가 있다. 지도 제목, 축적, 범례, 방위, 그리드가 있는데 이를 지도에 표현하는 방법에 대해 알아볼 것이다. 1. 단계 구분 기능을 활용한 디지털 제작 디지털 지도 제작에 앞서 속성 데이터를 어떻게 분류할 것인지도 중요하다. 단계 구분 기능을 활용하여 디지털 지도 제작시 대상 속성 데이터의 통계와 분류할 클래스 개수 정보를 지정하여 단계 구분 방법을 설정하게 된다. 쉽게 말해, 보고자 하는 속성 데이터의 분류 개수와 분류.. 2021. 7. 26.