본문 바로가기

전체 글120

QGIS를 활용한 관광 분석 _ 1(분석 환경 설정, 월별 내/외국인 방문객 시각화) QGIS를 활용하여 김해시의 내/외국인 관광 분석을 수행하고자 한다. 월별 내/외국인 방문객 시각화, 내국인 관광객 성/연령별 분석 그리고 외국인 관광객 국적별 방문 패턴분석에 대해 살펴보겠다. 기본 행정지도를 배경으로 해야하는데 이를 위해 플러그인을 설치해야 한다. 아래 실습에서 TMS for Korea 플러그인을 설치하도록 하겠다. 이 플러그인을 통해 kakao maps 등 다양한 양식의 지도 배경을 가져올 수 있다. 메뉴바에서 플러그인-플러그인 관리 및 설치를 클릭하면 아래 와 같은 창이 하나 뜬다. 현재 플러그인이 설치되어 제거/재설치 항목이 뜨지만 처음 설치하는 것이라면 해당 위치에 플러그인 설치 버튼이 생기므로 이를 클릭하여 TMS for Korea 플러그인을 설치해 준.. 2021. 7. 29.
주성분 분석(차원 축소, 주성분 분석, 주성분 개수 선택법) 1. 주성분분석 데이터의 변수가 너무 많은 경우 변수의 수를 줄여 분석과 예측에 유리하도록 하는 것을 차원 축소라고 한다. 차원 축소과 관련된 분석이 주성분 분석이다. 주성분 분석(Pincipal Component Analysis, PCA)는 고차원 데이터를 압축하거나 정보가 더 잘 드러나도록 표현하기 위해 주성분 분석을 하는 방법이다. 예를 들어, 3차원 공간 정보를 최대한 유지하면서 2차원 사진을 찍는 것이 차원 축소이다. 여기서 주성분이란 희생되는 정보가 적고 전체 변수의 변동성 대부분을 설명할 수 있는 적은 수의 변수 집합을 의미한다. 2. 주성분 분석 목적 데이터에서 노이즈를 제거하거나 주성분에서 유지되는 정보를 시각화하는데 사용한다 회귀분석 시 독립변수 간에 다중공선성이 존.. 2021. 7. 27.
시계열 분석(시계열 데이터, 정상성, 데이터 전환, 시계열 모델) 1. 시계열 데이터 시간에 따라 관측된 데이터를 시계열 데이터(Timeseries Data)라 한다. 시계열 데이터는 추세를 가진다. 추세요인(trend factor)은 데이터의 값이 시간에 따라 커지거나 작아지거나 수평인 추세로 상향 추세, 하향 추세, 수평 추세가 있다. 또, 시계열 데이터는 계절성을 가진다. 계절 요인(seasonal factor)은 짧은 구간으로 반복되는 트랜드를 의미하는데 일주일, 일년, 사분기, 계절 단위 등으로 명확한 주기에 따라 트랜드가 있는 경우이다. 명확한 이유 없이 알려진 주기를 가지고 변화하는 데이터일 수 있는데 이는 순환 요인을 가진다고 한다. 마지막으로, 위의 추세요인, 계절요인, 순환요인에 해당하지 않는 요인을 불규칙 요인, 노이즈 라고 부른다. 2. 정상성 데.. 2021. 7. 27.
선형회귀 (단순선형회귀, 다중선형회귀) 회귀란 돌아 본래의 자리로 돌아오는 것을 의미한다. 선형회귀(Linear Regression)은 종속변수(반응변수) Y와 한개 이상의 독립변수 X와의 선형 상관관계를 모델링하는 회귀분석 기법이다. 선형회귀에는 단순선형회귀와 다중선형회귀가 있다. 단순선형회귀는 한개의 독립변수(설명변수)를 다루고 다중선형회귀는 둘 이상의 독립변수(설명변수)를 다루는 경우이다. 1. 단순선형회귀 하나의 종속변수와 하나의 독립변수에 대해 다루는 것이 단순선형회귀이다. 종속변수와 독립변수간 산점도 그래프를 그리고 실제 데이터와 예측값 간의 오차가 가장 작은 선을 추세선으로 선택해야 한다. 이 오차는 최소제곱법(LSE)에 띠라 잔차의 단순합이 아니라 제곱함을 구하여 그 값이 최소인 추세선을 설정하게 된다. 추세.. 2021. 7. 27.