분석 결과_상관분석&가중치 시나리오
4. 분석 결과 4.1. 상관분석 결과 - 유동 인구와의 상관분석을 진행한 결과 유의수준 0.001 이하에서 최고기온(max_temp), 공공와이파이 설치 대수(wifi), 공공자전거 설치 대수(bike_rental), 신호등 설치 대수(traffic_light), 인구 밀도(pl_density), 지하철 승차자 수(subway_in), 지하철 하차자 수(subway_out), 지하철 출구 개수(subway_num)의 변수가 귀무가설을 기각해 분석에 포함하기로 결정 - 그러나, 신호등 설치 대수(traffic_light)의 경우 도로의 교차로가 있는 곳에 항상 신호등이 설치돼있으며, 수집한 데이터가 보행자용이 아닌 차량용 신호등까지 모두 포함되어 있어 분석에 활용하기 부적절하다고 판단함 - 한편, 고령화..
2022. 7. 4.
분석 프로세스
3. 분석 프로세스 분석의 전체적인 프로세스는 KDD(Knowledge Discovery in Databases)를 참고하여, ‘데이터 선택(수집)’, ‘데이터 정제(전처리)’, ‘분석’, ‘시각화 및 인사이트 도출’ 순으로 진행 3.1. 분석 프로세스 3.1.1. 데이터 수집 및 정제 - 양산 대여기의 설치 기준이 될 수 있는 요인을 ‘날씨’, ‘공간 정보’, ‘유동 인구’, ‘교통’, ‘취약 계층’, ‘시설’로 구분하여 관련 데이터를 수집 - 계절의 영향을 받는 변수는 6월부터 8월까지의 시점을 기준으로 데이터를 탐색하였으며, 이 외 변수는 가장 최신의 데이터를 선택 - Q-GIS를 통한 분석이 가능하도록 주소 데이터를 모두 위·경도 데이터로 변환하고, 분석 단위인 격자에 각 속성값을 결합 3.1.2..
2022. 7. 4.
데이터 상세 설명
2.2.1. 날씨 - (종로구 기온, 중구 기온 / csv) 기상청에서 제공하는 자료로, 행정동별로 자료가 제공되고 있음. 2020년 6월부터 8월까지의 날짜, 시간대별 기온 데이터가 포함되어 있음 - (서울시 기온 / csv) 기상청에서 제공하는 자료로 전국의 AWS(자동기상관측소)에서 측정한 기온을 서울시 구 단위 시간대별 자료로 제공. 2020년 6월부터 8월까지의 날짜, 시간대별 기온 데이터가 포함되어 있음 2.2.2. 공간 정보 - (대한민국 최신 행정 구역 / shp) 대한민국 행정 구역의 시도, 시군구, 읍면동에 대한 공간 데이터임 - (환경경지_생태자연도 / shp) 국가공간정보포털에서 제공하는 자료로, 산, 하천, 도시 등에 대하여 자연환경을 생태적 가치, 자연성, 경관적 가치 등에 따라..
2022. 7. 4.