본문 바로가기

데이터 분석/공공빅데이터 프로젝트11

활용 방안 5. 활용 방안 5.1. 문제점 개선 방안 (현재 사업 개선) 유동 인구, 집객시설 등의 정보를 활용해 기존의 서비스보다 접근성을 높인 대여기 최적 위치 선정 (적절한 폭염 대응 정책 제공) 양산 대여기를 통해 시민들이 실제로 원하는 폭염 대응 정책인 야외공간 그늘을 제공함으로써 만족도 높은 서비스 제공 가능 (온열 질환 예방) 양산을 사용함으로써 폭염 시 발생하는 온열 질환을 쉽게 예방할 수 있고, 불쾌 지수를 낮춰 시민들의 삶의 질을 높일 수 있음 (의료 비용 절감 효과) 양산 활용을 통해 온열 질환을 사전에 예방함으로써 보건 의료 분야에 투입되는 비용 절감 가능 5.2. 업무 활용 방안 (공공 서비스 제공 확대) 접근성이 높은 위치에 설치된 양산 대여기를 활용하여, 폭염이 집중적으로 발생하는 여름철.. 2022. 7. 4.
분석결과 시각화&인사이트 도출 4.3. 분석 결과 시각화 - 각 가중치 시나리오별로 진행한 분석 결과를 순위별로 시각화를 진행하였으며, 흰색에서 진한 빨간색으로 갈수록 높은 순위의 결과가 나온 것임 4.3.1. 동일형 시나리오 분석 결과 시각화 4.3.2. 교통 강조형 시나리오 분석 결과 시각화 4.3.3. 참조 강조형 시나리오 분석 결과 시각화 4.3.4. 인구 강조형 시나리오 분석 결과 시각화 4.3.5. 형평성 강조형 시나리오 분석 결과 시각화 4.4. 인사이트 도출 - 시나리오별 총점 순위를 계산한 결과, 앞서 제시한 시각화 자료와 같이 모든 시나리오에서 상위 입지 지역이 약수동, 청구동 일대로 분석됨 - 즉, 각 특성을 강조하여 가중치를 부여하더라도 총점의 순위가 큰 차이가 없는 것으로 나타남 - (동일형 시나리오 최종 선택.. 2022. 7. 4.
분석 결과_상관분석&가중치 시나리오 4. 분석 결과 4.1. 상관분석 결과 - 유동 인구와의 상관분석을 진행한 결과 유의수준 0.001 이하에서 최고기온(max_temp), 공공와이파이 설치 대수(wifi), 공공자전거 설치 대수(bike_rental), 신호등 설치 대수(traffic_light), 인구 밀도(pl_density), 지하철 승차자 수(subway_in), 지하철 하차자 수(subway_out), 지하철 출구 개수(subway_num)의 변수가 귀무가설을 기각해 분석에 포함하기로 결정 - 그러나, 신호등 설치 대수(traffic_light)의 경우 도로의 교차로가 있는 곳에 항상 신호등이 설치돼있으며, 수집한 데이터가 보행자용이 아닌 차량용 신호등까지 모두 포함되어 있어 분석에 활용하기 부적절하다고 판단함 - 한편, 고령화.. 2022. 7. 4.
분석 프로세스 3. 분석 프로세스 분석의 전체적인 프로세스는 KDD(Knowledge Discovery in Databases)를 참고하여, ‘데이터 선택(수집)’, ‘데이터 정제(전처리)’, ‘분석’, ‘시각화 및 인사이트 도출’ 순으로 진행 3.1. 분석 프로세스 3.1.1. 데이터 수집 및 정제 - 양산 대여기의 설치 기준이 될 수 있는 요인을 ‘날씨’, ‘공간 정보’, ‘유동 인구’, ‘교통’, ‘취약 계층’, ‘시설’로 구분하여 관련 데이터를 수집 - 계절의 영향을 받는 변수는 6월부터 8월까지의 시점을 기준으로 데이터를 탐색하였으며, 이 외 변수는 가장 최신의 데이터를 선택 - Q-GIS를 통한 분석이 가능하도록 주소 데이터를 모두 위·경도 데이터로 변환하고, 분석 단위인 격자에 각 속성값을 결합 3.1.2.. 2022. 7. 4.
데이터 정제_데이터셋 생성&데이터 클렌징 2.3.6. 데이터 세트(Data Set) 생성 - 최종적으로 결합 완료한 레이어의 속성 목록과 속성 테이블은 다음과 같음 - 최종 결합 SHP 파일을 CSV로 변환하여 데이터 세트(Data Set)를 구성함 2.3.7. 데이터 클렌징(Data Cleansing) : 파이썬(Python) 활용 - 본 분석에 들어가기에 앞서, 파이썬을 활용하여 데이터 세트의 클렌징을 진행함 - 기존의 데이터는 ‘지하철승차’, ‘지하철하차’, ‘버스승차’, ‘버스하차’의 값이 존재하지 않는 경우 NULL의 값이 들어가 있었는데, 이를 모두 0으로 변환하였음 - 또한, 분석의 용이함을 위해 데이터를 파이썬 Pandas 패키지의 데이터프레임(DataFrame) 형태로 전환하고, 속성(열) 이름을 영문으로 변경함 - 이러한 과정.. 2022. 7. 4.
데이터 정제_동 데이터 격자 데이터에 결합&격자별 속성 결합 2.3.4. 동 데이터 격자 데이터에 결합 - 동별 기온 등과 같은 단일 값들은 해당 동에 해당하는 격자데이터에 모두 동일한 값을 부여하였으며, 인구 데이터는 해당 동별 격자 개수로 나눠서 각각의 격자 데이터에 할당하였음 격자 데이터에 할당 대상 데이터 격자 데이터에 할당 대상 데이터 종로구, 중구 기온 행정동별 유동인구 서울시 지하철호선별 역별 승하차 인원 정보 서울특별시_버스노선별 정류장별 승하차 인원 정보 서울시 고령자현황 / 서울시 인구밀도 서울시 관광거리 정보 서울시 종로구 관광데이터 서울시 중구 문화관광 정보 서울시 신호등 관련 정보 서울특별시 종로구, 중구 공공와이파이 서비스 위치 정보 공공자전거 대여소 정보 중구, 종로구 사회복지시설 목록 2.3.5. 격자별 속성 결합 - 격자 대비 유동 .. 2022. 7. 4.
데이터 정제_주소데이터 위·경도로 변환&격자 내 속성 개수 계산 2.3.2. 주소데이터 위·경도로 변환 - 도로명 주소만 제공되고 있는 데이터들을 변환 가능한 주소 양식으로 전처리한 후, 구글 스프레드시트의 부가 기능인 ‘Geocode by awesome table’을 활용하여 도로명 주소를 위·경도 값으로 변환함 2.3.3. 격자 내 속성 개수 계산 - 지점 데이터의 경우, Q-GIS를 활용하여 격자별로 격자 내의 해당 속성 개수를 계산하여 결합하였음 2022. 7. 4.
데이터 정제_격자 생성 2.3.1. 격자 생성 - 대한민국 전체 지도 데이터에서 서울시를 추출한 후 종로구 중구의 지도 데이터 추출 진행 - 종로구, 중구 데이터(.shp)를 행정동 기준으로 구분 - 격자(50m×50m)를 만든 후, 종로구, 중구 행정동(.shp) 데이터에 위치로 선택 기능을 사용하여 종로구, 중구 격자를 생성 - 환경 경지 생태 자연도 데이터(.shp) 기반으로 업무지역, 주거지역 외의 격자를 제거하고, 접근 불가 지역 격자를 수기로 제거함 - 도로 데이터를 활용하여 종로구, 중구 도로 레이어에 버퍼 20m를 적용하여 도로에 인접한 격자 선택 이러한 과정을 통해, 분석에 활용할 최종 격자(6,936개)를 다음과 같이 생성함 2022. 7. 4.
데이터 상세 설명 2.2.1. 날씨 - (종로구 기온, 중구 기온 / csv) 기상청에서 제공하는 자료로, 행정동별로 자료가 제공되고 있음. 2020년 6월부터 8월까지의 날짜, 시간대별 기온 데이터가 포함되어 있음 - (서울시 기온 / csv) 기상청에서 제공하는 자료로 전국의 AWS(자동기상관측소)에서 측정한 기온을 서울시 구 단위 시간대별 자료로 제공. 2020년 6월부터 8월까지의 날짜, 시간대별 기온 데이터가 포함되어 있음 2.2.2. 공간 정보 - (대한민국 최신 행정 구역 / shp) 대한민국 행정 구역의 시도, 시군구, 읍면동에 대한 공간 데이터임 - (환경경지_생태자연도 / shp) 국가공간정보포털에서 제공하는 자료로, 산, 하천, 도시 등에 대하여 자연환경을 생태적 가치, 자연성, 경관적 가치 등에 따라.. 2022. 7. 4.