2.3.6. 데이터 세트(Data Set) 생성
- 최종적으로 결합 완료한 레이어의 속성 목록과 속성 테이블은 다음과 같음
- 최종 결합 SHP 파일을 CSV로 변환하여 데이터 세트(Data Set)를 구성함
2.3.7. 데이터 클렌징(Data Cleansing) : 파이썬(Python) 활용
- 본 분석에 들어가기에 앞서, 파이썬을 활용하여 데이터 세트의 클렌징을 진행함
- 기존의 데이터는 ‘지하철승차’, ‘지하철하차’, ‘버스승차’, ‘버스하차’의 값이 존재하지 않는 경우 NULL의 값이 들어가 있었는데, 이를 모두 0으로 변환하였음
- 또한, 분석의 용이함을 위해 데이터를 파이썬 Pandas 패키지의 데이터프레임(DataFrame) 형태로 전환하고, 속성(열) 이름을 영문으로 변경함
- 이러한 과정을 통해, 다음과 같이 최종적으로 분석에 활용할 최종 데이터 세트(Data Set)를 구성함
'데이터 분석 > 공공빅데이터 프로젝트' 카테고리의 다른 글
분석 결과_상관분석&가중치 시나리오 (0) | 2022.07.04 |
---|---|
분석 프로세스 (0) | 2022.07.04 |
데이터 정제_동 데이터 격자 데이터에 결합&격자별 속성 결합 (0) | 2022.07.04 |
데이터 정제_주소데이터 위·경도로 변환&격자 내 속성 개수 계산 (0) | 2022.07.04 |
데이터 정제_격자 생성 (0) | 2022.07.04 |
댓글