본문 바로가기
데이터 분석/공공빅데이터 프로젝트

데이터 정제_데이터셋 생성&데이터 클렌징

by 세희홍 2022. 7. 4.

2.3.6. 데이터 세트(Data Set) 생성

- 최종적으로 결합 완료한 레이어의 속성 목록과 속성 테이블은 다음과 같음

 

- 최종 결합 SHP 파일을 CSV로 변환하여 데이터 세트(Data Set)를 구성함

 

2.3.7. 데이터 클렌징(Data Cleansing) : 파이썬(Python) 활용

- 본 분석에 들어가기에 앞서, 파이썬을 활용하여 데이터 세트의 클렌징을 진행함

- 기존의 데이터는 지하철승차’, ‘지하철하차’, ‘버스승차’, ‘버스하차의 값이 존재하지 않는 경우 NULL의 값이 들어가 있었는데, 이를 모두 0으로 변환하였음

 

 

- 또한, 분석의 용이함을 위해 데이터를 파이썬 Pandas 패키지의 데이터프레임(DataFrame) 형태로 전환하고, 속성() 이름을 영문으로 변경함

 

- 이러한 과정을 통해, 다음과 같이 최종적으로 분석에 활용할 최종 데이터 세트(Data Set)를 구성함

 

댓글