데이터 분석/한국환경공단 인턴
(6)데이터 분석 및 시각화_관로 노후화 의심구역 선정을 위한 수질정보 분석
세희홍
2022. 7. 11. 14:54
4. 데이터 분석
❍ 정수장 대비 수도꼭지 수질 데이터(암모니아성 질소, 망간, 아연, 구리, 철, 염소이온) 차이에 대한 경향성 분석
❍ 항목별 수질 데이터의 차이가 증가 경향성인 경우를 선정
❍ 분석한 6가지 항목(구리, 아연, 철, 염소이온, 암모니아성 질소, 망간) 중에서 구리, 아연, 철, 염소이온에서 유의미한 결과를 확인하였고, 암모니아성 질소, 망간은 변동이 거의 관측되지 않아 제외함
#암모니아성질소 시각화 코드
final = openpyxl.load_workbook(waterplant_num+watertab_name+".xlsx")
fi = final.get_sheet_by_name("Sheet1")
chart = openpyxl.chart.LineChart()
chart.title = waterplant_num + "_" +watertab_name+"(암모니아성질소)" chart.x_axis.title = "검사년월"
chart.y_axis.title = "수치(mg/L)"
chart.y_axis.scaling.min = -0.1 #값 확인하고 스케일링 값 설정
chart.y_axis.scaling.max = 0.15 #값 확인하고 스케일링 값 설정
datas = openpyxl.chart.Reference(fi, min_col=3, min_row=1, max_col=3, max_row=61)
chart.add_data(datas, from_rows = False, titles_from_data = True)
cats = openpyxl.chart.Reference(fi,min_col=2, min_row=2, max_col=2, max_row=61)
chart.set_categories(cats)
fi.add_chart(chart, "R2")
final.save(waterplant_num+watertab_name+".xlsx")
final.close()
5. 분석 결과 시각화
❍ QGIS를 활용하여 분석 결과를 시각화
- 정수장 대비 수도꼭지 수질 데이터의 차이가 최소 1개 이상 있는 곳 (34군데)의 수도꼭지 상세 주소를 좌표(X:경도, Y:위도)로 변환하여 항목별(철, 구리, 염소이온, 아연)로 시각화
- 상세 주소가 정확히 기재되어 있지 않은 2곳(‘진로집’, ‘계화’)을 제외한 32곳 시각화
- 항목별(구리, 아연, 염소이온, 철) 시각화
❍ QGIS를 활용하여 군집화
- 항목별(구리, 아연, 염소이온, 철)로 시각화했을 때, 겹치는 구역을 군집화하여 4가지 항목 간의 연관성 추측