(1)과제 수행 인터뷰_관로 노후화 의심구역 선정을 위한 수질정보 분석
< 방향 설정을 위한 1차 인터뷰>
1. 인터뷰 개요
❍ 일시 : 2021.10.12. 14:30~16:00
❍ 장소 : 한국환경공단 빅데이터관리부 회의실
❍ 참석자 : 환경기술연구소 토양폐기물분석부 전현선 대리
2. 주요 내용
<분석소개>
정수장 및 수도꼭지의 월별 법정 수질 정보를 비교·분석하여 관로 구간에서의 수질변동 파악
<질의응답>
Q1. 공공데이터로 확인할 수 있는 데이터에는 수도꼭지 수질 자료에 있는 위치 정보와 상세 측정값이 나와 있지 않습니다. 아이디어 기획 당시에 확인했던 데이터는 어떤 형태인지와 분석에 필요한 측정값(구리, 아연, 철, 망간 등)이 있는지 알고 싶습니다.
A1. 우선, 수도꼭지 상세위치나 관로 위치에 대한 정보는 없습니다. 4가지 항목 (구리, 아연, 철, 망간)의 값들은 있습니다. ‘국가상수도정보시스템’에서 데이터를 받을 수 있어서 직접 확인하는 것이 더 정확할 것 같습니다. 다만, 데이터를 이전할 때, 문제가 발생하여 2017년부터의 데이터가 좋은 데이터라고 들었습니다.
Q2. 분석 방법 예시에서 여수시 ‘둔덕 정수장’과 지역 수도꼭지 월별 수질검사 자료를 비교하셨는데, 이 지역이 사용된 이유가 있는지 알고 싶습니다.
A2. 전국을 대상으로 필터링을 걸었을 때, 눈에 띄는 수치를 보였기에 선정하였습니다.
Q3. 수도꼭지 월별 법정 수질검사자료에 형태에 따라 지역을 선정하려고 하는데 분석하신 지역 범위가 있는지 알고 싶습니다.
A3. 따로 지역을 선정하고 분석하지 않았고 전국을 대상으로 좁혀나갔습니다.
Q4. 경향성 판단이 주요 분석 방법인데 경향성 판단 조건(1년 내 6회 이상 또는 5년 내 15회 이상)에 법정 기준이나 근거가 있는지 알고 싶습니다.
A4. 경향성 판단조건은 법적 근거 기반이 아닌 비교분석 결과를 기반으로 자체 규정한 것입니다. 법정 기준은 따로 없는 것으로 알고 있습니다.
Q5. 4가지 측정값(구리, 아연, 철, 망간)들 이외에 관로 노후화에 영향을 미치는 다른 요인들이 있는지 알고 싶습니다.
A5. 4가지 측정값이 관로 노후화에 의해서만 측정되는지와 그 외에 항목들이 영향에 미치는지에 대한 것은 기술진단(상수도관리부)에 문의가 필요할 것 같습니다.
Q6. 기대효과에 기재되어 있는 수질 관심 구역선정을 통해 의사결정과정에 활용될 수 있는 여지가 있는지 알고 싶습니다.
A6. 네. 사용될 수는 있습니다.
3. 향후 계획
❍ 추후 분석 방향 설정
< 분석 진행을 위한 2차 인터뷰>
1. 인터뷰 개요
❍ 일시 : 2021.11.05. 15:00~16:00
❍ 장소 : 환경산업연구단지 B21 회의실
❍ 참석자 : 환경기술연구소 토양폐기물분석부 전현선 대리
2. 주요 내용
<질의응답>
Q1. 데이터에 대한 설명이 필요합니다. 정수장과 수도꼭지 데이터에서 어떤 항목들을 사용하여 분석을 진행하였나요?
A1. 측정 시점(년도 월일)과 시설물 번호를 주요 변수로 활용하였습니다. 시설물 번호는 정수장의 고유번호입니다.
Q2. 초과데이터 결과 파일이 있는데, 어떻게 분석하신 건가요?
A2. 파이썬 output 파일을 가지고 피벗 테이블을 작성한 것입니다. ‘1’은 기준을 초과한 횟수를 말합니다.
Q3. 노후 수도꼭지 데이터만 사용하여 분석하신 것이 맞나요?
A3. 네. 일반 수도꼭지는 해당 항목들을 측정하지 않습니다. 간혹 측정한 경우가 있는데, 예외적인 상황이라고 판단하여 제외하였습니다.
Q4. 복사본 QGIS에서 지역 코드별로 4가지 항목에 입력된 숫자가 총 초과 횟수를 말하는 건가요?
A4. 네.
Q5. 충남 논산시 석성 정수장 급수지역에 대한 시계열 분석에서 수질 값이 어떤 것을 말하는 건가요?
A5. 심층 분석 부분부터는 기대 효과처럼 작성한 부분이라 정확한 분석이 진행 되지 않았습니다. 그래서 해당 결과가 정확하게 나왔다고 할 수 없습니다. 이상값과 같이 튀는 데이터를 제외하고 나온 결과이며, 수질 값은 ‘아연’을 비교한 것입니다.
Q6. 수질 값이라는 것이 무엇을 의미하나요?
A6. 수질 값은 암모니아성 질소, 철, 아연, 구리, 염소이온, 잔류염소 등 노후 관로에서 측정되는 항목들에 대한 정수장 대비 수도꼭지 차이를 말합니다.
Q7. 데이터를 살펴보면 ‘0’과 ‘불검출’을 볼 수 있는데, 그 둘의 차이점이 무엇 인가요?
A7. ‘불검출’은 아예 측정되지 않은 값이고, ‘0’은 아주 미세하게나마 검출된 값을 말합니다. 총대장균과 대장균 같은 항목들은 어느 정도 이하로 측정되면 불검출로 표기한다는 규정이 있을 것입니다. 한번 찾아보시면 좋을 것 같아요.
Q8. 노후관에서 측정하는 4가지 항목 이외에 잔류염소 등 항목을 모두 포함하여 분석을 진행하신 것 같은데, 왜 모두 포함하여 분석하신 건가요?
A8. 분석오류를 최대한 안 나게 하려고 원본 데이터를 최대한 유지한 채로 분석을 진행하였습니다.
3. 향후 계획
❍ 데이터 파악 후 전처리 및 분석 진행