- 공공·민간 데이터 제공하는 데이터 분석 플랫폼 구축
- 금융, 보건, 교통 등 융합해 ‘빅데이터센터 클러스터’로 확대

통계청에서 통계빅데이터센터장을 맡고 있는 오세안 사무관이 ‘통계빅데이터센터’ 창설의 의미를 설명하고 있다./에이티엔뉴스=이기종 기자

4차 산업혁명의 핵심 기반으로 꼽을 때 빠지지 않는 분야가 있는데, 바로 ‘빅데이터(Big Data)이고, 일명 ‘데이터 금맥’으로 불린다.

현재 빅데이터는 사회적 시스템에서 사고 팔 수 있는 무형의 자산으로 인정받고 있어 경제적 이익을 확대하기 위해 세계 여러 나라는 빅데이터 연구에 과감한 투자를 하고 있다.

그러나 빅데이터를 바라보는 시각은 다양하고 이를 평가하는 기준도 다르기 때문에 진정한 빅데이터를 확보하기는 쉽지도 않고 개인정보보호법과 저촉이 되는 경우도 많아 개인적인 목적으로 활용하기도 어렵다.

최근 통계청에서 이러한 문제를 해결하기 위해 ‘통계빅데이터센터’를 창설해 올해부터 본격적으로 운영하면서 개인이 필요한 자료도 제공하고 있어 오세안 통계빅데이터센터장을 만나 창설취지, 이용방법, 기대효과 등을 살펴본다.<편집자 주>
 
- ‘통계빅데이터센터’란?
 
▷ ‘통계빅데이터센터’는 개인정보의 침해 없이 민간데이터와 통계데이터 등 공공데이터를 안전하게 연계ㆍ활용할 수 있는 데이터 분석 플랫폼이며, 철저한 보안관리가 구축된 공간에서 자유롭게 데이터를 분석할 수 있는 환경을 제공하는 곳이다.

2016년부터 시범적으로 운영하다가 작년에 예산을 반영해 3곳에 센터를 구축했고 올해부터 본격적으로 운영하고 있다.
 
대전센터(통계센터 위치)는 분석실 32석의 규모로 교육장과 회의실, 상담실을 갖추고 있으며, 서울센터(데이터산업진흥원 위치)와 부산센터(센텀기술창업센터 위치)는 각각 10석, 8석 규모의 분석실을 운영하고 있다.

각 센터는 센터 설치기관과의 협력체계를 유지하며 운영되지만 데이터를 가상 서버를 통해 중앙인 대전센터에서 통제한다.
 
- ‘통계빅데이터센터’의 특징은?
 
▷ 가장 큰 특징은 국내 인구, 사업체 등에 대한 전수 자료를 제공하고 있고 있으며, 수집한 자료를 정제, 통계적으로 가공한 고품질 자료로 이용자가 활용하기 용이하다는 점이다.

현재는 행정자료를 수집하여 가공한 행정통계자료(통계등록부), 통계청이 MDIS를 통해 제공하는 승인된 통계기초자료(마이크로데이터), 과학기술정보통신부에서 민간기관과 협약을 통해 확보한 민간자료(통신사 데이터 등 20여종)를 제공하고 있다.

둘째, 센터에서 제공하는 자료와 이용자가 보유한 자료를 가지고 와서 자유롭게 연결·융합하여 데이터를 분석할 수 있다.

지금은 ‘정확한 매칭’에 의한 자료연계․분석만 지원하고 있는데, 2019년에는 ‘확률적 매칭’이 가능한 자료연계시스템을 개발하여 2020년부터 누구나 활용할 수 있도록 서비스할 예정이다.

셋째, 데이터 분석을 어떻게 해야 할지 난감할 때 전문가의 도움을 받을 수 있다.

센터에는 데이터 전문가가 상주하여 자료 이용에 대한 컨설팅 및 자료연계분석 지원서비스를 제공함과 동시에 직접 센터에 방문하지 않더라도 상담을 통해 이용자가 요청하는 자료를 분석해주는 주문형 서비스도 제공한다.

아울러 빅데이터 분석과 관련한 다양한 교육을 진행하여 이용자의 데이터 리터러시(Data Literacy)를 제고함으로써 누구나 데이터를 분석․활용할 수 있도록 지원한다.

- ‘통계빅데이터센터’를 이용하는 방법은?

▷ 이용절차는 5단계로 구분되는데, 이용신청-이용승인-자료분석 및 반출신청-자료반출승인-개인활용 순이다.

우선 홈페이지(data.kostat.go.kr)를 통해 이용신청을 해야 하며, 이용 목적 등을 검토하여 통계빅데이터센터에서 승인여부를 통보한다.

승인받은 이용자는 본인이 신청한 센터(대전, 서울, 부산)에 방문하여 자료를 분석하고, 분석한 자료를 센터 밖으로 가지고 나갈 수 있도록 반출 신청을 한다.

통계빅데이터센터에서는 반출 신청한 분석 결과물을 검토하여 반출을 승인한다.

분석결과물의 반출은 개인 또는 단체의 정보가 노출되지 않도록 통계표 형태로 집계된 자료만 허용되며, 외부 반출을 통해 개인 또는 단체의 재식별 가능성이 있는 경우에는 반출이 금지된다.

통계빅데이터센터에서는 개인정보보호를 위해 모든 자료는 비식별화 조치 후 사용하여야 하며, 센터 이용 시 이용자는 데이터 분석을 위해 승인받은 자료 및 장비를 센터 내부에 반입하여 사용할 수 있다.

통계청 ‘통계빅데이터센터’의 통계분석전문가들이 ‘데이터 분석 서비스’를 제공하고 있다./에이티엔뉴스=이기종 기자

- 앞으로 통계청의 계획은?

▷ 4차 산업혁명시대에 데이터의 중요성이 증가하고 있다. 그러나 아직까지는 데이터의 가치를 알고 있는 전문가 위주로 데이터를 활용하고 있다.

앞으로 데이터 민주주의 차원에서 소수가 아닌 다수가 데이터를 활용해 이익 창출을 위해 유용하게 이용되기를 기대하고 있다.

이를 위해 많은 국민들이 쉽게 데이터에 접근하고 다양한 분석을 쉽게 할 수 있도록 온라인서비스 및 자료연계시스템을 구축하여 2020년부터 서비스 할 계획에 있다.

또한, 기관마다 데이터를 제공하다 보니 이용자 입장에서 데이터를 활용하기 불편하다는 요구가 많아 통계빅데이터센터를 ‘빅데이터센터 클러스터’로 확대할려고 한다.

이를 통해 통계청 자료 외에 금융, 보건, 에너지, 교통 등 국내의 다양한 데이터를 활용할 수 있는 체계를 구축해 나갈 예정이다.

앞으로 ‘빅데이터센터 클러스터’가 구축되면 현재 각 기관에서도 운영하는 빅데이터센터의 중복성 등 단점을 개선 및 보완할 수 있고 이용자 입장에서도 데이터 이용의 편리성이 증대될 것으로 기대하고 있다.

이를 위해 빅데이터를 서비스하고 있는 국민건강보험공단, 건강보험심사평가원, 한국전력 등에서 운영하고 있는 빅데이터센터와 원활한 데이터 네트워크 구축을 검토하고 있다.

- 마지막으로 하고 싶은 말은?

▷ ‘통계빅데이터센터’는 데이터를 활용하고자 하는 분들의 방문을 맞이할 준비가 되어 있다.

‘통계빅데이터센터’는 올해부터 첫 운영되어 시행착오가 있을 것이고, 또한 개인정보보호 등 법·제도적인 제한이 있기에 센터를 이용함에 있어서 조금은 불편할 것으로 본다.

우리는 2016년부터 시범적으로 운영하면서 가장 큰 고려사항이 ‘편의성’과 ‘안정성’이라는 것을 익히 알고 있어 앞으로 이용자에게 더 좋은 정보를 제공할 수 있는 여건으로 서로 조화를 이룰 수 있는 좋은 방법을 찾아 개선하는 노력을 계속할 것이다.

저작권자 © 에이티엔뉴스 무단전재 및 재배포 금지