복잡한 사회현안의 이해와 해결을 위해 각 분야의 여러 데이터를 다각적으로 분석하고자 하는 요구사항이 증가하고 있으며 공공분야를 비롯해 민간분야 데이터까지 다양하게 연계해서 활용하는 사례도 늘어가고 있다. KISTI는 「AI 기술을 활용한 공공데이터 기반 지역현안 솔루션 개발 및 상용화 사업」을 통해 데이터셋을 효율적으로 연계하여 활용할 수 있는 데이터셋 연계전략을 수립하였다. KISTI의 데이터셋 연계전략은 공공데이터포털의 데이터셋 57,421종의 항목명 200만 여개와 지진, 침수, 미세먼지 연구분야에서 활용된 연계 데이터셋 사례를 분석하여 마련되었으며, 항목명 표준화와 데이터값 표준화를 기반으로 한다. 본 이슈브리프에서는 KISTI에서 수립한 데이터셋 연계전략과 함께 실제 데이터셋 연계를 위해 추진한 항목명 표준화 및 데이터값 표준화 방안과 이를 통한 데이터셋 연계결과를 소개한다.
소개되는 데이터셋 연계전략은 여러 데이터셋을 동시에 활용하고자 하는 모든 분야에서 적용할 수 있는 범용적인 방안이 될 수 있을 것으로 기대된다. 향후 KISTI는 데이터셋 연계의 핵심 전략과 기술을 보다 발전시켜 데이터셋의 공동활용성을 제고하고 이를 통해 데이터셋의 활용과 확산에 기여할 계획이다.