국가 바이오 빅데이터 인프라는 국가 차원에서 바이오 데이터를 수집, 관리하고 이를 활용하기 위한 시스템과 기술로 구성된 총합으로서, 디지털 바이오 패러다임 하에서 질병 진단, 신약 개발 및 치료법 개발 등 연구혁신 및 바이오산업 성장에 있어서 필수적 요소라 할 수 있다.
국내에서는 생명연구자원 빅데이터 구축전략, 디지털바이오 혁신전략 등 보건의료 빅데이터 구축을 통한 정밀의료 실현을 목표로 데이터를 축적, 활용하는 다양한 정책을 추진하고 있다. 특히 다부처 국가생명연구자원 선진화 사업을 통해 국가바이오데이터스테이션을 중심으로 데이터를 통합 관리하고, 분석·활용환경을 구축하여 서비스를 제공하는 사업이 추진 중이다.
해외 주요 선도국가에서는 국가 주도의 바이오 비전 수립 및 후속 실행전략을 수립하여 국가 바이오 데이터 생산 및 서비스가 구축, 운영되고 있으며 정밀의료 이니셔티브 등의 국가 정책사업으로 맞춤형 진단 및 의료로 분석결과를 연계하고자 노력하고 있다.
선도국 사례를 볼 때 국내에서도 국가 기술경쟁력을 확보하기 위한 선도적 노력이 필요하며 이를 위한 바이오 빅데이터 인프라의 발전 방향 수립 및 추진이 필요하다.
첫째, 데이터 생산 부문에서는 대규모 바이오 데이터의 구축 및 국가 전략적 자산으로서의 관리 및 활용체계 수립이 필요하다. 세부 방안으로 민감정보 활용과 개인정보 보호 문제를 해결하기 위한 법적 기반과 기술적 보호 체계 조성이 요구된다.
둘째, 데이터 저장 및 유통 부문에서는 현재 추진하고 있는 국가 데이터 수집 및 공유체계를 더욱 강화하는 한편 수집 데이터 간 연결성을 강화하여 데이터 제공과 유통을 활성화하는 노력이 필요하다.
셋째, 연구 및 산업 주체별 활용 부문에서는 대규모 데이터 활용을 지원하기 위한 하드웨어 및 정보지원 인프라 구축이 필요하다. 구체적으로 대규모 데이터 분석을 위한 컴퓨팅 계산자원을 구축하여 제공하고, 디지털 바이오 패러다임에 대응하는 AI 모델 및 연구 협업 네트워크 제공과 활용 지원을 통해 바이오 데이터 기반 연구를 활성화할 필요가 있다.