한국과학기술정보연구원(KISTI) 글로벌대용량실험데이터허브센터(GSDC)는 유럽핵입자물리연구소(CERN)의 대형 하드론 충돌기 실험(ALICE)에서 생성된 원시 데이터를 보존하기 위한 전 세계 대형 하드론 충돌기 그리드(WLCG) 티어-1 센터이다.
장기적인 데이터 보존을 위해 흔히 사용되는 물리적 매체는 테이프이다. 이 매체는 신뢰성과 용량 당 가격 면에서 광디스크, 하드디스크 및 솔리드스테이트 디스크와 비교하여 가장 경제적인 선택이다. 그러나 테이프 드라이브와 카트리지 제조업체의 감소와 그들 간의 특허 분쟁으로 인해 2017년 이후 시장 위험이 증가하고 있다.
이러한 테이프 기반 데이터 보존 전략에 대한 대안으로서, KISTI GSDC는 Exascale Open Storage(EOS)에 기반한 디스크 전용 Erasure Coding(EC) 아카이빙 스토리지 시스템인 Custodial Disk Storage(CDS)를 제안하였다.
CDS 시스템은 고밀도 JBOD 인클로저 18개와 12 Gbps Serial Attached SCSI(SAS), Host Bus Adapter(HBA) 인터페이스를 통해 9개의 서버에 다중 경로로 연결되어 안정성과 강력한 데이터 보호 전략을 제공한다. 데이터 보호를 위해 Reed-Solomon(RS)(16, 4) EC 레이아웃을 도입하여 연간 데이터 손실 확률이 5×10-14로 매우 낮아진다.
본고에서는 고밀도 JBOD 제품을 기반으로 한 CDS 시스템 설계, 성능 제한, EOS EC에 기반한 데이터 보호 전략에 대해 소개하였다.
더불어 ALICE 실험을 위한 CDS 운영과 중장기 전력 소모량 측정 결과를 제시하였다.