Yoon, Hwa-Mook; Seo, Jung-Hyun; Choe, Yoon-Soo; Choe, Seong-Pil; Jin, Doo-Seok; Lee, Min-Ho; Kim, Gwang-Young; Jung, Chang-Hoo; Jo, Min-Hee
Publisher
한국과학기술정보연구원 Korea Institute of Science and Technology Information
Publication Year
2007-07
Description
funder : 국무조정실
Abstract
Ⅱ. 연구개발의 목적 및 중요성
o 국사편찬위원회를 중심으로 서울대학교 규장각, 경상대학교 문천각, 민족문화추진회, 한국국학진흥연구원, 한국학중앙연구원, 독립기념관 등에서 대규모의 고서를 데이터베이스화하는 사업이 활발하게 진행 중임. 전북대학교 호남지역기록문화정보시스템은 이러한 사업과 연계하여 호남지역의 고문서를 데이터베이스화하여 서비스하고 있음.
o 고문서는 한자를 기반으로 기록되어 있으며, 중국어와는 다른 특징이 많아서 별도의 색인기법을 개발하는 것이 서비스시스템의 성능에 큰 영향을 미침. 기존 고문서 색인방식은 다중 n-gram 방식을 채택하여 색인의 크기가 매우 무거웠으므로 확장 낱자 색인기법과 같이 이를 대체할 새로운 기술이 필요하며 한국어와 한자의 특성을 반영하여 색인할 수 있는 다중음가사전 및 이체자 사전의 적용이 필수적임.
o 기존의 고서 검색시스템은 기본 4~5분의 검색이 소요되었으며 심지어 수십분에 걸친 검색시간이 소요되어 실질적인 검색서비스가 불가능하였음. 이러한 문제를 해결하기 위해 새로운 기법의 검색기법이 필요함. 또한 다양한 형태로 기록되는 동의어를 동시에 검색할 수 있는 질의확장 기법이 제공되어야 함.
o 검색결과의 하이라이팅은 사용자에게 빠른 정보를 제공하기 위해서는 필수적인 모듈로서 색인 및 검색과 마찬가지로 고문서의 특징을 제대로 반영하여야함.