download0 view635
twitter facebook

공공누리This item is licensed Korea Open Government License

Title
JBIG 뷰어 원형 개발
Publisher
한국과학기술정보연구원
Korea Institute of Science and Technology Information
Publication Year
1997-12
Abstract
I. 제 목
JBIG 뷰어 원형 개발
II. 연구개발의 목적 및 중요성
1. 연구개발의 목적
현재 문서영상 데이터베이스 구축에서 주로 사용되고 있는 200 dpi 해상도의 문서영상은 600 dpi 해상도의 문서영상으로 대체할 필요가 있다. 그러나, 600 dpi 해상도의 문서영상은 그 크기가 매우 커서, 대용량의 저장장치를 필요로 하며, 또한 데이터 처리 시간도 많이 소요되어 실시간 처리가 곤란하다. 이러한 현실적인 제약 및 문제점으로 인해, 아직도 200 dpi 해상도의 문서영상 데이터베이스를 구축하고 있는 실정이다. 연구개발정보센터의 정보검색시스템인 KRISTAL-II에 구축된 문서영상 데이터베이스도 현재 200 dpi 해상도의 문서영상을 활용하고 있다.
이에, 본 연구에서는, 600 dpi 해상도의 문서영상 데이터베이스를 구축하여 양질의 서비스하는데 있어서의 현실적인 제약 및 문제점들을 극복할 수 있는 방안을 강구하고 그 효용성을 테스트하는 것을 기본 목적으로 한다.
문제점 해결 방법으로서는, JBIG의 높은 압축 기능과 다해상도 문서영상 제공 기능 등을 활용할 수 있다. 이에 따른 본 연구의 구체적인 목적은 다음과 같다.
KRISTAL-II에서의 문서영상 데이터베이스의 압축 효율성을 높이기 위한 방안으로서, 현재의 TIFF 포맷 문서영상을 JBIG 포맷의 문서영상으로 변환하는 TIFF-to-JBIG 변환 모듈을 개발한다.
실시간 처리가 가능하면서 사용자에게 보다 양질의 서비스를 제공하기 위한 방안으로서, 다단계의 문서영상 서비스가 가능한 JBIG viewer 원형 모듈을 개발하고 그 효용성을 테스트한다.
2. 연구개발의 중요성
최근에는 멀티미디어 환경이 발전함에 따라, 문서영상에 텍스트 뿐만 아니라 그래픽 및 해프토닝 그림도 많이 포함되어 있는 것이 일반적이다. 아울러, 사용자는 이러한 복합문서(mixed document)를 그대로 볼 수 있는 양질의 서비스를 요구하고 있다. 따라서, 현재 문서영상 데이터베이스 구축에서 주로 사용되고 있는 200 dpi 해상도의 문서영상은 다음과 같은 구체적인 이유로 600 dpi 해상도의 문서영상으로 대체할 필요가 있다.
현재의 200 dpi 해상도의 문서영상은 문자 위주로 되어 있는 과거의 문서에 있어서는 별로 문제가 없지만, 다양한 형태의 자료(예를 들어, 표, 수식, 아래 또는 위 첨자, 그래프, 도형, 해프토닝 그림 등)가 복합되어 나타나는 앞으로의 문서에 있어서는 질이 현저하게 떨어져 사용하기가 곤란하다.
사용자 측면에서 볼 때, 현재의 200 dpi 해상도의 문서영상은 문자 해독에 의한 내용만을 겨우 알아 볼 수 있는 정도로서, 결코 양질의 문서영상을 서비스 받고 있다고 생각할 수 없다.
질이 떨어지는 문서영상 데이터베이스를 한번 구축하면 앞으로도 계속 낮은 질의 문서영상을 서비스할 수 밖에 없다. 장래의 사용자가 보다 양질의 서비스를 요구해도 개선시킬 방법이 없다. 한번 구축된 문서영상 데이터베이스를 양질의 문서영상으로 대체하려고 하면, 기존 자료의 재수집도 어려울 뿐만 아니라 재구축하기 위한 경비도 엄청나게 소요되어 현실적으로 매우 곤란하게 된다.
한편, 보다 양질의 문서영상 데이터베이스를 구축하는 것은 과거 자료의 보관 측면에서도 좋다. 낮은 질의 문서영상은 작은 양의 정보만을 포함하게 되고, 높은 질의 문서영상은 많은 양의 정보를 나타낼 수 있기 때문이다. 후세에도 계속 사용될 자료라면 보다 많은 정보가 살아 있는 자료를 보관하는 것이 당연하다.
KRISTAL-II에서도, 장기적인 안목에서 볼 때, 문서영상을 현재의 200 dpi 해상도에서 600 dpi 해상도로 높여, 질 좋은 문서영상 데이터베이스를 구축해 놓을 필요가 있다.
본 연구에서는, 문서영상에 대한 압축율이 좋은 JBIG 방식으로 TIFF 포맷의 문서영상을 변환해 주는 TIFF-to-JBIG 변환 모듈을 개발하여 성능을 테스트하고, 또한 실시간 처리??다. 따라서, 본 연구의 결과는 앞으로 KRISTAL-II에서의 문서영상 데이터베이스 구축 방향 및 양질의 서비스 방안에 대한 장기적인 계획 수립에 도움이 될 것이다.
III. 연구개발의 내용 및 범위
1. 연구개발 내용
본 연구에서는, 먼저 KRISTAL-II에서의 TIFF Viewer를 분석하여, TIFF 파일을 복원하는 기술을 습득하고, 아울러 KRISTAL-II와의 통신을 위한 프로토콜 및 네트워크 서비스에 관련된 기술을 익힌다.
다음에는 JBIG 압축방법을 구현하여 TIFF-to-JBIG 변환 모듈을 완성한다. 이 모듈은 이미 TIFF 포맷으로 압축 저장되어 있는 KRISTAL-II에서의 문서영상 파일들을 JBIG 포맷으로 변환해 주는 모듈로서, 오프라인(off-line) 일괄처리(batch processing) 방식으로 동작될 것이다. 문서영상 데이터베이스를 새로 구축하거나 또는 추가 구축하는데 사용할 문서영상은 이 모듈에서의 JBIG 압축방법을 그대로 활용하면 된다. 이 모듈을 이용하여 현재 KRISTAL-II에서의 문서영상을 JBIG 포맷으로 변환함으로써, 압축율의 개선 정도를 실험적으로 측정한다.
마지막으로, TIFF Viewer와 기능적으로 동일하게 동작하는 JBIG Viewer 원형을 개발한다. 이 원형 모듈은 JBIG 포맷으로 압축 저장된 문서영상 파일들을 복원하여 사용자의 요구 및 목적에 적합한 형태로 서비스해 주는 것이다. 다단계의 문서영상 서비스에 의한 검색시간 및 통신시간 감축 방안을 개발하고, 그 성능을 테스트한다. 또한, JBIG의 resolution reduction 기능을 최대한 활용한 해상도 변환 디스플레이 기능을 구현하여 양질의 문서영상 서비스가 가능하도록 한다. 아울러, 그래픽 사용자 인터페이스(GUI)를 설계함에 있어, 보다 사용자에게 편리한 기능들도 개발한다.
2. 연구개발 범위
본 연구의 목적은 JBIG 방식을 이용한 문서영상 데이터베이스 구축 및 서비스에 대한 타당성을 검토하기 위한 JBIG Viewer 원형을 개발하는 것이므로, 개발기간을 단축하기 위해 기존의 사용가능한 자료 및 프로그램을 최대한 활용한다.
본 연구의 결과물인 JBIG Viewer 원형 모듈은 KRISTAL-II에서의 검색 모듈과 직접 연계되어 동작되어야 하지만, 실제로 연결시켜 테스트하기가 곤란하므로, 검색단계에서의 모든 교환정보 및 자료를 활용하여 실제와 동일하게 시뮬레이션함으로써 그 효용성을 검토한다.
TIFF-to-JBIG 변환 모듈은 오프라인 방식의 독립적인 프로그램으로 개발한다. 이것은 기존의 TIFF 포맷의 문서영상을 JBIG 포맷의 문서영상으로 변환하는 것으로서, JBIG Viewer와 온라인 방식으로 동작할 필요가 없을 뿐만 아니라 JBIG Viewer 원형 모듈과 연계될 필요도 없기 때문이다.
문서영상으로는 KRISTAL-II에 이미 구축되어 있는 것의 일부를 활용한다. 이에 따라, 보다 실제적인 영상압축 효과의 측정이 가능하다. 또한, JBIG의 압축 성능을 객관적으로 평가하기 위해 다양한 형태의 대표적인 복합문서를 선택하여 테스트한다.
문서영상의 다해상도 변환 디스플레이 기능과 다단계 서비스 기능에 대한 테스트는 600 dpi 해상도의 문서영상을 대상으로 한다. 200 dpi 해상도 문서영상에서는 이러한 기능의 효과를 제대로 알 수 없기 때문이다.
IV. 연구개발결과 및 활용에 관한 건의
1. 연구개발결과
본 연구를 통해 확보된 기술 및 개발 결과물은 다음과 같다.
KRISTAL-II에서의 ""원문보기"" 기능과 관련된 네트워크 관리 기술
TIFF 문서영상의 복원 기술
JBIG 압축 기술 및 프로그램
TIFF-to-JBIG 변환 프로그램
TIFF 및 JBIG 문서영상 처리용 JBIG Viewer 원형 프로그램
JBIG의 Resolution Reduction 기술 및 관련 프로그램
관심부분 중심의 영상 Zoom 기술 및 Panning 기술
본 연구에서의 실험을 통해 얻어진 결과는 다음과 같다.
KRISTAL-II에서의 논문 관련 문서영상 112개에 대해 TIFF 방식 및 JBIG 방식으로 압축해 본 결과, JBIG 방식이 TIFF 방식보다 약 13.7% 정도의 저장용량 절감 효과가 있었다.
문자, 표, 그래프, 수식, 해프톤 그림 등을 부분적으로 포함하고 있는 대표적인 문서영상 4종류에 대해 TIFF 및 JBIG 방식으로 압축해 본 결과, JBIG 방식이 약 31.6% 정도의 압축율 개선 효과가 있었다.
여러 해상도의 문서영상에 대한 압축 및 복원 시간, 화면에의 디스플레이 시간, Resolution Reduction에 의한 해상도 변환 시간 등을 측정한 결과, 300 dpi 해상도까지는 거의 비례적으로 증가하였으나 600 dpi 해상도에서는 모든 시간이 급증하는 현상이 나타났다. 이것은 개인용컴퓨터에서의 주 메모리 용량 및 그래픽 카드 메모리 용량의 제한 때문에 발생하는 현상으로 추측된다.
압축된 문서영상을 네트워크를 통해 받아서 모니터에 디스플레이 하기까지의 시뮬레이션 시간은 JBIG 방식이 TIFF 방식에 비해 상대적으로 2-13배 많이 걸렸다. 그러나, 200 dpi 및 300 dpi 해상도 문서영상에 대해서는 각각 평균적으로 5초와 10초 정도가 걸렸다. 이 정도의 지연 시간은 사용자가 별로 지루하지 않게 기다릴 수 있는 시간이다.
문서영상 데이터의 전송시간은 전체 시간에 비해 매우 작으면서, 해상도에 따른 차이도 크지 않았다. 따라서, 600 dpi 해상도 문서영상의 전송도 별로 부담이 되지 않았다.
사람이 모니터에 디스플레이 된 문서영상을 인식하는 데는 150 dpi 해상도 정도가 적당하였다. 75 dpi 해상도에서는 문서 전체에 대한 윤곽을 알 수 있었고, 300 dpi에서는 첨자까지도 확실이 볼 수 있었다.
따라서, 이와 같은 실험 결과를 종합하여 볼 때, 검색 과정에서는 300 dpi 해상도를 기준으로 하고, 프린트 과정에서는 600 dpi를 활용하는 방식의 다단계 서비스가 적당함을 알 수 있었다. 즉, 서버의 문서영상 데이터베이스에서는 600 dpi 해상도의 압축된 데이터로 저장하고 있다가 요구가 있으면 그대로 클라이언트에게 전송해 주고, 클라이언트에서는 300 dpi 해상도로 복원하여 150 dpi 해상도를 기준으로 하여 모니터에 디스플레이 한다. 만약 클라이언트에서의 사용자가 프린트 출력을 요구하면, 시간이 걸리더라도 600 dpi 해상도로 복구하여 처리해 줌으로써, 양질의 문서영상 서비스가 가능하다.
한편, 현재의 200 dpi 문서영상에 대해서는, 200 dpi 해상도로 복원하되, 검색 단계에서는 100 dpi 해상도를 기준으로 하여 디스플레이하고, 필요하면 사용자가 50 이나 200 dpi로 변환하여 디스플레이 할 수 있도록 서비스하는 것이 좋을 것으로 판단된다. 물론, 프린트 출력은 200 dpi 해상도 데이터를 사용한다.
디스플레이 해상도 변환에 있어, JBIG에서의 Resolution Reduction 방식이 보간법이나 샘플링에 의한 다른 방법보다 양질의 영상을 제공함을 알 수 있었다.
관심부분 중심의 Zoom In/Out 기능을 제공함으로써 사용자의 문서영상 검색에 매우 도움을 줄 수 있었다. 즉, 사용자가 확대 및 축소를 원하는 부분이 화면 중앙에 나타나도록 함으로써, 불필요한 스크롤이나 Panning 동작을 할 필요가 없어졌다.
또한, Panning 기능을 개발함으로써, 화면에서 스크롤 바를 움직여야 하는 불편을 해소하였다.
2. 연구개발결과 활용에 대한 건의
문서영상을 현재의 200dpi 해상도로 유지할 경우, 검색시에는 100 dpi 정도 해상도의 문서영상을 기본으로 하여 서비스하는 방안 검토
본 연구에서 개발된 관심부분 중심의 Zoom In/Out 기능과 Panning 기능을 기존의 TIFF Viewer에 적용하는 방안 검토


This report describes the TIFF-to-JBIG transformer and the prototype of JBIG viewer which are developed in order to estimate validity of the JBIG in constructing a document image database and improving quality of document image service. The procedure of document image retrieval in the KRISTAL-II developed by the KORDIC is also analyzed and presented in this report.
The TIFF-to-JBIG transformer is to transform document images compressed by the CCITT recommendation T.6 into those by the JBIG or the CCITT recommendation T.82. The TIFF decoder part of the transformer was implemented by modifying that of the TIFF viewer in KRISTAL-II and the JBIG encoder part by analyzing a JBIG shareware. Through an experiment of compression efficiency with the document images stored in the KRISTAL-II, about 13.7% of the amount of memory could be saved with the JBIG against the CCITT recommendation T.6.
The JBIG viewer consists of three modules; the network management module, the JBIG decompression module, and display management module. The network management module is implemented by modifying that of the TIFF viewer and the display management module is developed by ourselves. A zoom function based on the resolution reduction technique in the JBIG is implemented in the display management module. Especially, a zoom area selection technique based on user interest is designed and implemented. This technique enables the center of a zooming area pointed by user to be located on the center of the display monitor after for the area being zoomed.
Experimental result about the document retrieval technique in two levels is shown and its usefulness is discussed. Both the 200 dpi resolution document image and the 600 dpi resolution document image are experimented to show its usefulness.
Files in This Item:
There are no files associated with this item.
Appears in Collections:
7. KISTI 연구성과 > 연구보고서 > 1997
URI
https://repository.kisti.re.kr/handle/10580/10517
http://www.ndsl.kr/ndsl/search/detail/report/reportSearchResultDetail.do?cn=TRKO200500060215
Export
RIS (EndNote)
XLS (Excel)
XML

Browse