Jeong, Yu-Cheol; O, Heung-Seon; Park, Jae-Won; Ryu, Beom-Jong
Publisher
한국과학기술정보연구원 Korea Institute of Science and Technology Information
Publication Year
2015-01
Description
funder : 미래창조과학부 funder : KA agency : 한국과학기술정보연구원 agency : Korea Institute of Science and Technology Information
Abstract
1) 관련 연구 조사
- 개체명 인식 관련 연구에 대한 조사를 통해, 유사 사례 분석 및 비교 연구
2) 정보 객체 태그셋 정의 및 태깅툴 구현
- 정보 객체 태깅에 필요한 태그셋 정의
- 논문 텍스트를 대상으로 단어/구 수준의 정보 객체를 태깅할 수 있는 Tool을 조사하고 가용한 오픈소스를 수정하여 구현
3) 논문 텍스트에 대한 정보 객체 수동 태깅
- 논문 초록(abstract)에 존재하는 정보 객체 태깅 시행
4) 정보 객체 인식 모듈 프로토타입 구현
- 대상 논문들에 대한 전문용어사전 구축 (화학 및 IT분야)
- 태깅이 완료된 초록데이터를 기반으로 정보 객체 인식 모듈 학습 및 튜닝
5) 성능 검증 및 한계점 분석
- 정보 객체 인식 모듈을 신규 논문에 적용하여 자동 인식 시행 및 결과에 대한 성능검증
- Error Analysis를 통한 한계점 분석
6) 확대 적용 방안 도출
- 성능 검증 및 한계점 분석을 통해 도출된 문제점 파악 및 향후 추가확대 시 대응방안 도출
IV. Results of the Project
1) Implementation of Information Object Annotation Tool
- Define Tag Set for Information Object Annotation
- Implementation of Web-based Annotation Tool (using Open Source)
2) Annotating Informational Entities and Relations (of 140 Abstracts) and Inspecting their Quality by Experts
- Constructing manually annotated 140 abstract data (IT: 70, Chemistry:70) and inspecting their quality by experts
- Analyzing domain-wise data characteristics
3) Implementation of Information Object Recognition Module Prototype
- Implementing structSVM based information object recognition module
4) Performance Evaluation and Limit Analysis
- Achieved F1=25.48% performance
- Performing error analysis by tags
5) Derivation of the Extension Methods
- Methods for overcoming low performances
- Strategies to cover different domain research articles
Keyword
정보객체; 시맨틱 퍼블리슁; 논문 서비스; 개체식별; 시맨틱 태깅; information object; semantic publishing; article service; named entity recognition; semantic tagging