agency : Korea Institute of Science and Technology Information
dc.description.abstract
1) 관련 연구 조사
- 개체명 인식 관련 연구에 대한 조사를 통해, 유사 사례 분석 및 비교 연구
2) 정보 객체 태그셋 정의 및 태깅툴 구현
- 정보 객체 태깅에 필요한 태그셋 정의
- 논문 텍스트를 대상으로 단어/구 수준의 정보 객체를 태깅할 수 있는 Tool을 조사하고 가용한 오픈소스를 수정하여 구현
3) 논문 텍스트에 대한 정보 객체 수동 태깅
- 논문 초록(abstract)에 존재하는 정보 객체 태깅 시행
4) 정보 객체 인식 모듈 프로토타입 구현
- 대상 논문들에 대한 전문용어사전 구축 (화학 및 IT분야)
- 태깅이 완료된 초록데이터를 기반으로 정보 객체 인식 모듈 학습 및 튜닝
5) 성능 검증 및 한계점 분석
- 정보 객체 인식 모듈을 신규 논문에 적용하여 자동 인식 시행 및 결과에 대한 성능검증
- Error Analysis를 통한 한계점 분석
6) 확대 적용 방안 도출
- 성능 검증 및 한계점 분석을 통해 도출된 문제점 파악 및 향후 추가확대 시 대응방안 도출
dc.description.abstract
IV. Results of the Project
1) Implementation of Information Object Annotation Tool
- Define Tag Set for Information Object Annotation
- Implementation of Web-based Annotation Tool (using Open Source)
2) Annotating Informational Entities and Relations (of 140 Abstracts) and Inspecting their Quality by Experts
- Constructing manually annotated 140 abstract data (IT: 70, Chemistry:70) and inspecting their quality by experts
- Analyzing domain-wise data characteristics
3) Implementation of Information Object Recognition Module Prototype
- Implementing structSVM based information object recognition module
4) Performance Evaluation and Limit Analysis
- Achieved F1=25.48% performance
- Performing error analysis by tags
5) Derivation of the Extension Methods
- Methods for overcoming low performances
- Strategies to cover different domain research articles
dc.publisher
한국과학기술정보연구원
dc.publisher
Korea Institute of Science and Technology Information
dc.title
고품질 학술논문 서비스를 위한 국내학술논문의 정보 객체 식별 방안 연구
dc.title.alternative
Information Object Identification for Advanced Research Articles Research