download0 view718
twitter facebook

공공누리This item is licensed Korea Open Government License

Title
미등록 어휘에 대한 선택적 복사를 적용한 문서 자동요약
Alternative Title
Automatic Text Summarization based on Selective Copy mechanism against for Addressing OOV
Author(s)
이태석강승식정영임선충녕
Publisher
한국스마트미디어학회
Publication Year
2019-06-30
Abstract
문서 자동 요약은 주어진 문서로부터 주요 내용을 추출하거나 생성하는 방식으로 축약하는 작업을 말한다. 최근 연구에서는 대량의 문서를 딥러닝 기법을 적용하여 요약문 자체를 생성하는 방식으로 발전하고 있다. 생성 요약은 미리 생성된 위드 임베딩 정보를 사용하는데, 전문 용어와 같이 저빈도 핵심 어휘는 입베딩 된 사전에 없는 문제가 발생한다. 인코딩-디코딩 신경망 모델의 문서 자동 요약에서 미등록 어휘의 출현은 요약 성능 저하의 요인이다. 이를 해결하기 위해 본 논문에서는 요약 대상 문서에서 새로 출현한 단어를 복사하여 요약문을 생성하는 방법을 사용한다. 기존의 연구와는 달리 정확한 포인팅 정보와 선택적 복사 지시 정보를 명시적으로 제공하는 방법으로 제안하였다. 학습 데이터는 논문의 초록과 제목을 대상 문서와 정답 요약으로 사용하였다. 제안한 인코딩-디코딩 기반 모델을 통해서 자동 생성 요약을 수행한 결과 단어 제현 기반의 ROUGE-1이 47.01로 나타났으며, 또한 어순 기반의 ROUGE-L이 29.55로 향상되었다.
Keyword
문서요약; 미등록단어인식; 딥러닝; 생성요약; Text Summarization; Out of Vocabulary recognition; Deep-learning; Abstractive Summarization
Journal Title
스마트미디어저널;
Citation Volume
8
ISSN
2287-1322
DOI
10.30693/smj.2019.8.2.58
Files in This Item:
There are no files associated with this item.
Appears in Collections:
7. KISTI 연구성과 > 학술지 발표논문
URI
https://repository.kisti.re.kr/handle/10580/16075
Fulltext
 https://scienceon.kisti.re.kr/srch/selectPORSrchArticle.do?cn=JAKO201918961949574
Export
RIS (EndNote)
XLS (Excel)
XML

Browse