This item is licensed Korea Open Government License
dc.contributor.author
이태석
dc.contributor.author
강승식
dc.contributor.author
정영임
dc.contributor.author
선충녕
dc.date.accessioned
2021-09-14T07:59:49Z
dc.date.available
2021-09-14T07:59:49Z
dc.date.issued
2019-06-30
dc.identifier.issn
2287-1322
dc.identifier.uri
https://repository.kisti.re.kr/handle/10580/16075
dc.description.abstract
문서 자동 요약은 주어진 문서로부터 주요 내용을 추출하거나 생성하는 방식으로 축약하는 작업을 말한다. 최근 연구에서는 대량의 문서를 딥러닝 기법을 적용하여 요약문 자체를 생성하는 방식으로 발전하고 있다. 생성 요약은 미리 생성된 위드 임베딩 정보를 사용하는데, 전문 용어와 같이 저빈도 핵심 어휘는 입베딩 된 사전에 없는 문제가 발생한다. 인코딩-디코딩 신경망 모델의 문서 자동 요약에서 미등록 어휘의 출현은 요약 성능 저하의 요인이다. 이를 해결하기 위해 본 논문에서는 요약 대상 문서에서 새로 출현한 단어를 복사하여 요약문을 생성하는 방법을 사용한다. 기존의 연구와는 달리 정확한 포인팅 정보와 선택적 복사 지시 정보를 명시적으로 제공하는 방법으로 제안하였다. 학습 데이터는 논문의 초록과 제목을 대상 문서와 정답 요약으로 사용하였다. 제안한 인코딩-디코딩 기반 모델을 통해서 자동 생성 요약을 수행한 결과 단어 제현 기반의 ROUGE-1이 47.01로 나타났으며, 또한 어순 기반의 ROUGE-L이 29.55로 향상되었다.
dc.language.iso
kor
dc.publisher
한국스마트미디어학회
dc.relation.ispartofseries
스마트미디어저널;
dc.title
미등록 어휘에 대한 선택적 복사를 적용한 문서 자동요약
dc.title.alternative
Automatic Text Summarization based on Selective Copy mechanism against for Addressing OOV