download0 view610
twitter facebook

공공누리This item is licensed Korea Open Government License

Title
빅데이터 및 고성능컴퓨팅 프레임워크를 활용한 유전체 데이터 전처리 과정의 병렬화
Author(s)
변은규곽재혁문지협
Publisher
한국정보처리학회
Publication Year
2019-10-30
Abstract
차세대 염기 서열 분석법이 생성한 유전체 원시 데이터를 기존의 방식대로 하나의 서버에서 분석하기 위해서는 데이터 크기에 따라 수십 시간이 필요할 수 있다. 그러나 응급 환자의 진단처럼 수 시간 내에 결과를 알아야 하는 상황이 존재하기 때문에 단일 유전체 분석의 성능을 향상시킬 필요가 있다. 본 연구에서는 빅데이터 기술의 병렬화 기법과 고속의 네트워크로 연결되고 병렬파일시스템을 공유하는 고성능컴퓨팅 클러스터를 적극적으로 활용하여 분석 시간을 크게 단축시킬 수 있는 유전체 데이터 분석의 전처리 프로세스의 병렬화 방법을 제안한다. 분석 데이터의 신뢰성을 위해 기존의 검증된 분석 도구 및 알고리즘을 새로운 환경에 맞게 병렬화 하는 전략을 선택하였다. 프로세스의 병렬화, 데이터의 분배 및 병렬 병합 기법을 개발하였고 실험을 통해 성능 향상을 확인하였다.
Keyword
유전체 데이터 전처리; NGS; 빅데이터; 고성능컴퓨팅 병렬화; Genome Sequence Data Preprocessing; Big Data; Hadoop; HPC; Parallelization
Journal Title
정보처리학회논문지. 컴퓨터 및 통신 시스템;
Citation Volume
8
ISSN
2287-5891
DOI
10.3745/ktccs.2019.8.10.231
Files in This Item:
There are no files associated with this item.
Appears in Collections:
7. KISTI 연구성과 > 학술지 발표논문
URI
https://repository.kisti.re.kr/handle/10580/16303
Fulltext
 https://scienceon.kisti.re.kr/srch/selectPORSrchArticle.do?cn=JAKO201930968615626
Export
RIS (EndNote)
XLS (Excel)
XML

Browse