download0 view780
twitter facebook

공공누리This item is licensed Korea Open Government License

dc.contributor.author
변은규
dc.contributor.author
곽재혁
dc.contributor.author
문지협
dc.date.accessioned
2022-03-10T04:46:15Z
dc.date.available
2022-03-10T04:46:15Z
dc.date.issued
2019-10-30
dc.identifier.issn
2287-5891
dc.identifier.uri
https://repository.kisti.re.kr/handle/10580/16303
dc.description.abstract
차세대 염기 서열 분석법이 생성한 유전체 원시 데이터를 기존의 방식대로 하나의 서버에서 분석하기 위해서는 데이터 크기에 따라 수십 시간이 필요할 수 있다. 그러나 응급 환자의 진단처럼 수 시간 내에 결과를 알아야 하는 상황이 존재하기 때문에 단일 유전체 분석의 성능을 향상시킬 필요가 있다. 본 연구에서는 빅데이터 기술의 병렬화 기법과 고속의 네트워크로 연결되고 병렬파일시스템을 공유하는 고성능컴퓨팅 클러스터를 적극적으로 활용하여 분석 시간을 크게 단축시킬 수 있는 유전체 데이터 분석의 전처리 프로세스의 병렬화 방법을 제안한다. 분석 데이터의 신뢰성을 위해 기존의 검증된 분석 도구 및 알고리즘을 새로운 환경에 맞게 병렬화 하는 전략을 선택하였다. 프로세스의 병렬화, 데이터의 분배 및 병렬 병합 기법을 개발하였고 실험을 통해 성능 향상을 확인하였다.
dc.language.iso
kor
dc.publisher
한국정보처리학회
dc.relation.ispartofseries
정보처리학회논문지. 컴퓨터 및 통신 시스템;
dc.title
빅데이터 및 고성능컴퓨팅 프레임워크를 활용한 유전체 데이터 전처리 과정의 병렬화
dc.identifier.doi
10.3745/ktccs.2019.8.10.231
dc.citation.endPage
238
dc.citation.number
10
dc.citation.startPage
231
dc.citation.volume
8
dc.contributor.approver
KOAR, ADMIN
dc.date.dateaccepted
2022-03-10T04:46:15Z
dc.date.datesubmitted
2022-03-10T04:46:15Z
dc.identifier.bibliographicCitation
vol. 8, no. 10, page. 231 - 238
dc.identifier.url
https://scienceon.kisti.re.kr/srch/selectPORSrchArticle.do?cn=JAKO201930968615626
dc.subject.keyword
유전체 데이터 전처리
dc.subject.keyword
NGS
dc.subject.keyword
빅데이터
dc.subject.keyword
고성능컴퓨팅 병렬화
dc.subject.keyword
Genome Sequence Data Preprocessing
dc.subject.keyword
Big Data
dc.subject.keyword
Hadoop
dc.subject.keyword
HPC
dc.subject.keyword
Parallelization
Appears in Collections:
7. KISTI 연구성과 > 학술지 발표논문
Files in This Item:
There are no files associated with this item.

Browse