이 연구는 생물정보학 분야에서 특별히 고성능 고처리량을 요구하는 분석들에 대한 그리드 응용 기술을 발견, 개발 및 구현하여, 그리드 응용 기술을 최대로 활용함과 동시에 생물정보학 분석의 최적화에 기여하는데 그 목적을 갖고 있다. 본 연구에서는 최적의 그리드 응용과 유용한 생물정보학 분야로 " 게놈 전체 서열 비교 분석" (Comparative Global Genome Sequence Analysis: CGGSA)을 선택하였다. 당해연도 주요 연구 내용은 CGGSA의 요소 기술 정의 및 그 알고리듬 개발, 그리고 이를 그리드 환경에서 구축하고 웹을 통한 사용자 인터페이스 구축하는 것이다.
게놈 전체 서열을 비교하기 위해 기존에 택해온 방법들은 컴퓨터의 성능 (메모리 및 연산시간)을 고려하여 특정 목적에만 적합하도록 설계되었거나 정확성 및 정밀성이 충분치 않은 단점을 가지고 있다. 정확성 및 정밀성을 보장하는 알고리즘을 사용하고 메모리 및 연산시간의 문제를 그리드 컴퓨팅 기술을 접목하여 해결하고자 하는 것이 이 연구의 주요 내용이다. 지금까지 상반기 동안, Blast 를 사용한 분산컴퓨팅 환경에서의 서열정렬 알고리즘과 이를 이용한 게놈 전체 서열의 정렬기법, 그리고 간단한 visualization tool 을 일부 개발하였다.
For the scope of the this study, Comparative Global Genome Sequence Analysis (CGGSA) is selected. Major contents in this year are to define elementary technique of CGGSA, to develope the algorithm, to implement it on Grid.
Keyword
그리드; 생물정보학; 지노믹스; 유전체 분석; 유전체 배열; 고성능; 고처리량; Grid; Bioinformatics; Genomics; Genome Analysis; Genome Alignment; High performance; High throughput