Son, Hyun-Seok; Son, Gang-Ryul; Kim, Jin-Sook; Jung, Byung-Jin; Kim, Hyung-Jin; Kim, Tae-Hwan; An, In-Seong; Kim, Se-Hoon; Hong, Chang-Pyo; Bak, Ho-Eun; Chae, Han-Hwa; Lee, Hyun-Gyung; Gwon, Min-Gyung; Kim, Ji-Hyun
Publisher
한국과학기술정보연구원 Korea Institute of Science and Technology Information
Publication Year
2002-12
Description
funder : 국무조정실 agency : 국무조정실
Abstract
I. 제목 : 바이오인포매틱스 시스템 개발
II. 연구개발의 목적 및 중요성
본 연구개발의 목적은 국내 생명공학 연구진흥을 위한 바이오인포매틱스
주요 기술의 국산화 및 바이오인포매틱스 연구개발에 대한 기반 인프라를
조성하는 것으로서, 유전체 및 단백체 관련 데이터베이스와 분석 소프트웨어
대부분을 외국에 의존하고 있는 현실을 감안할 때 큰 수입대체효과를 거둘
수 있다. 또한 바이오인포매틱스 핵심 및 기반 기술의 축적을 통해 새로운
생명공학기술 및 바이오인포매틱스 응용 분야를 개척할 수 있으며, 생명공학
관련 연구자들이 새로운 유전자 또는 신약후보물질 발견을 보조함으로써
제약 및 생명공학 분야의 발전에 막대한 기여를 할 것이다.
III. 연구개발의 내용 및 범위
본 연구개발 과제에서 수행한 주요 연구과제의 내용 및 범위는 다음과
같다.
생물정보 수집 및 배포
- 생물정보 DB 구축 :
유전자/단백질 정보 DB 구축
해외 주요기관과의 협력을 통한 데이터 수집
유전체 및 단백질 서열 정보 데이터 관리시스템 구축
- 생물정보 배포 :
구축대상 FTP 데이터 현황 조사
생물정보 FTP 서비스 구축
웹기반 서비스체제 구축
- 생물정보 포탈사이트 구축 :
생물정보 서비스 시스템 이용 편의를 위한 바이오 포탈 웹 사이트 구축
바이오인포매틱스 전문정보 및 동향, Q&A 서비스(Dr. Smarts)실시
바이오인포매틱스센터 홈페이지 운영
데이터베이스 검색 시스템 사용자 인터페이스 개발
단백질정보 통합검색 사용자 인터페이스 개발
생물정보 시스템 개발
- 알고리즘 연구 :
유전자 발굴 알고리즘 연구
생물분자들에 대한 전산시늉을 위한 알고리즘에 대한 연구
- 소프트웨어 및 시스템 개발 :
BAC- end 서열분석을 위한 자동화된 분석기술 및 시스템 개발
유전자/단백질 3차원 가시화 프로그램 프로토타입 개발
유전자/단백질 서열정보 검색엔진(Bio- KRISTAL) 프로토타입 개발
유지보수
- 데이터베이스 :
유전자 : GenBank, REBASE
단백질 : PDB, PIR-PSD, Swiss- Prot 등
- 분석 시스템 :
유전자 서열 분석 프로그램
유전자/단백질 3차원 가시화 프로그램 개발
IV. 연구개발결과
생물정보 DB 구축
- GenBank : 18,000,000 건
- dbEST : 13,000,000 건
- dbSTS : 120,000 건
- dbGSS : 400,000 건
- PDB : 19,000 건
- PIR-PSD : 283,000 건
- Swiss- Prot : 110,000 건
- CATH : 36,000 건
- SCOP : 3,500 건
- PhiPsi : 18,300 건
생물정보 배포
- 수집 데이터 용량 : 총 27종 190 GB
GenBank ( 42 GB), dbEST ( 15 GB),
UniGene ( 3.5 GB), dbGSS ( 4 GB),
BLAST ( 19 GB), Ensembl ( 79 GB) 등
- FTP 서비스 환경 조성 생물정보포탈사이트구축
- 홈페이지 구축 완료
- 인터페이스 프로그램 및 디자인 완료
- 콘텐츠 발굴 및 구성 완료 알고리즘 연구
- 유전자 발굴 알고리즘 개발
- 생물분자들에 대한 전산시늉을 위한 알고리즘에 대한 연구 완료
소프트웨어 및 시스템 개발
- BAC- end 서열 분석을 위한 자동화된 분석기술 및 시스템 개발 완료
- 유전체 정보 분석 시스템 개선
- 유전자/단백질 3차원 가시화 프로그램 프로토타입 개발완료
- 유전자/단백질 서열정보 검색엔진 (Bio- KRISTAL) 프로토타입 개발 완료 유지보수
- 구축된 DB 와 시스템에 대한 주기적인 업데이트 및 업그레이드 실시
- 가시화 소프트웨어 베타 테스트 완료
V. 향후 연구계획
생물정보 DB 유지 보수
생물정보 배포 및 FTP 서비스
생물정보포탈사이트 유지 보수 및 콘텐츠 추가
유전체 정보 분석 시스템 개선
유전자/단백질 3차
I. Title
Bioinformatics System Development
II. Objective of the study and its importance
Our goal of this project is to research and develop the essential technologies
for domestic biotechnology, and to build up R&D infra for bioinformatics.
With these research, we can replace our products as foreign proteome related
DBMS and analysis software. Also, with the accumulation of the essentia
technologies for bioinformatics, we can build up and lead the new
applications of biotechnology and bioinformatics, and researchers, and assist
biotechnology-related researchers in discovering new proteome or candidates
of new medicines so that we can contribute toward the advance of medicine
and biotechnology.
III. Content and scope of the study
The main contents and scope of the study is the following:
Collection and distribution of genomic/proteomic information
- Construction of genomic and proteomic information DBMS
Construction of DNA/protein information DBMS
Data collection with the cooperation of foreign principal institutes
Construction of DNA/protein sequence information DBMS
- Distibution of genomic and proteomic information
Survey of target FTP server and data
Construction of genomic and proteomic information FTP services
Construction of web based service systems
- Construction of bioinformatics portal site
Construction of bio portal site for the convenience of usage of
bioinformatics service system
Collection of bioinformatics related information, survey and Q&A
service(Dr. Smarts)
Operating CCBB homepage
Development of user interface for DB search
Development of integrated user interface for protein data search
Devlopement of bioinformatics system
- Research of algorithms
Development of gene mining algorithm
A study of algorithms for efficient computer simulation of
biomolecules
- Development of software and system
Development of automated analysis technology and system for
BAC- end sequence analysis
Development of 3D interactive DNA/protein visualization software
Development of prototype for Bio- KRISTAL(DNA/protein sequence
information searching engine)
Maintenance
- DBMS
DNA : GenBank, REBASE
Protein : PDB, PIR-PSD, Swiss-Prot et. al
- Analysis system
DNA sequence analysis program
3D interactive DNA/protein visualization program
Distibution of genomic/proteomic information
- Capacities of collected genomic data :
Total27kinds,190GB
GenBank ( 42 GB), dbEST ( 15 GB),
UniGene ( 3.5 GB), dbGSS ( 4 GB),
BLAST ( 19 GB), Ensembl ( 79 GB) etc.
- Forming the configuration of FTP services Construction of bioinformation portal site
- Completing to construct homepage
- Completing to develop and design user interface program
- Completing to find out and configure the contents of bioinformation Research of algorithms
- Completing to develop gene mining algorithm
- Completing to study of algorithms for efficient computer simulation of biomolecules
Development of software and system
- Completing to develop the automated analysis technology and system for BAC- end sequence analysis
- Improving genomic information analysis system
- Completing to develop 3D interactive DNA/protein visualization software
- Completing to develop the prototype for Bio- KRISTAL Maintenance
- Periodic updating and upgrading built- in DBMS
- Completing to test beta version of 3D interactive DNA/protein visualization software
V. Future works
Maintaining of genomic/proteomic information DBMS
Distributing genomic/proteomic information and offering FTP services
Maintaining of bioinformatics portal site and adding the contents of bioinformation
Enhancing genomic information analysis system
Adding new features to 3D interactive DNA/protein visualization software
Developing Bio-KRISTAL