ICAT을 이용한 Proteome 정량분석 DB 구축
Alternative Title
Construction of Proteome DB acquired by ICAT method
Alternative Author(s)
Gwon, Gyung-Hoon; Kim, Seung-Il; Jo, Geon; Kim, Eun-A; Lee, Young-Jae; Kim, Gyung-In; Yang, Eun-Mok
Korea Institute of Science and Technology Information
Publication Year
funder : 국무조정실
I. 제목
ICAT을 이용한 Proteome 정량분석 DB 구축
II. 연구개발의 목적 및 중요성
- 질량분석기 제조업체별로 다양한 형식의 스펙트럼 데이터 및 검색 프로
그램을 사용하므로, 이들 데이터를 통합 관리하기 위한 DB 시스템을 개발함.
- 데이터베이스 시스템과 국내외 DB 서비스와의 연계에 의해 단백질 검색 결과의 다양한 분석을 시도함.
- 시료별로 스펙트럼 정보, 단백질 정보의 DB화에 의한 프로테오믹스 연구의 가이드라인 제시.
III. 연구개발의 내용 및 범위
본 연구사업의 2002년도 연구개발 내용은 다음과 같다.
1. Proteome database 구축을 위한 데이터 입력, 수정, 검색 시스템 개발
2. ICAT 방법에 의한 Proteome 정량분석 데이터 입력.
본 연구 사업의 범위는 다음과 같다.
2. 시료: 벼, BSA 표준시료
3. 실험 데이터 : ICAT 방법에 의한 탄뎀 질량 스펙트럼
4. 데이터베이스 구성: 시료정보, MS/MS spectrum, Protein Identification 을 위한 DB 검색결과
5. 데이터베이스의 입력, 검색을 웹 인터페이스로 개발함.
IV. 연구개발결과
- ICAT 에 의한 프로테옴 정량분석 실험에서 얻은 탄뎀 질량 스펙트럼과 이를 단백질 database 에서 검색하여 얻은 단백질 동정결과로 통합 데이터 베이스를 구성함.
- 데이터 수집 (탄뎀 질량 스펙트럼 5,000 건)
. 벼 : 일품벼의 mutant 수원 461, 수원 464, 오대벼, 동진벼, wild type 2, wild type 3
. BSA (bovine serum albumin) : 질량 분석기의 테스트를 위한 표준 시료로서 단일 단백질로 구성된 시료.
- 질량분석기별로 스펙트럼 데이터 format, 단백질 검색 프로그램에 차이가 있으나, 이를 통합 검색할 수 있도록 시스템을 구성함.
V. 연구개발의 활용 계획
- 프로테오믹스 분야는 활발한 연구가 시작된 지 불과 5년 정도 밖에 되지 않은 학문 분야로, 이에 대한 실험 데이터 관리 시스템은 각 장비제조 업체에서 각자의 format 에 맞게 개발하여 판매하고 있다. 따라서 장비 제조 업체가 각기 다른 실험장비를 가진 실험실에서는 실험 데이터의 통합 관리가 어려우며, 장비별로 분리된 시스템을 사용할 수 밖에 없게 된다. 다양한 형식의 데이터 시스템을 통합 관리하고 검색할 수 있는 시스템의 개발이 실험실에서의 데이터 관리에 시급히 요청되고 있는 현실이다.
- 프로테옴 데이터 통합 시스템 구축을 목표로, 다양한 프로테옴 데이터와 단백질 정보를 하나의 데이터베이스에서 관리, 검색하는 시스템의 개발을 시도하였다. 아직은 완벽한 통합 시스템을 이루지 못하였으나, 지속적인 개발에 의해 프로테옴 데이터 시스템의 prototype 을 구현하여야 할 것이다.
- 다양한 시료에서 단백질 정보의 계속적인 축적에 의해 대량의 데이터가 수집되면, 단백질의 분류와 함께 시료별 단백질 분포, 단백질간의 상호작용 정보 등 데이터베이스를 확대하고 검색 기능, 통계 분석 기능을 강화하여 종합적인 단백질 정보 DB 구축이 가능해진다.

I. Title
Construction of Proteome DB acquired by ICAT method

II. Objective of the study and its importance
- Developed Database System for the integrated management of proteome data which have the different data format according to the manufacturer of mass spectrometer.
- Develop proteome data analysis system connecting this system to the other database service
- This database system will play the role of the system to help getting new knowledge through the spectral information and protein information

III. Content and scope of the study
This project in 2002 include the following content:
1. Develop data management system with the function of data insertion, modification and search for proteome database
2. Build database with proteome quantitative data obtained by ICAT tagging method

The scope of the project is as follows:
1. Mass Spectrometer
2. Sample : BSA(bovine serum albumin) standard sample, rice
3. Experimental data : Tandem mass spectrum obtained by ICAT method
4. DB constitution
- sample information, tandem mass spectrum, DB search results for protein identification
5. Develop the database management programs on the Web

IV. Result of the study
- Constructed the integrated database with the tandem mass spectra obtained by ICAT method and protein search result with nr protein database.
- Collected proteome data (5,000 tandem mass spectra)
. Rice
Su- Won 461, Su- Won 464 which are mutants of rice named Il- Poom
Odai, Dongjin, wild type 2, wild type3
. BSA (bovine serum albumin)
standard sample for testing mass spectrometers
- Each mass spectrometer uses its own spectrum data format and its own protein search program. The database system is constructed as their integrated search system.

V. Application schemes
- Proteomics is the new research field whose research becomes hot topic about 5 years ago. Many data management systems for experimental data of proteomics are developed by manufactures of mass spectrometer. Most DB system has their own format and their own
protein search system. Thus, if one has mass spectrometers made by several manufacturers, it is difficult to integrate and manage the data. In usual, we have to use different database system for different mass spectrometer. It becomes important to develop the system where various
database systems are integrated and managed.
- In order to solve such a problem, we tried to develop system where the several proteome data which come from mass spectrometers are inserted on one database and managed. Although it has not suggested completely integrated solution yet, it will be helpful to represent a prototype for general proteome database system.
- This system can develop to the integrated protein information service, by continuing to collect the protein informations for various samples and gathering other additional informations such as metabolic pathway and protein classification information. The advanced search and statistical analysis of protein data can be added.
