download0 view1,024
twitter facebook

공공누리This item is licensed Korea Open Government License

Title
Precision annotation of digital samples in NCBI’s gene expression omnibus
Author(s)
Dexter HadleyAtul J Butte백효정
Publication Year
2017-09-19
Abstract
The Gene Expression Omnibus (GEO) contains more than two million digital samples from functional genomics experiments amassed over almost two decades. However, individual sample meta-data remains poorly described by unstructured free text attributes preventing its largescale reanalysis. We introduce the Search Tag Analyze Resource for GEO as a web application (http://STARGEO.org) to curate better annotations of sample phenotypes uniformly across different studies, and to use these sample annotations to define robust genomic signatures of disease pathology by meta-analysis. In this paper, we target a small group of biomedical graduate students to show rapid crowd-curation of precise sample annotations across all phenotypes, and we demonstrate the biological validity of these crowd-curated annotations for breast cancer. STARGEO.org makes GEO data findable, accessible, interoperable and reusable (i.e., FAIR) to ultimately facilitate knowledge discovery. Our work demonstrates the utility of crowd-curation and interpretation of open ‘big data’ under FAIR principles as a first step towards realizing an ideal paradigm of precision medicine.
Keyword
GEO; Microarray; annotation; tagging
Journal Title
Scientific Data
Citation Volume
4
ISSN
2052-4463
Files in This Item:
There are no files associated with this item.
Appears in Collections:
7. KISTI 연구성과 > 학술지 발표논문
URI
https://repository.kisti.re.kr/handle/10580/14661
http://www.ndsl.kr/ndsl/search/detail/article/articleSearchResultDetail.do?cn=NART79001470
Export
RIS (EndNote)
XLS (Excel)
XML

Browse