정보분석 플랫폼 구축을 통한 연구개발서비스 활성화
Alternative Title
Activation of research and development services through the establishment of information analysis platform
Korea Institute of Science and Technology Information
Publication Year
funder : 과학기술정보통신부
funder : Ministry of Science and ICT
본 연구사업은 비즈니스 분석 기반 구축, 비즈니스 어드바이저 프로토타입 시스템 개발, 비즈니스 정보분석 모델 및 방법론 개발 등 크게 세가지 측면에서 추진되었다. 먼저 비즈니스 분석 기반 구축분야에서는 미국 전자공시 정보(10-K) 및 영미권 국가의 주요기업의 기업뉴스 사이트 정보를 분석대상으로 삼았다. 구체적으로는 웹크롤링을 실시간으로 자동으로 무료로 수집하는 체제를 구축하였다. 미국전자공시는 500여개의 산업분류 중에서 시범적으로 100개 분류에 해당되는 기업들을 대상으로 하였다. 기업 웹사이트는 약 3천여개의 기업을 대상으로 하여 시범적으로 뉴스를 수집하는 체제를 구축하였다. 수집된 정보를 대상으로 비즈니스 텍스트에 문장구조를 분석하는 S-P-O(Subject-Predicate-Object) 구문구조 분석을 수행하였다. 한편 기업 공시정보에는 재무정보를 포함하고 있어서 핵심적인 재무정보를 데이터베이스화하였다. 비즈니스 어드바이저 프로토타입 시스템 개발 부분에서는 빅데이터 환경 구축과 비즈니스 활동 탐색 서비스 모듈 개발로 구분된다. 빅데이터 환경 구축은 S-P-O 구문구조 분석의 특성상 술어(Predicate)가 광범위하게 확장가능하고 이에 따라 관계의 수가 기하급수적으로 증가할 수 있다는 점에 기반하여 빅데이터 환경을 구축하였다. 일부는 RDB구조도 활용하지만 그래프DB, SPARK, HADOOP을 동시에 활용하는 구조로 빅데이터 분석 시스템을 구축하였다. 한편 비즈니스 활동탐색 서비스 모듈은 S-P-O 구문구조 분석에 의해 구축된 지식베이스 중에서 활용성이 높은 관계들을 시각화 형태로 구현하였다. 비즈니스 정보분석 모델 및 방법론 개발 분야에서는 세 가지 모델을 연구하였는데, 1) 기업 비즈니스 트렌드 분석 모델, 2) 기업 매출액 예측 모델, 3) 기업 업종변화 탐지 모델 등이다. 이외에도 통합로그인 시스템에 대한 보완개발을 추진하였다.

Ⅳ. Results of the project

◦ Development of business advisor prototype system
- Establishment of big data analysis environment using domestic and overseas business information
- Development of service module for business activity search
- Research for detection model of industry change using disclosure information and sequential pattern mining techniques
- Development of trend analysis model for company business
- Development of sales forecast model for public companies

◦ Establishment of business analysis base using disclosure information
- Collection of global business information and establishment of processing analysis system
- Establishment of financial information DB of global corporation using disclosure information
- Establishment of core keyword and object-specific term dictionary
- Collection of global blog meta information and core content
- Construction of knowledge base for business activity by SPO parsing

정보분석 플랫폼; 연구개발서비스; 기업 공시정보; 신사업; 구문구조 분석; information analysis platform; research and development service; corporate annual report; new business; syntax structure analysis
