KiRI Platform은 R&D 데이터에 관한 모든 일을 처리할 수 있는 플랫폼입니다. 자신의 데이터를 관리하고, 출판논문의 데이터로 부터 동향을 분석하며, 내외부에 가용한 데이터를 끌어다 머신러닝을 할 수 있는 환경을 제공합니다. 또한 머신러닝 모델로 부터 특성을 예측하는 특성예측 계산기도 함께 제공하고 있습니다.
로그인 아이디와 패스워드는 MIS의 id와 password와 동일합니다.
KiRI 플랫폼의 첫 화면은 6개 항의 Menu와 8개 항의 Data Bank Statistics로 구성되어 있습니다.
데이터는 기본적으로 하나의 시편을 하나의 데이터 군으로 묶어서 관리합니다.
My Data 페이지는 두 개의 테이블로 구성되어 있습니다. 좌측의 시편 테이블에서는 생성한 모든 시편의 목록을 보여주고 있으며, 관련 프로젝트 명, 생성 연구자, 관련된 KiRI Note를 볼 수 있는 링크를 제공합니다. 또한, 시편별 데이터를 선택하여 공개여부를 결정할 수 있습니다. 우측 테이블에서는 좌측 테이블에서 선택된 시편의 데이터를 보여 줍니다. 이 데이터들은 노트로 부터 시스템에 의해 추출된 것입니다.
연구활동에 의해 생성된 데이터는 기본적으로 생성한 연구자만이 활용할 권한을 갖습니다. 해당 데이터의 목적이 달성된 뒤에 연구책임자가 그 데이터를 공유할지 여부를 선택할 수 있습니다. 좌측 테이블의 맨 우측 컬럼에서 해당 데이터를 선택해 공유합니다.
테이블 상단의 (10/61 Shared)
표시는 내가 관련된 프로젝트에서 총 61개의 데이터셋을 생성했으며, 그 중 10개를 공유하고 있다는 것을 보여주고 있습니다.
2019년 1월 현재 POC 과제의 주제인 촉매의 경우, Kiri 시스템에서 관리하는 데이터의 구조는 좌측과 같습니다.
하나의 논문이나 note에는 n개의 촉매 물질에 대한 데이터가 존재합니다.
촉매별로 촉매물질의 합성조건과 재료학적 구조, 물리화학적 특성 데이터가 생성됩니다. 한 촉매에서 n개의 반응에 대한 촉매 특성 데이터가 생성될 수 있습니다.
모든 데이터는 데이터를 생성한 원시데이터를 첨부하여 관리합니다.
촉매 데이터 구조의 상세정보
Trend Analysis 는 수집된 논문들로 부터 경향을 분석하는데 쓰일 수 있습니다.
다양한 keyword 검색을 통해 논문들을 filtering한 뒤, 개별논문을 보거나, 관련된 키워드나 키워드 동향을 분석할 수 있습니다. 동향분석에서 가장 강력한 기능은 네트워크 맵을 통해 논문의 연관성 상위 100편에서 나타나는 저자, 물질, 키워드 들을 분석해 볼 수 있는 기능입니다.
인덱스 된 키워드 들은 사용자들의 삭제여부에 따라 중요도가 평가됩니다. 따라서, 플랫폼의 사용이 늘어날 수록 키워드의 노이즈는 감소할 것으로 기대됩니다.
논문으로 부터 연구자가 직접 데이터를 추출할 수 있는 Data Curation Tool을 함께 제공하고 있습니다. 관련된 논문에서 curation tool을 이용해 데이터를 추출하면, 추출된 데이터는 사용자 Data Archive의 Curated Data Bucket에 저장되므로 이 데이터를 분석과 기계학습에 즉시 활용할 수 있습니다. 다만 논문에서 추출된 데이터는 추출자에게만 사용권한이 제한되지 않고 공유 데이터로 설정됩니다.
Data Archive는 Data Base들로 부터 관심있는 데이터를 수집하여 내 버킷에 저장하는 기능을 제공합니다. 버킷에 저장된 데이터는 Data Analytics와 ML R&D Platform 메뉴로 전달되어 데이터 분석과 머신러닝에 활용할 수 있습니다.
KiRI DataBank 뿐 아니라 외부의 데이터베이스로 부터 동시에 데이터를 검색하는 강력한 검색 기능과 데이터의 후처리 기능을 개발하고 있습니다.
Analytics는 Archive된 데이터를 이용하여 다양한 분석을 시도해 볼 수 있는 플랫폼입니다.
데이터의 visualization 을 통해 분석을 시도할 수 있도록 구축되어 있으며, 가로, 세로, marker 크기, marker 색을 이용하여 파라메터 간의 상관관계를 해석할 수 있습니다.
아직 데이터가 충분히 확보되어 있지 않습니다만, 데이터가 축적되면 유용한 R&D 툴이 될 수 있을 것입니다.
Property prediction 페이지는 머신러닝 모델의 개발자들이 개발된 머신러닝 모델을 공개하고, 사용자들이 그 모델을 이용하여 특성을 예측할 수 있는 플랫폼입니다. 이 플랫폼은 머신러닝 모델 개발자의 연구결과를 publicize하는 새로운 저널이라고 할 수 있습니다.
예측 모델 테이블에 머신러닝 개발자가 머신러닝 모델을 도큐먼트와 함께 업로드합니다. 좌측 하단의 도큐먼트 창에는 예측모델 테이블에서 선택한 예측모델의 설명과 input format 등의 정보를 보여 줍니다.
우측에는 input과 output 창이 준비되어 있습니다. Input 창에 선택한 모델의 입력포맷에 맞추어 데이터를 입력하면, 선택한 머신러닝 모델을 이용하여 계산된 특성 예측 결과를 output창에 보여 줍니다.