1. 도메인 특화 벡터DB 구축을 위한 임베딩 모델 및 Chunking 기법
SMILES, SELFIES 등의 분자구조 데이터를 적절한 크기 또는 의미 단위의 청크(chunk)로 분할하는 기술 연구
Amino acid 서열 등의 단백질 구조 정보 처리에 특화된 벡터 임베딩 기술 연구 및 개발
2. 생물·화학 정보처리를 위한 RAG 및 프롬프트 엔지니어링
약물 또는 질병치료에 관한 문서 데이터를 활용한 벡터 임베딩 품질 개선 연구
생물 및 화학 정보 분석 및 예측을 위한 프롬프트 최적화 기법 연구
3. 도메인 특화 LLM 미세조정 알고리즘
도메인 데이터를 활용한 질문-답변 형식의 학습 데이터 구축 알고리즘 개발
도메인 특화 sLM 개발을 위한 파인튜닝 알고리즘 개발
1. 약물-표적 결합 친화도 예측을 위한 딥러닝 기술 개발
화합물과 단백질 정보를 동시 처리하기 위한 딥러닝 모델(transformer, GNN 등) 연구 및 개발
돌연변이 단백질 처리 가능한 결합 친화도 예측 모델 연구 및 개발
미지의 단백질에 대한 돌연변이 탐지, 단백질 접힘 및 안정성 변화 예측, 병원성 예측 모델 개발
2. 약물 민감도 예측과 약물 타겟 식별을 위한 딥러닝 모델
표적 세포에 대한 약물의 반응성(IC50, LD50, pKd 등) 예측 모델을 연구
약물이 치료 목적으로 쓰일 수 있는 질병을 식별하는 약물재창출 연구
1. 유전자 알고리즘(genetic algorithms) 응용 연구
Evolutionary operators(mutation or crossovers)를 이용해 분자를 반복적으로 변형시키는 분자구조 생성 기법 연구
2. 강화학습(Reinforcement Learning) 응용 연구
약물 특성을 고려한 보상 함수를 설계
고차원의 chemical space를 효율적으로 exploration하는 기법 연구
3. 효율적인 분자공간 탐색을 위한 Monte-Carlo Tree Search 응용 연구
분자 구조 생성 트리를 시뮬레이션하며, 여러 개의 약물 특성을 평가해 후보 물질을 탐색하는 최적화 기법 연구
4. 다중 목표 최적해(optimal solution) 탐색을 위한 Pareto Optimization 알고리즘 연구
Pareto front를 사용하여 후보물질의 성능을 평가하고, 최적의 균형을 이루는 분자구조 생성 기법 연구