유현곤 부장 (Nvidia Korea)
제목 : NVIDIA NEMO를 이용한 생성형 AI 모델 구축
요약 : 최근 오픈소스 초거대 AI모델을 활용한 연구가 활발합니다. NVIDIA NEMO는 pytirch 기반으로 LLM, 음성합성, 음성인식 모델을 학습할 수 있는 오픈 소스 플랫폼으로 data parallel, model parallel, pipeline parallel 등 pretrain, finetune을 진행할 수 있을 뿐만 아니라, 학습된 모델을 RAG 및 TensorRT-LLM의 연동을 통하여 inference 최적화를 수행할 수 있습니다. 본 발표는 NEMO 프레임웍을 활용한 LLM 연구방법론을 살펴보고 있습니다.
홍승환 팀장(㈜스캐터랩)
제목 : Diffusion Model의 최신 동향과 추론 최적화 방법
요약 : 최근 멀티모달 기술의 근간인 Diffusion 모델의 연구 동향을 정리하고, 이미지 생성 기능을 실서비스 수준의 빠른 속도로 제공할 수 있도록 하는 추론 최적화 기술을 소개합니다.
김태녕 팀장 (㈜카페24)
제목 : RAG, 나의 데이터, 나만의 챗봇
요약 : 의미기반 유사도 검색과 LLM의 텍스트 생성의 조화
나의 데이터로 나만의 질의응답 챗봇 만들어보기
정확도 높은 챗봇을 위한 LLM 프롬프트 엔지니어링