paperMovieGenrePrediction

A Korean movie genre prediction model using multi-representation learning

제목 : 다중 표현 학습을 이용한 한국 영화 장르 예측 모델

김종현*

(* : 인하대학교)

한국컴퓨터정보학회논문지 제31권 3호, 2026.3, 139-147페이지

Abstract : 본 연구에서는 영화 포스터 이미지, 관람객 리뷰, 포스터 내 문구 등 서로 다른 표현 정보를 통합해 한국 영화 장르를 예측하는 다중 표현 학습 모델을 제안한다. 포스터는 CNN으로 시각적 특징을 학습하되, 포스터만으로 장르 맥락을 반영하기 어렵고 감독 의도와 관객 경험이 달라질 수 있다는 한계를 고려해 리뷰(Word2Vec)와 OCR 문구(LSTM) 기반 텍스트 모델을 추가로 구성했다. 세 모델의 장르 확률을 통합한 결과, 단일 포스터 CNN(약 78%) 대비 특정 장르에서 오류를 보완하며 전체적으로 약 75%의 안정적 성능을 보였다. 제안 모델은 멀티모달 결합을 통해 예측의 해석성과 신뢰도를 높였으며, 향후 장르 확장과 OCR 문구 가중치 조정으로 성능 개선을 목표로 한다.

[paper]

Google Sites

Report abuse