mIilaina

Milaina: Multi-Lingual Artificial Intelligence News Agent

본 연구과제는 다국적 뉴스를 수집/분석하여, 하나의 이슈에 대해 다양한 시각을 가진 신뢰도 높은 뉴스를 각 개인의 니즈에 맞게 제공하는 인공지능 뉴스 에이전트 개발을 목표로 한다. 다국적 뉴스 기반 인공지능 뉴스 에이전트를 이용하여 뉴스별 신뢰도 정량화 할 수 있으며, 다국적 뉴스 번역을 통해 균형 잡힌 시각 및 사용자의 요구에 부합하는 요약문과 뉴스 추천을 제공할 수 있다.

<신뢰 가능 한 인공지능 뉴스 에이전트 사용 시나리오>

다국적 뉴스 기반 인공지능 뉴스 에이전트를 개발하기 위해, 본 과제에서는 전체 시스템 개발을 아래와 같이 크게 3 가지 핵심 기술로 나누어 세부 연구를 수행한다.

1) 뉴스 도메인에 최적화된 다국적 뉴스 번역 및 요약 기술: 다국적 뉴스를 수집하고 이를 뉴스 도메인의 특성을 고려하여 특정 언어로 번역 및 사후 교정하는 기술을 개발한다. 또한, 번역된 내용을 자동 요약하는 기술을 개발하여 뉴스 본문과 함께 짧은 요약문을 같이 제공한다.

구체적으로, 새로운 언어 쌍을 위한 기본적인 번역 모델을 학습하는 효과적인 파이프라인을 통해 한국어 전용 고품질 범용 번역 모델 및 현존하는 데이터와 모델링 기술을 총망라한 한국어 전용 고품질 요약 모델 구축 한다. 이어서, 범용 번역 모델을 특정 도메인을 특히 잘 번역하도록 최적화하는 뉴스 전용 해외 기사 한국어 번역 모델 및 요약 모델을 구축한다. 최종적으로 기계번역의 부자연스러운 어투를 최소화하고 제목과 인용문 등 뉴스의 특정 부분들도 이질감 없이 번역해주는 모델과 요약문의 길이나 내용의 방향 등 주어진 옵션에 따라 다른 요약문을 출력하는 사용자 맞춤 뉴스 요약 시스템을 개발한다.

2) 다국적 뉴스 정보를 활용한 가짜 뉴스 탐지 기술: 다국적 뉴스의 텍스트를 기반으로 신뢰도를 분석하여 가짜뉴스를 탐지하고 신뢰도를 분석하는 기술을 개발한다. 여러 이슈를 다루는 뉴스들 간의 관계를 파악하여 이슈 관계망을 생성하고 뉴스의 국적과 스탠스와 같은 부가적인 정보를 담고 있는 지식 그래프를 구축한다. 구축된 지식 그래프와 인과관계 분석을 활용하여 텍스트만 활용하는 모델보다 정확하게 신뢰도를 측정하는 기술을 개발한다. 궁극적으로 가짜 뉴스를 자동으로 분류하여 신뢰도 높은 기사를 선별하여 제공하는 기술을 개발한다. 향후 다국적 뉴스 이슈 모델링과 논조 모델링을 통해 분류된 뉴스 데이터를 확보하여 이를 기반으로 이슈 관계망을 더 발전시킬 수 있다.

3) 다국적 뉴스의 이슈/논조 분석 및 개인화된 뉴스 큐레이션 기술: 뉴스가 다루는 이슈와 이슈의 계층 구조 뿐 아니라 그에 대한 논조를 자동으로 분석하고 정량화하는 기술을 개발한다. 또한, 새롭게 수집된 뉴스의 이슈를 탐지하고, 이슈의 계층구조를 주기적으로 업데이트 하여 새롭게 등장한 토픽을 효과적으로 인식하여 딥러닝 모델에 반영한다. 이러한 기술을 활용함으로써, 전문가의 도움 없이 새로운 이슈에 대해서도 자동으로 뉴스 분석이 가능해지며 그 결과를 사용자에게 뉴스와 함께 제공한다. 더 나아가, 이를 사용자 모델링 기술과 결합하는 방식으로 사용자의 선호도를 고려하면서도 다양한 견해를 담은 뉴스 큐레이션에 대한 연구를 진행한다.

본 과제는 뉴스 도메인에서의 다국어 기반 자연어 처리 AI 기술 개발이라는 새로운 연구 방향성을 제시하고, 급격히 성장하는 온라인 뉴스 시장과 현존하는 사회 문제 해결을 목표로 한다는 점에서 그 영향력이 매우 크다.

< Milaina 성과 활용 방안 >