2015 자연어처리 및 정보검색 워크샵

저희 연구회에서는 매년 한국정보과학회에서 주최하는 한국컴퓨터종학학술대회(Korea Computer Congress)와 함께  "자연어처리 및 정보검색 워크샵"을 아래와 같이 개최하고 있습니다. 
일시: 2015년 6월 24일 
장소: 제주대학교 공과대학 4호관 지하강당
올해에도 심층학습(deep learning) 등 최신 자연언어처리 및 정보검색 기술의 최근 동향으로 여러분들을 모시고자 합니다.  많은 성원 부탁 드립니다.
또한 저희 연구회의 소식을 꾸준히 받아보시기를 원하시거나 회원이 되시기를 원하시는 분께서는 
상단에 있는 [연락처 조사]에 간단한 정보를 보내주시면 학술대회 및 기타 정보들을 보내드리겠습니다.

workshop2015



프로그램 안내 

 시간내용 발표자 소개
13:00~13:10  개회사 
13:10~14:00 
네이버 seamless 검색 소개
(
Naver's next big challenge : seamless search)
요약모바일 환경에 적합한 사용자 경험을 제공하기 위해서 네이버에서 진행하고 있는 일을 소개한다PC 환경과 달리 모바일 환경에서는 검색입력창을 통한 검색어의 입력이나 많은 수의 문서나 컨텐츠를 보여주는 것이 쉽지 않다기존의 관련된 정보를 리스트 형태로 나열하는 수준에서 사용자가 원하는 정보를 보다 더 정확히 알아내고 다음 액션까지 자연스럽게 연결할 수 있는 방법이 필요하다네이버에서는 이런 끊김없는 사용자 경험을 제공하기 위한 사용자 의도 파악과 파악된 의도에 적합한 결과를 찾아내고 생성하기 위해 여러 연구들을 진행하고 있다.
강인호 실장
  • KAIST 박사
  • 삼성종학기술원 전문연구원
  • CMU, LTI 박사후 과정
  • 네이버 검색연구센터 실장  
14:00~14:50 딥러닝 기반의 기계번역
(
Neural Machine Translation)
요약본 발표에서는 딥러닝을 이용해 입력문(source sentence)에서 번역문(target sentence)을 생성하는 최신 기계번역 방식(Neural Machine Translation, NMT)을 소개합니다명시적인 번역 규칙을 활용하는 기존의 통계기계번역(SMT) 및 규칙기반 기계번역(RBMT)과는 달리, NMT는 인공신경망(neural network)의 은닉된 계층(hidden layer)에 번역에 필요한 정보를 나타냅니다. NMT에서 입력문은 번역에 필요한 문맥 정보(context)로 활용되며 번역문은 이러한 문맥 정보에서 단어를 하나씩 생성하는 방식으로 만들어집니다. NMT는 어순이 유사한 영어-프랑스어 사이에서 효과적인 결과를 보이고 있으며어순이 다른 언어에서 발생하는 문제를 해결하기 위한 방안도 논의할 예정입니다.
나휘동 박사 
  • 포항공과대학교 박사
  • 삼성전자 종합기술원 
14:50~15:10 휴식
15:10~16:00  의미적인 임베딩 공간을 통한 지식 기반 질의 응답
(Knowledge-based question answering via semantic embedding space)

요약지식 기반 질의 응답 시스템(KB-QA)에서 자연어 질문의 의미적 정규화 과정은 핵심적인 부분이다. 본 연구에서는 이 문제를 해결하기 위해 자연어 표현과 지식 표현들의 의미적인 임베딩 공간을 이용한다. 자질 간 의미적인 연관성은 사람이 작성한 어휘 사전이나 규칙 없이도 자질들의 임베딩 학습에 의해 계량화 된다. 질의 응답 과정을 위한 임베딩 기반 추론은 주어진 자연어 질문과 답변 후보들의 지식 표현 간 임베딩 유사도를 이용하여 답변을 제공한다.

양민철 박사
  • 고려대학교 박사
  • 네이버 검색연구센터
16:00~16:50 뉴스미디어 지식화 및 분석 서비스 - 동향, 기본 개념 및 추진 방향
(
Construction of News Media Knowledge-Base and News Analytics Service - Trends and Directions)
요약현재까지 국내 신문사 및 언론사들이 생산한 다양한 형태의 뉴스 미디어는 아직까지는 고품질의 비정형 빅데이터로서 그 가치를 인정받지 못하고 있는 실정이다. 이러한 문제점에 대한 여러가지 원인이 있을 수 있겠으나 비정형 뉴스 빅데이터의 체계적인 심층분석 및 서비스 모델 개발에 대한 심층적인 연구와 그에 따른 실용적인 접근 시도 부족이 가장 큰 원인일 수 있다. 본 발표에서는 비정형 뉴스 빅데이터에 대한 기술 중심적인 접근보다는 언론기관 중심의 사고의 전환 및 체계 수립이라는 관점에서 그 방향성을 제안한다. 또한 완전 자동화 관점에서의 기술 활용이 아닌 큐레이션 관점에서의 기술의 지원이라는 측면에서 뉴스 미디어 분석 방법을 살펴본다.
최성필 교수
  • KAIST 박사
  • KISIT 과학기술마이닝팀 팀장
  • 경기대학교 문헌정보학과
16:50~17:10 휴식  
17:10~17:50 한국어처리를 위한 통합구조
(
A unified architecture for Korean processing)
요약본 발표에서는 한국어에서 형태소분석/품사태깅, 구문분석, 개체명 인식/분류, SRL을 하나의 구조에서 처리하는 방법을 설명한다. 또한 이들을 위한 학습방법에 대해서도 설명한다.  본 발표에서는 또한 대용량 문서를 제작하는 도구와 검정하는 방법에 대해서도 발표한다. 발표에서는 이 방법을 이용한 실험 결과도 포함한다. 
차정원 교수
  • 포항공과대학교 박사
  • USC, ISI 박사후 과정
  • 창원대학교 컴퓨터공학과
17:50~19:00 운영위원회 회의