디지털 인문학은 디지털 기술을 활용하여 인간과 사회의 문제를 탐구하는 학문적 활동을 총칭한다. 인간의 사고와 표현은 모두 언어에 의해 표현되며 사회의 문제는 개인의 영역을 넘어선 집단의 층위에서 주로 발견된다. 따라서 본 수업은, 컴퓨터를 활용하여 한국어 언어자원 처리하고 사회집단을 분석하는데 필요한 기본적 이론과 사례연구를 학습하고 이를 실제로 적용할 수 있도록 실습한다. 이를 위해, 아날로그 텍스트의 디지털화 방법, 디지털 텍스트의 데이터 베이스화, 말뭉치(코퍼스) 단위의 분석, 어휘분석, 공기어 분석, 공기어 네트워크, 또한 기계학습을 통한 어휘분석 알고리즘의 개발과 같은 내용을 다룬다. 수업의 전반부는 이와 같은 주제와 관련된 이론과 사례를 학습하고 후반부는 주어진 자료나 학생들이 찾은 자료를 대상으로 컴퓨터 실습을 한다. AI Programing를 마치고 파이선을 다룰 수 있는 학부 2학년 이상이 수강대상이다.
본 수업의 목적은 자연어 생성 (natural language generation)을 한국어에 최적화시킨 여러 모델을 활용하여 시, 노래가사, 시조, 대화(시나리오), 그리고 단편소설과 같은 작품을 만들어보는 것이다. 이를 위해, 학기 전반부에는 한국어 말뭉치, 아카이브 자원을 탐색하고, 시, 소설, 시나리오 등과 같은 문학장르의 형식적 특징을 살펴보며, 자연어 처리 및 생성에 대한 이론, 역사, 최신 경향을 학습한다. 중간고사 기간에 제출한 기말 프로젝트 제안서를 바탕으로 학기 후반부에는 자연어 처리 및 언어 모델의 사용법을 실습하며, 프로젝트 결과물을 발표하고 평가한다. 코딩을 잘 할 수 있는 학생과 아이디어가 있는 학생들이 한 팀으로 모여 프로젝트를 수행한다. 한 학기 동안 풀지 못한 도전적인 과제는 교내의 AICP (AI Challengers Program)과 같은 동아리 활동과 연계할 수 있는 기회를 제공할 것이다.