중앙대학교 영상콘텐츠융합연구소
Smart Image Content Research Center
Chung-Ang University
Smart Image Content Research Center
Chung-Ang University
총서 제1권 소개글
영상콘텐츠융합연구소는 2025년부터 2031년까지 한국연구재단의 글로벌인문사회융합연구지원사업(과제명: 감성 AI 기반 글로벌 문화콘텐츠 스토리텔링과 이미지 생성 연구)을 수행하고 있습니다. 학술 활동 결과물을 체계적으로 취합하고 확산하기 위해 ‘감성 AI 글로벌 콘텐츠 총서’를 준비하고 있으며, 2026년에 발간할 제1권은 ‘감성 AI- 기술, 예술, 인간의 경계를 다시 묻다’라는 제목의 공동 칼럼집입니다. 감성 AI라는 키워드와 관련된 단순한 기술 소개서가 아닌 ‘인간과 AI가 감정을 매개로 어떻게 공존할 것인가?’라는 질문을 출발점으로 인간-기계-예술의 관계를 재사유하는 학제간 대화의 장을 만들고자 합니다. 이곳에 수록하는 칼럼들은 총서에 담길 원고들의 요약본이자 소개글로 준비했으며, 매주 한 편씩 업데이트할 예정입니다. 앞으로 이어지게 될 감성 AI 담론들에 많은 관심 부탁드립니다.
6월 3호. AI가 인간의 뇌를 위로하는 방식
육은희
중앙대학교 영상콘텐츠융합연구소 연구전담교수
드라마 속 주인공에게 몰입하여 함께 웃고, 울고, 분노해 본 경험은 누구나 있을 것이다. 물론, 우리는 드라마 속 주인공이 겪고 있는 일이 실제가 아님을 인지하고 있다. 그렇다면, 우리는 왜 드라마 속 이야기가 실제가 아님에도 불구하고, 그 인물에게 공감하고 감정을 이입하는 것일까? 이에 대해, 미디어 심리학에서는 인간의 인지 및 정서 체계가 미디어 속 인물에 대해서도 현실의 사회적 상호작용 상황과 유사한 방식으로 작동하기 때문이라고 설명한다.
인간의 인지 및 정서 체계에 대한 본격적인 논의에 앞서, 인류의 진화 과정을 통해 인간의 뇌 처리 방식에 대해 좀 더 수월하게 접근해볼 수 있다. 예컨대, 인류의 출현 시기는 약 30만년 전 즈음으로 추정된다(김상진, 2017.06.08). 이후 인류는 수렵ㆍ채집인의 삶을 살며 포식자의 위협으로부터 생존하기 위해 공동체를 형성하고, 공동체 구성원들과 대화하며 감정을 교류하는 방식을 발전시켰다. 서로 공감하고 이해하는 능력은 공동체에서 살아남기 위한 중요한 수단이었을 테고, 그 과정에서 이루어지는 대화는 면대면의 형태가 일반적이었을 것이다. 이처럼, 인간의 인지 및 정서 체계는 수렵ㆍ채집 환경에 적응하는 오랜 진화 과정에서 형성됐다고 할 수 있다.
그리고 지금으로부터 약 100년도 되지 않은 시기, TV라는 미디어가 등장했다. 인류의 기나긴 역사에 비추어볼 때, 인간이 영상 매체를 통해 타인을 지각하게 된 것은 매우 최근의 일이다. 이에 따라, 일부 연구자들은 인간의 인지 및 정서 체계가 미디어를 통해 들어오는 자극을 처리할 때, 미디어 환경에 특화된 방식으로 처리되지 않을 수 있다고 제안한다. 가령, 기능적 자기공명영상(fMRI)을 활용한 연구들은 사람들이 미디어 속 인물은 물론(Abraham, Cramon, & Schubotz, 2008), 이모티콘(Yuasa, Saito, & Mukawa, 2006), 심지어 사회적 의도를 가졌을 것으로 해석되는 도형의 움직임에도 반응하며(Castelli, Francesca, Frith, & Frith, 2000), 이 과정에서 실제 사회적 상호작용에 관여하는 신경 체계가 활성화된다는 사실을 보고한다. 즉, 우리는 현실의 사람이 아니더라도 그 대상이 사회적 존재로 지각된다면 공감하고 감정적으로 반응할 수 있다는 것이다.
이런 사례는 가상의 아바타를 대상으로 한 연구에서도 발견된다. 그 수준에 따라 차이는 있지만, 일반적으로 AI의 의인화(anthropomorphism) 수준이 높을수록 AI를 인간으로 지각하고 감정적으로 느끼는 수준은 증가하는 것으로 알려진다(임종수ㆍ최진호ㆍ이혜민, 2000). 기계처럼 말하고 감정적인 반응이 없는 AI와 대화할 때보다 자신과 시선을 맞추고 풍부한 감정 표현을 하는 AI와 대화할 때, AI에게 더 몰입하고, 만족하고, 감정적으로 교감한다는 연구결과들이다. 이러한 결과들은, 최근 활발해지고 있는 인간과 기계와의 감정적 공감을 살피는 연구들을 통해 어렵지 않게 찾아볼 수 있다.
여기서 재미있는 실험사례를 하나 살펴보자. 한 연구진은 인간이 로봇의 고통에 공감하는지 살펴보기 위해 실험을 진행했다(Suzuki, Galli, Ikeda, Itakura, & Kitazaki, 2015). 연구진은 피험자에게 사람의 손과 로봇의 손을 대상으로 손이 가위에 베이는 듯한 ‘고통’ 조건 또는 손이 가위와 일정 거리를 유지하는 ‘비고통’ 조건으로 조작화 된 사진을 제시했다. 피험자의 반응 변화를 뇌파(EEG/ERP)로 측정한 결과, 초기 단계(0.35초~0.5초)에서는 고통 조건과 비고통 조건 간 진폭의 차이가 인간의 손에서만 유의미하게 나타났지만, 후기 단계(0.5초~0.65초)에서는 인간과 로봇 손 모두에서 이러한 차이가 유의미한 것으로 관찰됐다. 위 결과는, 자극 초기에는 인간과 로봇에 대한 공감 반응에 차이가 존재하지만, 후기 단계로 들어서면 인간의 고통에 공감했던 것과 마찬가지로 로봇의 고통에도 공감하게 된다는 것을 보여준다.
그림 1. 실험에 사용된 자극 조건
인간이 비인간 대상에게도 정서적으로 반응할 수 있다는 사실은 AI가 단순한 정보 제공자를 넘어 인간과 정서적으로 상호작용할 수 있는 대상으로 기능할 수 있음을 추측하게 한다. 이를 반영하듯, 인간-AI의 정서적 교류에 대한 긍정적인 전망이 이어지면서 AI를 활용한 돌봄, 정서적 카운슬링 효과에 대한 사회적ㆍ산업적 관심도 높다. 그 중, 국내에서 개발 및 보급되고 있는 AI 로봇 ‘효돌’은 7살 손주의 모습을 형상화한 인형형 로봇으로, 노인의 사회적 고립과 이로 인한 우울감 증가를 완화하기 위해 고안된 돌봄 로봇이다(그림 2). 전국 지방자치단체가 중심이 되어 효돌을 비롯한 돌봄 로봇을 어르신들에게 보급하고 있고, 그 효과 또한 희망적인 것으로 보고된다(지혜진, 2026.03.17). 물론, 여러 사회시스템과 연계의 필요성, 부작용에 대한 우려도 존재하지만, 파편화된 개인의 고독을 달래는 데 AI가 돌파구가 될 수 있을 것이라는 낙관적인 생각도 드는 지점이다.
그림 2. AI 로봇 효돌
AI를 연구할 때마다 ‘그렇다면 우리는 지금 이 시점에서 무엇을 해야 하는가?’에 대한 고민으로 귀결된다. 늘 명쾌한 정답은 없다. 그러나 오늘 문득, 어쩌면 우리의 뇌가 의도적이든 의도적이지 않든 기술조차 우리를 위로할 수 있는 방식으로 진화한 것은 아닐까?라는 생각이 머릿속을 스친다. 그리하여 어쩌면, 급변하는 현대사회 속에서 인류가 다시 한번 생존하기 위한 가능성을 열어둔 것인지도 모른다는 지극히 주관적인 확신으로 결말을 내린다.
참고문헌
김상진 (2017.06.08). “31만 5000년 전 ‘호모 사피엔스’ 화석 첫 발견‘ 아프리카 전역이 에덴동산”. <중앙일보>. Available: https://www.joongang.co.kr/article/21646555
임종수ㆍ최진호ㆍ이혜민 (2020). AI 미디어와 의인화: AI 음성 대화형 에이전트의 의인화 평가척도 개발 연구. <한국언론학보>, 64권 4호, 436-470.
지혜진 (2026.03.17.). “효돌이 만나고 외로움을 잊었어, 어르신 일상 바꿔준 AI 효자”. <조선일보>. Availale: https://www.chosun.com/national/national_general/2026/03/17/IQ6FW3HPUZBGJEETQFVW43GARM/?utm_source=naver&utm_medium=referral&utm_campaign=naver-news
Abraham, A., Cramon, Y. V., & Schuboz, R. I. (2008). Meeting george bush versus meeting cinderelle: The nertal response when tellin apart what is real from whai is fictional in the context of our reality. Journal of Cognitive Neuroscience, 20(6), 965-986.
Castelli, F., Happe, F., Frith, U., & Frith, C. (2000). Movement and mind: A functional imaging study of perception and interpretatin of complex intentional movement patterns. NeuroImage, 12, 314-325.
Suzuki, Y., Galli, L., Ikeda, A., Itakura, S., & Kitazaki, M. (2015). Measuring empathy for human and robot hand pain using electroencephalography. Scientific Reports, 5, 1-9.
Yuasa, M., Saito, K., & Mukawa, N. (2006, April), “Emoticons convey emotions without cognition of faces: An fMRI study”, In CHI’06 extended abstracts on human factors in computing systems (pp. 1565∼1570), ACM.
6월 2호. 영화산업과 AI: No Other Choice
남경희
중앙대학교 영상콘텐츠융합연구소 전임연구원
매년 5월에는 전 세계 영화인들의 축제 칸 영화제 (Cannes Film Festival)가 열린다. 레드카펫 행사가 열리는 뤼미에르 극장 앞에서부터 해변가를 따라 길게 뻗은 크로아젯 거리에는 감독, 제작자를 비롯한 영화를 직업으로 갖고 있는 수많은 사람들과 영화를 사랑하는 사람들로 넘쳐난다. 마켓 (Marché du Film)이 열리는 팔레 (Palais des Festivals) 건물 입구에는 영화 티켓을 구하려는 시네필들로 북적이고, 턱시도를 비롯 한껏 차려입은 관객들이 레드카펫을 통해 뤼미에르 극장에 입장한다. 이어서 초청받은 작품의 주역들이 팬들의 환호와 카메라 세례를 받으며 레드카펫을 밟고 극장 입구까지 이어진 계단을 오르면, 영화제 위원장 띠에리 프리모 (Thierry Frémaux)가 이들을 맞이한다. 위원장의 안내가 이어지고 영화 주역들의 극장 입장에 관객들은 박수를 보내고, 이들의 착석과 함께 암전이 된 후 상영이 시작된다. 영화가 끝나고 나면 관객들은 일제히 제작진과 배우들의 노고에 찬사와 박수갈채를 보낸다. 칸 영화제와 같은 시기에 열리는 마켓에서는 영화의 배급권을 사고 파는 거래가 이루어지고, 제작자들은 투자자를 찾고 투자자는 투자할 작품을 모색하며, 영화의 가치는 날카로운 비평으로 공론화되고 심사위원들의 시상으로 이어진다. 영화를 사랑하는 이들의 응축된 열기가 뿜어져 나오고, 영화의 미학적 도전과 실험적 예술 작품들이 선보이며 동시에 비즈니스가 이루어진다.
특히, 칸 영화제를 포함하여 특별한 지위를 갖고 있는 소수의 영화제들은 전 세계 영화 트렌드를 소개하고 확산하는데 앞장 서며 산업의 변화를 반영한다. 2017년 넷플릭스가 투자한 봉준호 감독의 <옥자>가 칸 영화제 경쟁 부문에 초청되었을 때, 프랑스의 극장주들과 배급사들은 극장에 상영할 목적의 영상물이 아니면 영화가 아니라며 작품의 ‘영화제’ 초청을 격렬히 반대했다. 지금은 넷플릭스와 아마존 등 다국적 플랫폼들의 영화 제작 투자는 더 이상 드문 일이 아니며, 오히려 종횡무진 영화제 활동을 이어가고 있고 전 세계 영화 산업에서 주도적 역할을 하고 있다고 보아도 과장이 아니다. 심지어, 할리우드의 스튜디오들도 자사 플랫폼을 만들어 서비스를 제공하며 플랫폼 배급 경쟁에 뛰어들었다.
지금은 영화 산업에서 인공지능 (Artificial Intelligence, AI)을 논의한다. 제79회를 맞은 2026 칸 영화제에서도 AI는 논란의 중심에 서 있었다. 심사위원으로 위촉된 할리우드 배우 데미 무어 (Demi Moore)는 영화 산업에서 AI 활용에 대해 공존의 방법을 모색해야 한다고 언급했다. 여전히 AI 사용에 대한 우려의 목소리가 있지만, 업계 내에는 찬반의 입장이 공존하고 있으며 AI가 미치는 영향과 임박한 변화에 대해서는 이견이 없어 보인다. 영화 산업은 또다시 큰 전환기를 맞이하고 있다. AI는 단순히 영화 제작을 보조하는 수준을 넘어 시나리오를 작성하고, 장면을 생성하며, 배우의 얼굴과 목소리를 재현하고, 학습된 편집과 연출 스타일로 영화를 만들어낸다. 몇 년 전 할리우드 작가조합 (Writers Guild of America, WGA)과 배우조합 (Screen Actors Guild-American Federation of Television and Radio Artists, SAG-AFTRA)의 파업에서 AI 사용은 핵심 쟁점 중 하나였고, 이를 둘러싼 이슈가 첨예한 문제로 대두되었다. 그리고, 2026년 칸 영화제를 앞두고 배우조합은 AI 사용과 관련하여 스튜디오들과의 논의에서 진척을 보였다고 밝혔다. 산업 전문가는 물론 학계에서도 AI 사용에 대한 충분한 논의와 규제에 대한 고민이 필요하다는 점에 동의하고 있다. 이 글은 완성형의 답을 제시하지 못한다. 대신, AI 시대에 영화 산업이 마주한 변화와 이슈에 대해 질문을 하고 담론을 열어주는 역할을 할 수 있기를 바란다.
6월 1호. 문화 상대성과 보편성 사이의 감성 AI: OTT 서사의 정동적 지형학
박영석
중앙대학교 영상콘텐츠융합연구소 연구전담교수
기계가 인간의 표정, 음성, 텍스트를 통해 감정을 읽고 반응하는 ‘감성 AI’의 시대가 도래하는 중이다. 감성 AI 기술 발전의 전망 속에서 이를 인문사회학적 분석이나 예술적 실천에 활용할 때 맞닥뜨리는 중요한 질문은 이런 것이다. 감성 AI는 국가, 인종, 성별, 종교 그리고 문화적 특징과 어떻게 관계되는가? 인류의 보편성과 문화의 특수성이라는 두 축 사이에서, 감성 AI는 어떤 긴장을 창출하며 진동하는가? 그리고 그 위태로운 진동 속에서, AI는 자칫 각 문화가 가진 고유한 감정의 결을 잃어버리는 것은 아닐까?
감성 AI의 영어 표기인 ‘Affective AI’라는 말에는 인간이 외부로 표출하는 기쁨, 슬픔 등의 기호화된 감정(emotion)을 넘어, 인지 과정 이전에 발생하는 신체적이고 무의식적인 반응인 정동(affect)까지 AI를 통해 포착하고 계산하겠다는 기술적 지향점이 담겨 있다. 이는 곧 기술이 인간의 가장 본질적이고 통제 불가능한 신체적 차원까지 침투해 들어옴을 의미한다. 이러한 기술적 침투가 문화와 맺는 복잡한 관계를 파악하기 위해서는, 우선 정동과 감정의 개념적 차이에 주목할 필요가 있다. 정동은 어떠한 자극과 마주친 순간 즉각적으로 발생하는 인지과학적, 자율신경계적 차원의 신체적, 생리적 반응을 뜻한다. 심박수 증가, 땀 분비, 동공 확장, 근육의 미세한 떨림 등 의식적으로 통제하기 어려운 강렬도(intensity)와 에너지의 흐름이다. 인간은 이 정동을 수용하고, 인지적·사회적·문화적 필터를 거쳐 의미를 부여하면서 어떠한 감정을 느끼고 표출한다. 정동은 주로 인류가 공유하는 생물학적 보편성에 기반을 두는 반면, 상대적으로 감정은 문화적 상대성의 영향을 강하게 받는 사회적·역사적 배치(assemblage)의 영역에 가깝다. 따라서 감성 AI 시스템이 현실이든 콘텐츠 속이든 인간의 감정을 읽어내기 위해서는 감정을 정동으로 번역하는 알고리즘이 구축되어야 하며, 감정에 반응하거나 표현하기 위해서는 그 반대의 과정이 작동해야 한다.
감정을 생산하고 공유하며 반영하고 되돌려주는 픽션과 스토리텔링의 매개체로서 영화와 드라마 등의 대중문화적 영상 콘텐츠들은 이러한 번역의 메커니즘이 작동하는 최전선에 있다. 그런데 과거의 아날로그 미디어 환경에서 대중이 접할 수 있는 해외 영상 콘텐츠는 할리우드를 위시한 영미권과 일부 서구권 작품에 국한되어 있었다. 비서구권 지역의 영상물은 창작과 소비 환경 모두 대중성과는 거리가 멀었고, 주로 국제영화제나 시네마테크를 통해 제한적으로 배급되는 작가주의 예술영화의 범주에 위치했다. 이들 영화가 자국 문화의 특수성을 심도 있게 투영한 것은 사실이나, 그것은 대중의 보편적 삶의 양식이라기보다 감독 개인의 미학적 자의식 아래로 수렴되는 경향이 짙었다. 결과적으로 대중문화의 층위에서 글로벌 영상 서사의 보편적 기준을 규정하는 권력은 온전히 할리우드 영화가 독점하게 되었다. 특히 할리우드가 정립한 영화 장르들은 장르적 관습에 따르는 영화 제작과 장르적으로 훈련된 관객의 상호작용을 통해 지속적으로 정교화되어 왔다. 따라서 문화적 보편성을 대표하는 할리우드의 장르적 관습은 인간의 원초적 정동이라는 생물학적 보편성을 가장 효율적으로 자극하는 구조적 원리로 받아들여졌다.
바로 이 지점에서 최근 글로벌 영상 콘텐츠의 지정학적 지형은 급격한 변곡점을 맞이한다. 정동과 감정 그리고 보편과 특수 사이의 긴장은 오늘날 영상문화의 주류인 OTT 오리지널 콘텐츠의 스토리텔링 구조에서 매우 중요한 메커니즘으로 작동하고 있다. 오리지널 영화와 시리즈들은 서스펜스의 긴장감이나 도파민 분비와 같은 글로벌 시청자의 원초적 정동과 다층적인 정서적 효과를 극대화하도록 서사 구조를 설계한다. 이때 생리적 정동을 촉발하기 위해, 이들은 역설적으로 각 지역의 가장 구체적인 사회적 현실과 문화적 질감이라는 감정의 언어를 매개로 삼지 않을 수 없다. 실제로 OTT 플랫폼이 수집하는 사용자의 시청 습관 빅데이터(시청 정지, 되감기, 반복 재생, 건너 뛰기 등)와 흥행 예측 알고리즘은 결국 감성 AI가 인간의 정동을 계산하는 방식과 맞닿는다.
물론 글로벌 규모의 OTT 플랫폼이 미국 자본을 중심으로 운영되고 있으며, 그들의 알고리즘 역시 할리우드적 보편성을 뼈대로 삼고 있다는 점에서 영상 산업의 주류적 지형도가 완전히 재편된 것은 아니다. 그럼에도 불구하고 오늘날 오리지널 콘텐츠의 창작 주체는 그 어느 때보다 다국적이고 다문화적인 양상을 띤다. 이는 플랫폼의 명운이 글로벌 구독자 확보에 직결되어 있으며, 이를 견인하는 데에는 각 지역의 특수성을 담아낸 로컬 콘텐츠 제작이 매우 효과적임이 증명되었기 때문이다. 가령 대한민국에서는 넷플릭스 도입 초기에 봉준호의 <옥자 (Okja)>(2017)를 통해 비약적인 가입자수 증가를 이뤘다. 넷플릭스는 다양한 국가의 영화 및 드라마 제작사들에게 넉넉한 자본을 제공하면서 창작의 자율성을 상당 부분 보장해주는 것으로 알려져 있다. 이는 비서구권 국가들의 다양한 문화적 특징들이 콘텐츠에 반영될 수 있는 조건이다. 오늘날 오리지널 콘텐츠의 제작 주체는 과거의 영화 및 TV 제작진을 폭넓게 포괄한다. 국제영화제를 통해 예술 세계를 알리던 작가주의 감독이나 자국민만을 위한 드라마를 만들던 제작자들도 이제는 OTT가 글로벌 대중문화와 커뮤니케이션의 장이라는 사실을 직시하지 않을 수 없다. 따라서 창작자들은 자국의 사회문화적 특수성을 깊게 반영하면서도 글로벌 관객이 공유하는 장르적 관습과 보편적 대중문화의 코드를 동시에 녹여내기 위해 치열한 노력을 기울이고 있다. 한국의 미시적인 골목길 놀이 문화와 자본주의적 생존 투쟁을 서바이벌 장르의 기호로 훌륭하게 번역해 낸 <오징어 게임 (Squid Game)>(2021-25)은 이러한 노력의 시너지를 증명한 대표적 사례다.
이처럼 로컬리티와 장르 관습의 결합은 비단 한국 콘텐츠에 국한되지 않는다. 예컨대 북유럽에서 제작되는 ‘노르딕 누아르’ 콘텐츠는 할리우드의 갱스터, 누아르, 스릴러의 관습에 따라 작품의 뼈대를 구성하며, 해당 장르에 익숙한 관객들이 충분히 공유할 수 있는 장르적 쾌감과 즐거움을 제공한다. 그러면서도 거시적인 세계관, 세부적인 내러티브 상황, 캐릭터의 특질 측면에서 북유럽적 특수성도 놓치지 않는다. 특히 북유럽 신화와 고대 노르드 종교, 바이킹 역사로 이어지는 종교·문화적 뿌리, 그리고 빙하와 영구동토층, 기후변화와 해빙, 화산과 피오르 지형 같은 특유의 자연적 조건이 오늘날 북유럽인의 삶과 어떻게 교차하는지에 대한 깊은 성찰은 북유럽적 문화 상대성의 본질을 형성한다. 이러한 역사·지리적 특수성은 단순히 서사의 배경에 머물지 않으며, 가령 창백한 화면의 색채와 적막한 사운드라는 감각적 질감으로 육화되기도 한다. 이렇게 구현된 차갑고 황량한 질감은 글로벌 관객의 신체에 오싹하고 서늘한 생리적 정동을 촉발하고, 이는 스릴러의 문법과 결합하여 서스펜스와 고립감 등의 정서적 경험으로 전환시키는 매개체로 작동한다.
향후 감성 AI를 통해 대중문화예술 콘텐츠를 분석하거나 이를 기반으로 주도적인 스토리텔링을 실현하기 위해서는 글로벌 장르 문법과 로컬의 특수성을 모두 고려하는 분석적 기반이 마련되어야 한다. OTT 오리지널 콘텐츠에 대한 구조적 분석은 이를 위한 유용한 출발점이다. 전반적인 내러티브 구조에 대한 서사론적 분석을 넘어, 특정 서사 내에서 정동적 에너지가 발현되고 로컬의 감정으로 전환되는 메커니즘을 체계화할 수 있다면, 글로벌 콘텐츠 생태계에서 작동하는 감성 AI 시스템이 생물학적·문화적 보편성과 문화 상대성 사이에서 길을 잃지 않도록 가이드라인을 제공할 수 있을 것이다.