2023 데이터베이스소사이어티 여름학교
빅데이터 기반 최신 인공지능 기술 현황과 한계
2023년 8월 24일(목)~25일(금) 연세대학교 제2공학관 B039
행사개요
일자: 2023년 8월 24일(목) ~ 25일(금)
장소: 연세대학교 제2공학관 B039
주최: 한국정보과학회 데이터베이스소사이어티
주관: 연세대학교
초대의 말씀
빅데이터를 기반으로 하는 다양한 인공지능 기술이 많은 각광을 받고 있으며, ChatGPT와 같이 기술적인 혁신과 한계점을 함께 보여주는 사례가 등장하고 있습니다. 빅데이터와 인공지능과 관련된 다양한 기술의 현황과 한계점에 대한 이해를 돕기위해 한국정보과학회 데이터베이스소사이어티에서 2023년 8월 24일(목)~25일(금) 양일에 걸쳐 "빅데이터 기반의 최신 인공지능 기술 현황과 한계"라는 부제로 여름학교를 개최합니다.
빅데이터, 인공지능, 데이터베이스를 연구하고 계시는 국내 최고 권위의 연사분들을 초청하여 이론부터 응용까지 다양하고 유익한 강의를 준비하였습니다. 부디 많은 연구자분들께서 여름학교에 참여하시어 최신 데이터 및 인공지능 기술에 대한 폭넓은 이해와 경험을 습득하시고 서로 교류할 수 있는 시간이 되기를 기대합니다.
대회장 : 황인준(고려대)
조직위원장: 박상현(연세대), 박치현(강원대)
프로그램 위원 : 문양세(강원대), 이종욱(성균관대), 박노성(연세대)
자문 위원 : 송하주(부경대), 이상원(성균관대), 이상준(숭실대)
프로그램
강의자료
2023년도 데이터베이스소사이어티 여름학교 강의자료 링크 (https://shorturl.at/bjBLV)
프로그램 내용 요약
프로그램 1: Exploring the limitations of ChatGPT/LLMs
연사: 서울대학교 이재윤 교수님
요약: Since last December, ChatGPT has become the talk of the town with its ease of usage and versatility in broad applications, from generating code to answering questions on diverse topics. While it seems ChatGPT can easily solve most of the problems, in this talk, I will discuss various limitations of Large Language Models (LLMs) centered around its logical inconsistencies and examples from ChatGPT model. To do so, I will first introduce the recent trend of pre-trained language models and how recent LLMs such as ChatGPT distinguished themselves. Second, I will show, with examples, that LLMs still suffer from logical inconsistency and hallucination problems as previous language models did, despite their remarkable generation capabilities. Lastly, I would like to discuss emerging new research topics with the advent of foundational models such as ChatGPT.
연사약력:
Assistant Professor, Graduate School of Data Science, Seoul National University, 2022 - Present
Postdoctoral Researcher, University of Massachusetts Amherst, 2020-2022
Ph.D., Computer Science Department, Carnegie Mellon University, 2020
B.S., Electrical Engineering, KAIST, 2008
프로그램 2: 대규모 언어 모델과 데이터베이스 시스템의 결합
연사: 카이스트 김민수 교수님
요약: 최근 BERT, Llama, PaLM, GPT-3.5, GPT-4와 같은 대규모 언어 모델(LLM)에 대한 기술이 빠르게 발전하면서 종래에 사람이 하던 많은 종류의 작업들이 대규모 언어 모델에 의해 대체되기 시작했다. 그러나 LLM만 사용해서는 LLM의 가장 큰 단점으로 지적되는 환각(hallucination) 현상을 피하기 어려우며, 이를 해결하기 위해 LLM과 외부 데이터베이스를 연결 또는 결합하는 기술이 점점 중요해지고 있다. 본 강의에서는 LLM과 외부 데이터베이스를 연결하기 위한 프레임워크 기술들로서 최근 각광받기 시작한 LangChain 및 LlamaIndex를 소개하고, LLM이 데이터베이스에 접근하는데 사용되는 가장 보편적인 두 가지 기술인 임베딩 벡터 기반의 유사도 검색과 Text2SQL/Text2CQL을 설명한다. 또한 유사도 검색을 위한 대표적인 색인 기법들로 locality-sensitive hashing, product quantization, ANNOY, HNSW 등을 설명한다. 더 나아가 LLM과 데이터베이스 사이를 연결하는 것이 아니라 LLM과 데이터베이스를 결합하기 위한 최근의 여러 시도들에 대해서 소개한다.
연사약력:
1998/2000/2006년 KAIST 전산학부 학사/석사/박사
2007-2009년 미국 UIUC, 포닥
2009-2011년 미국 IBM Almaden 연구소, 연구원
2011-2020년 DGIST 전기전자컴퓨터공학과 조교수/부교수
2018-2020년 한국연구재단 선도연구센터(ERC)인 암흑데이터 극한활용 연구센터 센터장
2020년-현재 KAIST 전산학부 부교수/교수
2022년-현재 스타트업 GraphAI의 Co-Founder 및 CEO
프로그램 3: Theory, advancements, and applications of Graph Neural Networks (GNNs)
연사: 한국원자력연구원 최희선 박사님
요약: Graph Neural Networks (GNNs) have emerged as a powerful framework for analyzing and learning from complex structured data, where relationships among entities can be represented as graphs. In this 100-minute lecture, we will embark on an in-depth exploration of GNNs, starting from the fundamental concepts and theoretical underpinnings and gradually progressing towards their diverse applications.
The lecture will begin by introducing the fundamental principles of GNNs, unraveling their underlying architecture, and highlighting their ability to capture intricate dependencies within graph-structured data. We will delve into the theoretical foundations, discussing various approaches such as graph convolutions, message passing, and neighborhood aggregation, which enable GNNs to aggregate and propagate information across nodes in a graph.
Moving beyond the basics, the lecture will then shift its focus towards two key advancements in GNN research: edge convolution and dynamic graphs. We will explore how edge convolutions empower GNNs to exploit edge-level features and capture fine-grained relationships, enhancing their expressive power. Additionally, we will delve into the exciting realm of dynamic graphs, where the structure of the graph evolves over time, necessitating adaptive mechanisms within GNNs to handle temporal dynamics and evolving connectivity patterns.
Throughout the lecture, we will focus on applying GNNs to a curated selection of specific engineering applications. By delving into these case studies, we will demonstrate how GNNs can effectively leverage graph structures to address key challenges in diverse engineering domains.
연사약력:
고려대학교 수학과 학사, 박사
2018.09 ~ 2020.02: 박사후 연구원, 경희대학교
2020.03 ~ 2021.11: Postdoctoral Associate, University of Colorado
2021.12 ~ 현재: 선임연구원, 한국원자력연구원 (원자력안전기반연구소 인공지능응용연구실)
프로그램 4: Deep anomaly detection
연사: 연세대학교 이동하 교수님
요약: Data intelligence, derived from extensive learning of real-world data, has brought about substantial impact and value across multiple domains through its diverse applications. In this talk, our focus will be on the crucial task of anomaly detection, which involves identifying unusual patterns within datasets. Specifically, we will delve into the foundational concept of anomaly detection, explore its various real-world scenarios, and address the associated practical challenges. Additionally, we will examine several recent studies on deep anomaly detection techniques specifically designed for tabular, text, and time-series data.
연사약력:
Assistant Professor, Department of Artificial Intelligence, Yonsei University, 2023-현재
Postdoctoral Researcher, UIUC, 2021-2023
Postdoctoral Researcher, POSTECH, 2020-2021
Visiting Scholar, University of Texas Health Science Center at Houston, 2018-2019
Ph.D., Department of Computer Science and Engineering, POSTECH, 2020
B.S., Department of Computer Science and Engineering, POSTECH, 2015
프로그램 5: Multimodal foundation model
연사: 연세대학교 유영재 교수님
요약: 이 발표에서는 GPT-4를 포함한 Multimodal foundation model에 대한 소개를 할 예정입니다. 멀티모달 모델의의 무한한 활용성과 비즈니스 기회 때문에 ChatGPT에서 GPT-4로의 확장, 구글의 대항마 Gemini의 반격이 특히 주목을 받고 있습니다. 본 발표를 통해 교육생들은 멀티모달 초거대 모델의 개념, 구조, 원리, 응용 분야에 대해 배울 수 있습니다.
연사약력:
서울대 컴퓨터공학부 학사,석사,박사
2023.03 ~ 현재: 조교수, 연세대학교 인공지능학과
2021.06 ~ 2023.03: 박사후연구원, Allen Institute for AI, Mosaic
2019.03 ~ 2021.12: 연구원, Ripple AI
2018.06 ~ 2018.09: 연구 인턴, 마이크로소프트 연구소
프로그램 6: Competition-Aware Recommendation: Observations, Approaches, and Applications
연사: 한양대학교 김상욱 교수님
요약: These days, we have a huge number of items such as products, content, and people online, which makes each user face difficulties in choosing the items that s/he really likes. Good matching of an individual user to her/his preferable items is a very challenging task to enhance users’ satisfaction and companies’ profit, highlighting the necessity of recommender systems. The recommender system analyzes the characteristics of users’ past behaviors and then predicts the items on which each individual user would be truly satisfied based on the result of the analysis. In this talk, we first introduce a new notion of 'limited competition' among items, which can be observed in some domains such as TV shows and news recommendations where an item competes only with some of the other items, rather than all items, in being chosen by a user. For example, in the TV show domain, a user can select and watch a TV show among only the TV shows that are currently broadcast, other than all TV shows; in this case, a TV show broadcast in a time period has limited competition only with other TV shows broadcasted in the same time period. Based on this notion of limited competition, we propose novel competition-aware recommender approaches that accurately learn user preferences for items in the TV show and news recommendation domains. Finally, through extensive evaluation, we validate the effectiveness of our competition-aware approaches in terms of recommendation accuracy, compared to existing ones that do not consider the notion of limited competition. The agenda of this talk is organized as follows.
I. Recommender Systems: An Overview
1.1 Concepts
1.2 Applications
1.3 Techniques
II. Competition-Aware TV Show Recommender
2.1 TV Show Recommendation Domain
2.2 Our Observation: Limited Competition
2.3 Our Competition-Aware Approach
2.4 Evaluation
III. Competition-Aware News Recommender
3.1 News Recommendation Domain
3.2 Our Observation: Lifetime of News and Limited Competitions
3.3 Our Competition-Aware Approach
3.4 Evaluation
IV. Summary and Conclusions
연사약력:
학력
1991년 3월 - 1994년 2월: KAIST 전산학과 (박사)
1989년 3월 - 1991년 2월: KAIST 전산학과 (석사)
1985년 3월 - 1989년 2월: 서울대학교 컴퓨터공학과 (학사)
경력
2006년 3월 - 현재: 한양대학교 컴퓨터소프트웨어학부 교수 (연구석학교수)
2020년 9월 - 현재: 교육부 BK21-FOUR 인공지능교육연구단장
2019년 1월 - 현재: 한국공학한림원 정회원
2018년 4월 - 현재: NHN(주) 사외이사
2019년 1월 - 2021년 12월: 삼성전자 미래기술연구회 위원
2017년 9월 - 2018년 8월: 한국정보과학회 데이터베이스 소사이어티 회장
2009년 1월 - 2010년: Carnegie Mellon University, Computer Science Department, Visiting Professor (invited by Prof. Christos Faloutsos)
1999년 8월 - 2000년 8월: IBM T.J. Watson Research Center, Post-Doc.(invited by Dr. Philip Yu)
1991년 7월 - 1991년 8월: 미국 Stanford University, Computer Science Department, Visiting Scientist (invited by Prof. Gio Wiederhold)
관심분야
Big Data, Data Science, Recommender Systems, Social Network Analysis
등록안내
등록안내: 사전등록(온라인) 및 현장등록
사전등록 마감: ~2023.08.21일(월)23일(수) [온라인 사전등록 기간 연장]
행사장, 행사일정 등 관련: 박상현 교수 (sanghyun@yonsei.ac.kr)
참가확인서, 납입증명서, 거래명세서가 필요하신 경우 '성함, 소속, 행사명'을 기재하여 문은정 과장님(ejmoon@kiise.or.kr, 02-588-4002)에게 신청하여 주시기 바랍니다.
등록비 일반 전일제 학생
사전등록 300,000원 200,000원
현장등록 350,000원 250,000원
행사 장소 안내
서울특별시 서대문구 연세로 50 연세대학교 제2공학관 B039