관심 분야 : 전산 언어학, 언어유형론, 상식 추론, 음성학 등
Github : https://github.com/songys
scholar : https://scholar.google.com/citations?user=kp_a52kAAAAJ&hl=ko&authuser=1
Youtube : https://www.youtube.com/channel/UC6kHTx_z0XmU9TFKqzvJ9TQ/videos?view=57
Mail : klanguage1004@gmail.com
최종 학력 : 경희대학교 국어학 전공(2023.8 Ph.D.)
소속 : 래블업 주식회사, 연구원
2025
저널
강아름, 송영숙(2025), 인공지능 기계 번역과 상호참조해결 말뭉치를 활용한 한국어와 중국어 한정성 비교 연구, 생성문법연구, 35(1), 119-141.
컨퍼런스
Dokyoon Yoon, Youngsook Song, Woomyoung Park (2025), Stop learning it all to mitigate visual hallucination, Focus on the hallucination target, CVPR 2025.
송영숙, 강정석, 김태은, 유현조, 황은진(2025), 원본 의미 보존을 위한 한국어 텍스트 스타일 변환: 합성 데이터 생성과 대규모 평가, 2025년도 한글 및 한국어 정보처리 &한국코퍼스언어학회 공동 학술대회
발표
국립순천대학교, 제1회 글로벌 지역혁신 전문가특강 "언어를 읽는 AI, 사회를 바꾸는 데이터", 5월 4일
IT북토크, 역자/저자와 책을 읽읍시다! , 5월 18일
단국대학교 신입생 특강(5월 19일) 및 취창업 특강(5월 27일)
컨퍼런스 2025Langcon 개최(organizer) 및 발표
과제
과학기술정보통신부, 2025 독자 AI 파운데이션 모델 프로젝트 참여사 실무 책임
기타
NLP4DH Program Committee
2024
저널
宋永淑, 趙元翼(2024), 사람과 AI 모델 간의 화행 주석 개선 방향 연구, 語文硏究 제52권 제1호, 69-90.
Youngsook Song, Won Ik Cho(2024) - Study on the Domain Adaption of Korean Speech Act using Daily Conversation Dataset and Petition Corpus, jdmdh:13145 - Journal of Data Mining & Digital Humanities, 4 juin 2024, NLP4DH - https://doi.org/10.46298/jdmdh.13145, ISBN: 9781713863175
컨퍼런스
Taeeun Kim, Semin Jeong, Youngsook Song, KoGEC : Korean Grammatical Error Correction with Pre-trained Translation Models, Proceedings of the 38th Pacific Asia Conference on Language, Information and Computation, 2024, Japan.
송영숙, 강아름(2024), 상호 참조 데이터 세트를 활용한 GPT-4의 다면적 한국어 성능 평가, 제36회 한글 및 한국어 정보처리 학술대회(HCLT) 발표 논문집, 335-339.
강아름, 송영숙(2024), 한정성과 상호참조해결의 만남: 딥러닝 언어모델의 활용(포스터 발표), 제36회 한글 및 한국어 정보처리 학술대회(HCLT) 발표 논문집, 576-580.
책
송영숙, 유현조(2024.12.18) 번역, 기초부터 다지는 통계학 교과서 with 파이썬, 인사이트 출판사.
ISBN 9788966264629
특허
윤도균, 송영숙, 박우명, 멀티 모달 모델의 학습 방법 및 전자 장치, 출원번호 10-2024-0192809, 출원일자 2024-12-20
발표
송영숙, 한림과학원, 한국어오픈소스 코퍼스 분석, 2024.5.
송영숙, 한림대학교 MHC4.0. 비전공생대상 AI기반 코딩 교육 방안 및 로드맵 개발 연구팀, 인문사회분야 AI기반 고등교육 로드맵 세미나, 2024. 8.10.
송영숙, ETRI Open Source Tech Day 2024,지속 가능한 성장을 위한 오픈소스 커뮤니티의 역할, 2024.10.15.
강아름, 송영숙, 2024.11.9, Definite Descriptions in Korean and Chinese: A CoreferenceBased Approach Using Neural Machine Translation, 2024 한국생성문법학회·한국언어정보학회 가을 공동학술대회, 중앙대학교 중앙대학교 203관(서라벌홀).
과제
2024.07.-2024.11. 사용자 중심 답변 생성을 위한 초거대 언어 모델의 대화 생성 평가 데이터 세트 구축, 2024년 데이터바우처 - 데이터가공(AI), 한국데이터산업진흥원 PM
2024.6.1-2.25.5.30 한정성과 상호참조해결의 만남: 딥러닝 모델의 활용, 2024년도 신진연구지원사업, 연구원
기타
2024. 08.20. 제5회 학천 박유서 신진국어학상 수상 『인공지능의 일상 대화 추론 능력 향상을 위한 자연어 생성 연구』”(경희대 박사학위 논문)
컨퍼런스 2024 Langcon 개최(organizer)
해커톤 참가 : Build with Low-Code: Langflow Hack Summary (7.12~7.14)
제2회 GenAI 해커톤(8.1. ~ 9.12)
Meta Llama 경진대회 - 한국 지역 예선 (8.5.~10.4.)
기술 블로그 편집 및 집필
(한국어) https://blog.sionic.ai/
(영어) https://blog-en.sionic.ai/
(일본어) https://blog.sionic.jp/
2023
저널
정유남, 송영숙, 유현조(2023), 한국어 중첩 개체명의 말뭉치 구축 연구, 국어학-.105 : 309-344.
DOI : 10.15811/jkl.2023..105.009
신현규, 유현조, 송영숙(2023), AI에 적합한 일반 상식 추론 대화의 자동 생성을 위한 정량적, 정성적 연구, 정보과학회논문지 제50권 제5호. DOI : 10.5626/JOK.2023.50.5.407
송영숙(2023년 8월 16일), 인공지능의 일상 대화 추론 능력 향상을 위한 자연어 생성 연구, 경희대학교 박사 학위 논문.
컨퍼런스
책
박조은, 송영숙(2023), 모두의 한국어 텍스트 분석, 길벗 출판사.
ISBN 9791140704521
송영숙, 심상진, 고재선, 한수미(2023), 파이썬을 활용한 딥러닝 전이학습, 번역서, 2023년 07월 10일 출간(종이책 : 2019년 10월 11일 출간)
발표
박조은, 송영숙(2023), 모두의 한국어 텍스트 분석 북콘서트, 한양대 211건물 402호
송영숙, 정유남, 유현조(2023) , 표 기반 유사 문장 말뭉치를 이용한 AI 언어능력 평가, 한국코퍼스언어학회, 연세대학교 위당관.
송영숙, 심상진, 김성현(2023), 대화형 생성 모델을 위한 인권 코퍼스 구축(포스터 발표) , 한글 및 한국어 정보처리 학회, 제주 새마을금고 연수원.
송영숙, 조원익(2023), 화행에 따른 일상대화 분석과 자연어 생성 연구, 한국어문교육연구회, 서울대학교 인문대학 14동 .
과제
2023.08.06. - 2023.12.20. 문화체육관광부 국립국어원, 인공지능의 언어 능력 평가 체계 운영 및 말뭉치 정비, 연구원
기타
컨퍼런스 2023Langcon 개최(organizer)
2023 빅콘테스트(생성형AI분야) 심사
2022
저널
송영숙, 정유남(2022), 국어사전 용례의 윤리성 자동 분류 문제와 제안. 언어와 정보 26.2, 109-127.
DOI : 10.29403/LI.26.2.5
송영숙, 유현조, 정유남(2022), 한국어 중첩 개체명 분석을 위한 연구, 한국어 의미학 76, 66-101.
DOI : 10.19033/sks.2022.06.76.65
발표
[우수논문상] 신현규, 송영숙(2022), AI에 적합한 일반상식 문장의 자동 생성을 위한 정량적, 정성적 연구, 제34회 한글 및 한국어 정보처리 학술대회(HCLT) 발표 논문집, 153-159.
정유남, 송영숙, 유현조(2022), 한국어 중첩 개체명 말뭉치 구축의 실제, 2022년 세계 한국어 한마당 학술대회 발표자료집.
송영숙, 정유남(2022), 국어사전 용례에서의 윤리성 자동 판별 문제, 한국생성문법학회-한국언어정보학회 가을 공동학술대회
송영숙, 정유남 유현조(2022), 한국어 중첩 개체명 분석을 위한 연구, 제49차 한국어의미학회 전국학술대회
과제
2022년 6월 - 2023년 2월, 문화체육관광부 국립국어원, 인공지능의 언어 능력 평가 체계 운영 및 말뭉치 정비, 연구원
2022년 6월 - 2023년 1월, 문화체육관광부 국립국어원, 말뭉치 함의 분석 및 연구, 연구원
2022년 5월 - 2022년 11월 , NIA 한국지능정보사회진흥원, 한국어 일반 상식 문장 데이터, 총괄 책임
Datasets & Toolkits
한국어 중첩 개체명 말뭉치 Github
한국어 개체명 말뭉치 Github
기타
중앙대학교 인문콘텐츠연구소 뉴스레터 URL: http://aihumanities.org/ko/archive/webzine/?vid=101
컨퍼런스 딥러닝 시대의 언어 연구 : 언어 인공지능과 상식의 만남 개최(organizer) URL: http://commonsense.or.kr/
2022.10. 우수논문상, AI에 적합한 일반상식 문장의 자동 생성을 위한 정량적, 정성적 연구, 제 34-03호, 한국정보과학회(언어공학연구회위원장)
2021
저널
유현조, 송영숙, 김민수, 윤기현, 정유남(2021). 딥러닝 기반 한국어 개체명 인식의 평가와 오류 분석 연구. 언어, 46(3), 803-828.
DOI : 10.18855/lisoko.2021.46.3.010
송영숙 · 조원익 · 박장원 · 김성동(2021), 소셜 미디어 뉴스 표제 속 후방 조응 표현의 의미 전달 양상 연구, 한국어 의미학 71, 75-92.
DOI : 10.19033/sks.2021.03.71.75
컨퍼런스
Sungjoon Park, Jihyung Moon, Sungdong Kim, Won Ik Cho, Ji Yoon Han, Jangwon Park, Chisung Song, Junseong Kim, Youngsook Song, Taehwan Oh, et al. (2021), Klue: Korean language understanding evaluation. In Thirty-fifth Conference on Neural Information Processing Systems Datasets and Benchmarks Track (Round 2).
발표
김성현, 송영숙, 송치성, 한지윤(2021), 한국어 개체명 인식에서 의미 모호성 연구, 한글 및 한국어정보처리 학술대회(HCLT) 발표 논문집, 203-208.
유현조, 정유남, 송영숙, 김민수, 윤기현(2021), 한국어 개체명 인식의 현황과 전망, 한국언어학회 여름학술대회 발표논문집, 178-192.
ISSN 1049-5258
Datasets & Toolkits
KLUE : Korean Language Understanding Evaluation dataset Leaderboard
기타
컨퍼런스 2021Langcon 개최(Organizer & Speaker) URL: https://songys.github.io/2021Langcon/
2020
저널
송영숙, 심지수, 오재혁. (2020). 담화표지 ‘아’, ‘어’, ‘음’의 성별과 연령별 사용 양상, 말소리와 음성과학, 12(4), 37-45.
DOI : 10.13064/KSSS.2020.12.4.037
Won Ik Cho Sangwhan Moon, Youngsook Song(2020), "Open Korean corpora: A practical report," in Proc, NLP-OSS, EMNLP Workshop, Nov. 2020, pp. 85–93.
DOI : 10.18653/v1/2020.nlposs-1.12
과제
2020년 5월 - 2020년 9월 문화체육관광부 국립국어원, 말뭉치 함의 분석 및 연구, 보조원
기타
컨퍼런스 2021Langcon 개최(Organizer) URL: https://songys.github.io/2020LangconOnOff/