빅데이터 및 네트워크 분석을 활용한
과학기술분야 대학생 융복합 교육과정 추천 알고리듬 제작

2023.11.16 국립한밭대학교 빅데이터 분석 경진대회 11번째 팀, 물리조아

2023.11.22 현장에서 피켓이랑 상장 받았어요!

2023 대학(원)생 빅데이터 분석 경진대회 11 물리조아.pdf

아이디어 개요 

AI, 빅데이터, 로봇 기술의 발전을 중심으로 산업의 근본적인 변화가 일어나고 있습니다. 이러한 기술적 전환은 전문가를 육성하는 대학과 같은 교육 기관들의 구조적 변화를 촉구하고 있습니다. 예컨대, 다학제 학문의 부상으로 인한 신규창설된 융복합학과, 학생설계전공 도입 등의 변화에서 확인할 수 있습니다. 이는 변화하는 사회에 대응하는 새로운 고등교육의 교육과정 설계가 필요하다는 의미이며, 이에 빅데이터 및 네트워크 분석을 활용하여 추천 교육과정 제공을 위한 융복합교육과정 교과목 추천 알고리즘을 제작하고자 합니다.


분석 대상은 대학알리미에서 공시된 “교육과정_대학” 데이터 중, 자연과학계열에 속한 10개의 중계열, 45개의 소계열로 계층적으로 분리하여 총 1,771개의 학과에서 76,606개의 과목 데이터와,  공학계열에 속한 9개의 중계열, 47개의 소계열로 계층적으로 분리하여 총 2,535개의 학과에서 수집된 106,398건 과목 데이터입니다. 해당 데이터에 대해서 소계열별로 OpenAI 중 GPT-4를 활용하여 각 과목의 명칭과 과목 소개에 기반하여 일정한 길이의 벡터로 임베딩합니다. 이후 위 벡터들을 네트워크 과학 방법론과 통계물리학 및 사회물리학의 이론을 접목하여, 교육과정의 구조적 및 네트워크 특성을 도출하고, 빅데이터 분석방법에 기반한 과목 유사도에 따른 가중치 보정 및 “대졸자직업 이동경로조사(GOMS)”의 데이터를 기반으로 학제간 융합 빈도 및 산업동향, 그리고 고부가가치산업을 수요를 반영합니다. 


최종적으로 제시한 알고리즘을 통하여 현 산업의 동향과 고부가가치산업의 수요를 반영한, 차세대 고등교육과정의 이론적 근거와 방안을 제공하고자 합니다.

아이디어 설명 

4차산업혁명에 따른 산업 구조 변화 및 사회변화는 고등교육에도 영향을 미쳤습니다. 일례로, 고등교육기관은 단일 분야에 국한되지 않는 전문가를 육성하기 위해 융·복합학과를 신설하고, 학생설계전공을 도입하여 학생 스스로 교육과정을 구성하여 시대의 변화에 유연하게 대응하는 등의 노력을 가하고 있습니다. 이러한 상황에서 융복합학과 및 학생설계전공의 교육과정 구성에 데이터에 기반하여 추천안을 제시하는 알고리즘을 제작하는것이 목적입니다. 








 제시한 알고리즘을 토대로 제작된 과목구성조합은, 고등교육기관이 새로운 교육과정을 설계하거나 개편할 시 참고자료로 활용 수 있을 것이라 생각합니다. 초기 단계에서는 행정적으로 단일전공 융복합교육과정 과목 선정에 초점을 맞추지만, 후에 과목 수와 조합을 조절하여 복수전공 교육과정, 부전공 교육과정 혹은 마이크로디그리 교육과정 등으로 확장될 예정입니다. 또한 과학기술분야를 넘어서 인문사회계열도 확장할 예정입니다. 최종 결과로 도출되는 알고리즘은 교육기관 뿐만 아니라 학생들이 자신의 학습경로를 설정하거나 학생주도전공 설계, 진로 설계에 있어서 선택의 기준으로 활용할 수 있을것이라 기대합니다.

성과 도출 과정 

1. 데이터 수집 및 구조화: "대학알리미"의 “교육과정_대학” 데이터를, 표준분류 기준을 활용하여 각 학과의 교육과정 데이터를 계층적으로 분리합니다.


2. 데이터 전처리:


3. 임베딩과 유사과목 coarse graining 


4. 통계물리, 네트워크 과학 기반 임베딩


5. 알고리즘 제작 및 보정

5-1 알고리즘의 대략적인 설계방안

5-1-1 임베딩 및 과목선택:

입력: 다수의 키워드, 산업 혹은 학과정보

처리: GPT-4 기반의 임베딩을 사용하여 각 키워드를 일정 길이의 벡터로 변환

출력: 변환된 벡터에 기반하여 가장 부합하는 과목들


5-1-2 핵심 교육과정 탐색:

입력: 선택된 과목들의 클러스터

처리: 높은 centrality 혹은 k-shell을 갖는 기초교양 및 기초전공과목 선정 및 키워드에 해당하는 과목들 간의 최단경로 탐색

출력: 핵심 교육과정 및 최단경로

5-1-3 최적화 조합 탐색:

입력: 유의미한 최단경로 및 키워드별 과목 리스트

처리: 유사도를 최대화하는 40-50개의 과목 조합 탐색 (유전 알고리즘 기반)

출력: 최적의 과목 조합


5-2 알고리즘 보정

5-2-1 기존 교육과정투사 네트워크 기반 보정:

k-core analysis: 핵심교과목 파악 및 가중치 조절을 위해 k-core 정보 활용

교육과정 투사 네트워크: 기존 단일 교육과정 및 계열별 교육과정의 유사도에 따른 가중치 부여

5-2-2 산업 연계 데이터 기반 보정:

대졸자직업 이동경로조사(GOMS) 분석: "대졸자직업 이동경로조사(GOMS)"의 최근 5년 각 산업과 직군 데이터를 활용하여 보정 가중치 설정

전공여부(복수전공, 부전공), 직군, 산업과 전공일치도, 전공지식 활용도 반영


5-2-3 전문가 피드백을 통한 보정:

융합분야 재직자 및 전문가 그리고 교육종사자들로부터 받은 피드백을 기반으로 알고리즘 결과인 교육과정 방향성 및 과목조합을 지속적으로 수정 및 보완


6. (추가)임베딩된 교육과정 벡터과 알고리즘을 통하여 제시된 교육과정에 대한 시각화