Search this site
Embedded Files
Gilseung Ahn's Page

안길승 (Gilseung Ahn)

E-mail: ahn.kilseung@gmail.com

stackoverflow: https://stackoverflow.com/users/13176896/gilseung-ahn 

Google Scholar: https://scholar.google.co.kr/citations?hl=ko&user=b9MYvLEAAAAJ

Blog:  https://gils-lab.tistory.com/

핵심 역량

  • 데이터 기반의 문제 해결 역량

    • 고객과의 커뮤니케이션을 통한 문제 정의 및 수립 경험 다수

    • 산업공학 박사로서 머신러닝, 수리 최적화, 통계 분석 등에 대한 깊은 수학적 이해 보유 (국내외 저널 40편 이상 출간 경험)

    • 머신러닝, 딥러닝, 수리 최적화, 통계 분석 등을 통한 실제 문제 해결 경험 다수

    • 데이터 분석 과제 기획 및 리딩 경험 보유


  • 데이터 전처리 및 모델링을 위한 프로그래밍 역량

    • 파이썬을 활용한 고급 데이터 전처리 및 모델링 가능

    • 데이터 분석을 위한 파이썬 기반의 모듈/패키지 및 GUI 개발 가능

    • PySpark를 이용한 대용량 데이터 분석 가능


  • 데이터 분석 및 인사이트 도출 역량

    • 시각화, 대시보드 구축, 통계 분석 등을 통한 인사이트 도출 

    • A/B 테스트 설계 및 실행을 통한 의사결정 지원 


  • 강의 및 컨설팅 역량

    • 온/오프라인 기업 출강 및 B2C 강의 경험 다수 (평균 평점 4점 이상)

    • 현업 분석 지원 경험 다수

    • 사내 부트캠프 멘토 및 강사 (최고 평점)

    • 주니어 데이터 사이언티스트 교육 및 관리 


경력 사항

  • 2024.04.01 - 현재: Moloco  

    • 직무: Applied Research Scientist (T4)

    • 주요 업무 1. IEC/Playable 렌더링 에러 파악 및 개선을 위한 데이터 분석

      • 렌더링 에러 정의 수립 및 현황 파악을 위한 대시보드 구축

      • 렌더링 에러와 퍼포먼스 간 상관관계 분석

      • 렌더링 에러 발생 조건 탐색을 통한 에러 발생률 감소 방안 도출

      • IEC/Playable 관련 ad-hoc 분석 지원

    • 주요 업무 2. 실험 설계 및 분석

      • FB Playable assets에 대한 클릭 전략 실험 설계 및 분석

    • 주요 업무 3. Premium Inventory 분석

      • Resolution 등의 이유로 X(구 트위터)에 bidding 되지 못한 캠페인 비율 확인

      • Funnel 분석을 통한 비딩 기회 탐색

      • 광고 소재 비율에 따른 성능 비교 분석을 통한 캠페인 운영 전략 수립


  • 2021.03.02 - 2024.03.29 (3년 1개월): 현대자동차

    • 직무: 데이터사이언티스트

    • 주요 업무 1. 차량 개발을 위한 데이터 분석 알고리즘 개발

      • 대표 프로파일 추출 알고리즘

      • 빈발 시퀀스 추출 알고리즘

      • 시퀀스 매칭 알고리즘

      • 길이가 다른 시계열 간 유사도 측정 알고리즘 등

    • 주요 업무 2. 차량 데이터 검증 알고리즘 개발

      • 피크 이상 탐지 알고리즘 

      • 이상 패턴 탐지 알고리즘 등

    • 주요 업무 3. 현업 분석 요청 지원

      • 터레인모드 파라미터 최적화 알고리즘 개발

      • 감속 의지 예측 모델 개발

      • 차고 조절 시스템의 내구 조건 설정을 위한 차량 데이터 분석 등

    • 주요 업무 4. 데이터 분석 교육 

      • 주니어 DS 교육

      • 부트캠프 멘토링 및 강사


  • 2018.11 - 2020.11 (2년): 패스트캠퍼스

    • 직무: 프리랜서 강사

    • 기업 출강: 파이썬을 활용한 머신러닝 

    • 온/오프라인 교육: 파이썬을 활용한 데이터 전처리


교육 사항

  • 2015.03 - 2021.02: Hanyang University 

    • Ph.D in Industrial and Management Engineering

    • Adviser: Dr. Sun Hur

    • Thesis: Mathematical Models and Solutions for Service Scheduling and Enterprises Collaboration in Cloud Manufacturing


  • 2011.03 - 2015.02: Hanyang University 

    • B.S. in Industrial and Management Engineering

    • B.S. in Information Sociology


연구 및 저술 실적

국제 컨퍼런스 발표 실적

  1. Hyungseok Yoon, Gilseung Ahn and Sun Hur* (2022). Shapelet Selection for Efficient Time Series Classification by Dynamic Time Warping. 2022 International Conference on Engineering and Emerging Technologies.

  2. You-Jin Park, Sun Hur and Gilseung Ahn (2019). Real-Time Service Scheduling Considering Collaboration Potential in Cloud Manufacturing. The 20th Asia Pacific Industrial Engineering and Management Systems.

  3. Gilseung Ahn, Sun Hur, Doming Shin and Minwook Kim (2019). A Probabilistic Diagnose Model of Product Defect by Partially Shuffled Equipment Data. The 6th East Asia Workshop on Industrial Engineering.

  4. Gilseung Ahn and Sun Hur (2018). Multi-objective and Real-time Task Scheduling in Cloud Manufacturing with Genetic Algorithms. The 48th International Conference on Computers and Industrial Engineering. 

  5. Gilseung Ahn, Semi Park, Changwook Kang, and Sun Hur (2018). Multi-Objective Feature Selection for Early Fault Detection in sequential manufacturing Process with Genetic Algorithms. The 48th International Conference on Computers and Industrial Engineering.

  6. Gilseung Ahn, You-jin Park, and Sun Hur (2016). Hueristic scheduling algorithm for cloud manufacturing considering collaboration potentials. The 18th International Conference on Industrial Engineering. 

  7. You-jin Park, Gilseung Ahn, and Sun Hur (2016). Optimization of Pick-and-Place in Die Attach Process.  The 26th international Conference on Flexible Automation and Intelligent Manufacturing.

  8. Gilseung Ahn, You-jin Park, and Sun Hur (2016). A Probabilistic Method to Identify Collaboration Potential in Cloud Manufacturing System.  The 26th international Conference on Flexible Automation and Intelligent Manufacturing.

  9. Gilseung Ahn and Sun Hur (2015). Markov Network with Unreliable Edge. The 2nd East Asia IE Workshop on Logistics and Reliability.


국내 컨퍼런스 발표 실적

  1. 황석범, 진민기, 안길승, 허선 (2021). 의사결정나무와 유전알고리즘으로 잔존수명을 예측하기 위한 시계열 shapelet 선택방법. 한국산학기술학회 추계학술대회.

  2. 안길승, 윤형석, 허선 (2020). 잔여 수명 예측을 위한 시계열 데이터 생성 방법. 대한산업공학회 추계학술대회.

  3. 박지수, 안길승, 허선 (2019). 데이터 클래스 불균형 문제에서 GAN-KNN을 이용한 오버 샘플링 방법. 대한산업공학회 추계학술대회.

  4. 안길승, 허선 (2019). 빠른 시계열 분류를 위한 다목적 특징 선택 문제와 유전 알고리즘 기반의 해법. 대한산업공학회 춘계공동학술대회.

  5. 박명환, 안길승, 허선 (2018). A3C 심층강화학습을 이용한 다수의 의존적 창고 재고관리 스케줄링. 대한산업공학회 추계공동학술대회.

  6. 안길승, 박명환, 허선 (2018). Reinforcement Learning Model for Pick-and-Place in Die-attach Process Optimization. 대한산업공학회 추계공동학술대회.

  7. 박세미, 안길승, 강창욱, 허선 (2018). 다목적 특징 선택을 통한 반도체 제조 공정에서의 불량 탐지 방안. 대한산업공학회 춘계공동학술대회. 

  8. 안길승, 서민지, 허선 (2018). 텍스트 분류 문제에서 특징 간 상호 작용을 고려한 특징 선택 기법. 대한산업공학회 춘계공동학술대회. 

  9. 안길승, 허선 (2017). 불균형 시계열 데이터 분류에서의 군집 기반 언더샘플링 방법. 한국 BI 데이터마이닝학회 추계학술대회. 

  10. 안길승, 이환철, 허선 (2017). 다변량 시계열 데이터 분류를 위한 특징 선택 알고리즘. 대한산업공학회 춘계공동학술대회. 

  11. 안길승, 허선 (2017).  클라우드 제조에서의 다중 구성 형태를 고려한 QoS 기반의 서비스 구성 문제. 대한산업공학회 추계학술대회.

  12. 서민지, 안길승, 허선 (2017). 클래스 불균형 문제가 있는 텍스트 데이터를 분류하기 위한 상호정보량 기반 특징 선택 기법. 대한산업공학회 춘계공동학술대회.

  13. 안길승, 서민지, 허선 (2016). 효율적인 연구개발 동향 분석을 위한 논문 초록에서의 핵심 문장 추출 방법론. 대한산업공학회 추계학술대회.

  14. 안길승, 박유진, 공원영, 허선 (2016). 불균형 데이터에서의 확률 기반 언더샘플링 기법. 대한산업공학회 춘계공동학술대회.

  15. 안길승, 박성환, 안선응, 허선 (2016). 클라우드 제조에서의 시스템 관리 비용을 고려한 기업 네트워크 구성. 대한산업공학회 춘계공동학술대회.

  16. 안길승, 허선 (2016). 클라우드 제조에서의 협업 성능 평가 모형. 대한산업공학회 춘계공동학술대회.

  17. 안길승, 권민성, 강창욱, 허선 (2015). Conditional Random Fields를 이용한 소프트웨어 프로젝트 리스크 예측 방법론. 한국프로젝트경영학회 추계학술대회.

  18. 안길승, 인성권, 허선 (2015). 확률 그래프 모형을 이용한 트랜잭션 데이터 분석 방법론. 산업경영시스템학회 추계학술대회.

  19. 안길승, 조근호, 고예나, 권기복, 허선 (2015). SO-PMI와 마코프 논리 네트워크를 이용한 문장 감성 평가. 대한산업공학회 춘계공동학술대회.

  20. 안길승, 허선 (2015). C-CRF를 이용한 복합화력발전소의 발전량 예측. 대한산업공학회 춘계공동학술대회.

  21. 안길승, 허선 (2014). 연관 규칙을 이용한 마코프 논리 네트워크에서의 1차 논리 규칙 생성 및 가중치 학습 방법. 대한산업공학회 추계학술대회.


국제 저널 출간 실적

  1. Gilseung Ahn, Minki Jin, Seokbum Hwang, and Sun Hur* (2022). Shapelet Selection based on a Genetic Algorithm for Remaining Useful Life Prediction with Supervised Learning, Heliyon. 8(12), e12111.

  2. Gilseung Ahn, Hyungseok Yoon, Sun Hur, Si-Yeong Lim* (2021). A Time-series Data Generation Method to Predict Remaining Useful Life. Processes. 9(7), 1115.

  3. Gilseung Ahn, You-jin Park, and Sun Hur* (2021). A Membership Probability Based Undersampling Algorithm for Imbalanced Data. Journal of Classification. 38, 2 - 15.

  4. Gilseung Ahn and Sun Hur* (2021). Multiojective Real-time Scheduling of Tasks in Cloud Manufacturing with Genetic Algorithms. Mathematical Problems in Engineering. Article ID: 1305849.

  5. Gilseung Ahn, Hwanchul Lee, Jisu Park and Sun Hur* (2020).  Development of Indicator of Data Sufficiency for Feature-based Early Time Series Classification with Applications of Bearing Fault Diagnosis. Processes. 8(7), 790.

  6. Gilseung Ahn and Sun Hur* (2020).  Dynamic Estimation Model for Collaboration Potential in Cloud Manufacturing. Industrial Engineering & Management Systems. 19(2), 301 - 307.

  7. Gilseung Ahn, Sun Hur*, and Myung-Chul Jung (2020). Bayesian network model to diagnose WMSDs with working characteristics. International Journal of Occupational Safety and Ergonomics. 26(2), 336 - 347.

  8. Gilseung Ahn and Sun Hur* (2020). Efficient Genetic Algorithm for Feature Selection to Early Classify Time Series. Computers & Industrial Engineering. 142, Article ID: 106345.

  9. Gilseung Ahn and Sun Hur* (2020). Clustering and Dispatching Rule Selection Framework for Batch Scheduling. Mathematics. 8(1), 80.

  10. Gilseung Ahn, Sun Hur*, Dongmin Shin and You-Jin Park (2019). A Graphical Model to Diagnose Product Defects with Partially Shuffled Equipment Data. Processes. 7, 934.

  11. Gilseung Ahn, Myunghwan Park, You-Jin Park, and Sun Hur* (2019). Interactive Q-learning Approach for Pick-and-Place Optimization of Die Attach Process in Semiconductor Industry. Mathematical Problems in Engineering. Article ID: 4602052.

  12. Gilseung Ahn, You-jin Park, and Sun Hur* (2019). Performance computation methods for composition of tasks with multiple patterns in cloud manufacturing. International Journal of Production Research. 57(2), 517 - 530.

  13. You-Jin Park*, Gilseung Ahn, and Sun Hur (2018). Optimization of Pick-and-Place in Die Attach Process using a Genetic Algorithm. Applied Soft Computing. 68, 856 - 865.

  14. Gilseung Ahn, Minsung Kwon, Changwook Kang, and Sun Hur* (2018). Probabilistic Graphical Framework for Predicting Software Project Risk. Industrial Engineering & Management Systems. 17(1), 120 - 127.

  15. Gilseung Ahn, You-jin Park, and Sun Hur* (2017). Probabilistic Graphical Framework for Estimating Collaboration Levels in Cloud Manufacturing. Sustainability. 9(2), 277.

  16. Gilseung Ahn, You-jin Park, and Sun Hur* (2016). The Dynamic Enterprise Network Composition Algorithm for Efficient Operation in Cloud Manufacturing. Sustainability. 8(12), 1239.

  17. Gilseung Ahn and Sun Hur* (2016). Markov Network Model with Unreliable Edge. International Journal of Industrial Engineering: Theory, Applications and Practice. 23(3), 174-182.

  18. Gilseung Ahn and Sun Hur* (2016). Continuous Conditional Random Field Model for Predicting the Electrical Load of a Combined Cycle Power Plant. Industrial Engineering & Management Systems. 15(2), 148 - 155.


국내 저널 출간 실적

  1. 류서현, 이다경, 안길승, 허선 (2023). 시계열 데이터의 자동기계학습을 위한 메타 모델 기반의 특징 선택 방법. 대한산업공학회지, 49(1), 15-27.

  2. 박지수, 안길승, 허선* (2020). 클래스 불균형 데이터의 효과적인 분류를 위한 k-NN과 생성적 적대 신경망 기반의 오버 샘플링. 대한산업공학회지. 46(4), 365 - 371.

  3. 서민지, 안길승, 허선* (2019). 클래스 불균형 문제가 있는 다중 클래스 텍스트 분류에서의 상호 정보량 기반 특징 선택 방법. 대한산업공학회지. 45(2), 93 - 100.

  4. 안길승, 이환철, 허선* (2017).  다변량 시계열 데이터 분류를 위한 특징 선택 방법. 대한산업공학회지. 43(6), 413 - 421.

  5. 안길승, 허선* (2017).  클라우드 제조의 연구동향 분석: 운영 과정을 중심으로. 대한산업공학회지. 43(6), 422 - 434.

  6. 안길승, 서민지, 허선* (2017). 효과적인 산업재해 분석을 위한 텍스트마이닝 기반의 사고 분류 모형과 온톨로지 개발. 한국안전학회지. 32(5), 179 - 185.

  7. 안길승, 서민지, 허선, 박유진* (2016). 신경망을 이용한 SNS상에서의 정보확산 예측모형: Digg 사례를 중심으로. 정보화연구. 13(4), 609 - 616.

  8. 안길승, 권민성, 강창욱, 허선* (2016). 소셜 네트워크 서비스 기반의 4세대 지식관리시스템 설계 방안. 정보과학회논문지. 43(5), 579 - 589.

  9. 안길승, 허선* (2016). 트랜잭션 데이터 분석을 위한 확률 그래프 모형. 대한산업공학회지, 42(4), 249-256.

  10. 안길승, 허선* (2015). 회귀나무 분석을 이용한 C-CRF의 특징함수 구성 방법. 대한산업공학회지. 41(4), 338 - 343.

  11. 안길승, 허선* (2015). 연관분석을 이용한 마코프 논리네트워크의 1차 논리 공식 생성과 가중치 학습방법. 산업경영시스템학회지. 38(1), 74 - 82.

  12. 안길승, 허선* (2015). Continuous Conditional Random Field에 의한 인터넷 쇼핑몰 신규 고객등급 예측. 대한산업공학회지. 41(1), 10 - 16.


책 출간 실적

  1. 파이썬을 활용한 머신러닝 자동화 시스템 구축: 실무자를 위한 머신러닝 핵심 개념, 모델 선택 및 하이퍼 파라미터 튜닝, 최적화 기법, 위키북스, 2022. 08.

  2. 손에 잡히는 퀀트 투자 with 파이썬: 파이썬을 활용한 금융 데이터 분석과 퀀트 투자 전략 검증, 위키북스, 2022. 02. (2022 세종도서 선정작)


프로젝트

Moloco (2024. 04 ~ )


현대자동차 (2021.03 ~ 2024. 03)


1. VCRM 데이터를 활용한 인젝터 예방정비 모델 개발 (2021.03.22 - 2022.01.28: 10개월)

  • 과제 목적: 비지도 학습 기반의 인젝터의 이상 탐지 방법론 개발 및 검증

  • 주요 수행 내용 (1) 특징 공학

      • 인젝터 관련 시그널 정의 

      • 유휴 시그널 필터링 방법 개발

      • 도메인 전문가와의 협업을 통한 특징 정의

      • PySpark를 이용한 트립 단위 데이터 요약 

  • 주요 수행 내용 (2) 이상 탐지 알고리즘 적용 및 비교

      • 관련 알고리즘: Isolation Forest, Local Outlier Factor, Autoencoder 등

      • 알고리즘별 이상치 판단 기준 확인

      • 모든 알고리즘이 이상치라 판단한 트립을 이상치라 간주

  • 주요 수행 내용 (3) 분석 결과 정리 및 공유

      • DTC와 이상 탐지 결과와 비교

      • 시험차를 활용한 모델 검증 및 서비스화 논의

  • 획득 역량 

      • 도메인 전문가와의 협업 / 커뮤니케이션 역량 

      • 대용량 데이터 처리 및 이상 탐지 수행 경험



2. VCRM 수집 데이터 시각화 자동화 및 상담 센터 시스템 연계 (2021.05.10 ~ 2021.12.31: 7개월)

  • 과제 목적: 실시간 차량 모니터링을 위한 시그널 요약 방법 개발

  • 주요 수행 내용 (1) 시그널 요약 방법 개발

      • 시그널 특성에 따른 분류 체계 구축: 상수형, 범주형, 참조형, 일반 연속형 등

      • 범주화를 했을 때와 하지 않았을 때의 군집 결과를 바탕으로 시그널 유형에 따른 범주화 방법 개발

  • 주요 수행 내용 (2) 시그널별 차량 군집화를 통한 시그널의 정상 분포 추정 방법 개발

      • 주요 군집에 속하는 시그널의 분포를 정상 분포로 간주

      • 정상 분포에 속하지 못하는 시그널을 갖는 차량을 별도로 관리

  • 주요 수행 내용 (3) 모니터링 시스템 구축을 위한 코드 가이드라인 개발

      • 배치 시스템 이관을 위한 코드 가이드라인 개발

      • 코드 매뉴얼 배포 및 공유회 수행

  • 획득 역량 

      • 시계열 분포 추정 경험

      • 대용량 데이터 처리 경험

  • 주요 성과

      • 차량 데이터 수집에 관한 법적 근거 확보

      • 차량 데이터 요약을 통한 실시간 주행 패턴 파악 가능


3. 터레인 모드 파라미터 최적 알고리즘 개발 (2022. 01. 03 ~ 2023. 05. 13: 1년 4개월)

  • 과제 목적:  터레인 모드에서의 파라미터 맵 튜닝 방법 개발을 통한 시험 평가 공수 절감

  • 주요 수행 내용 (1) 차량 파라미터 데이터 전처리 

      • DCM 파일을 DataFrame으로 변환

      • 기어비, 토크 팩터 등을 활용하여 토크맵을 휠 토크맵으로 변환

  • 주요 수행 내용 (2) 이니셜 캘 예측 모델링

      • 커브 피팅 및 커브 파라미터 예측으로 구성된 알고리즘 설계 및 개발

      • 이니셜 캘 예측 모델링 알고리즘 파이썬 라이브러리화

      • 스웨덴 현지 출장 시험을 통한 알고리즘 검증

  • 주요 수행 내용 (3) 캘리브레이션 알고리즘 설계 및 개발

      • 시험 평가 데이터 기반의 최적화 알고리즘 개발

      • 경험 기반의 방법과의 비교 검증

  • 주요 수행 내용 (4) 툴킷 개발

      • 파라미터 맵 튜닝을 위한 파이썬 패키지 개발 (데이터 전처리, 모델 학습 등)

      • 현업 사용자를 위한 GUI 툴킷 개발 및 exe 배포 (wxpython)

  • 획득 역량 

      • 맵, 행렬 형태의 파라미터 튜닝을 위한 모델 기반의 파라미터 튜닝 알고리즘 개발 역량

      • 파이썬 기반의 GUI 툴킷 개발 및 배포 경험

  • 주요 성과

      • 터레인모드의 차량 시험 평가에 대한 man-month 감소: 차종당 소요 시간 기존 48hr -> 16hr

      • 교육 및 매뉴얼 개발을 통한 과제 이관 


4. 감속의지 예측 모델 및 EV모드 증대를 위한 VCRM 데이터 분석 (2022. 01. 03 ~ 2022. 12. 31: 11개월)

  • 과제 목적: 하이브리드 차량의 근미래 (5초후)의 감속의지를 예측함으로써 불필요한 엔진 기동 및 정지를 방지

  • 주요 수행 내용 (1)  제어기 적재를 위한 경량 모델 학습 알고리즘 개발

      • EDA를 통한 모드 변환에 영향을 주는 요인 탐색 및 모델링이 필요한 케이스 정의

      • PySpark 기반의 결정 나무 모델링

  • 주요 수행 내용 (2) 제어기 적재를 위한 알고리즘 변환

      • PySpark로 학습한 결정 나무를 C언어로 변환하여 제어기에 적재

  • 획득 역량 

      • 문제 정의 역량: 불필요한 엔진 기동 및 정지 상황을 근미래 가속도 예측 문제로 정의함

      • PySpark를 통한 대용량 데이터 처리 및 머신러닝 모델링 역량  

  • 주요 성과

      • 불필요한 엔진 기동 및 정지 조건 탐지를 통한 연비 효율 향상 (제어기 적재)


5. 람다3 LPI 엔진오일 소모 원인 탐색 (2022. 06. 01 ~ 2022. 12. 04: 6개월)

  • 과제 목적: 람다3 LPI 차량의 엔진오일이 감소하는 현상의 원인을 파악

  • 주요 수행 내용 (1)  PySpark를 이용한 차량 데이터 요약

  • 주요 수행 내용 (2) 가설 검정 및 시각화를 이용한 문제 원인 파악

  • 주요 성과: 차량 문제 파악을 통한 개선점 확인 및 차량 데이터 분석 레퍼런스 정의

  • 획득 역량: 시계열 데이터를 통한 가설 수립 및 검정 프로세스 수립 역량


6. 데이터 검증 프레임워크 개발 (2023. 03. 01 ~ 현재 )

  • 과제 목적: 기수집 및 수집하고 있는 데이터에 정합성이 부족한 데이터가 많아, 주기적으로 수집중인 차량 데이터의 정합성 검증을 위한 프레임워크 개발

  • 주요 수행 내용: (1) 시그널 유형화 및 유형별 이상치 탐지를 위한 로직 개발과 PySpark 기반의 적용

  • 주요 수행 내용: (2) 신규 차종의 모든 시그널에 대한 검증 수행


7. DTE 검증과 예측 및 표출 방법 개발  (2023. 03. 01 ~ 현재 )

  • 과제 목적: 현재 클러스터에 표출되는 DTE의 정합성을 검토하고 적절한 DTE 예측 및 표출 방법 개발

  • 주요 수행 내용: (1) 검증 로직 개발 및 PySpark를 이용한 로직 적용

    • 트립별 DTE와 마일리지 간 차이 계산

    • DTE 변동이 큰 트립 등 비정상적인 트립 추출

  • 주요 수행 내용 (2) 차종별 전비맵 업데이트

    • 전비맵 추출을 위한 PySpark 코드 개발 및 배치 수행

    • 주기적으로 유관 부문에 추출한 전비맵 전달 및 수정


8. 차고 조절 시스템의 내구 설정을 위한 차량 데이터 분석 (2023. 03. 01 ~ 2023. 11. 01)

  • 과제 목적: 차고 조절 시스템의 내구 조건 설정을 위한 필드 차량 데이터 분석

  • 주요 수행 내용: (1) 차고 조절 로직 구현

    • PySpark를 이용한 차고 조절 로직 구현

    • 로직 적용 순서 및 빈도 추출

  • 주요 수행 내용 (2) 대표 시퀀스 추출

    • duration을 포함하는 빈발 부분 시퀀스 추출 알고리즘 개발

    • 개발한 알고리즘을 활용한 대표 차고 조절 패턴 추출 및 전달

  • 주요 성과: 내구 조건 설정 및 차량 시험 조건 정의


한양대학교 (2015.03 ~ 2021.02)

  1. AI 데이터 가공 바우처 사업, 과학기술정보통신부 & 씨앤비스, 2019. 08 ~ 2019.12 (4개월)

    • 목적: 14개의 중소기업이 가지고 있는 데이터를 활용하여 불량 판별, 수요 예측 등의 다양한 소규모 과제 수행

    • 역할: 데이터 분석 위원 (통계분석, 머신러닝 시스템 개발, 완료 보고서 작성)

  2. 상담 ASSIST HTML 파서 개발 및 적용, KT & KTH, 2019. 10 ~ 2019. 12 (2개월)

    • 목적:  KT의 상담 효율화를 위한 상담 참고 스크립트 분할

    • 역할: 책임 (파이썬 기반의 HTML 파서 개발)

  3. 온라인 프로그래밍: 업무생산성 및 자동화 콘텐츠 개발, 한국생산성본부 & 이노코딩. 2019. 09. (1개월)

    • 목적: 파이썬을 활용한 업무 자동화 온라인 강의 환경 구축 및 촬영

    • 역할: 내용 전문가 (강의 촬영, 스크립트 작성)

  4. K쇼핑 방송편성 자동화를 위한 인공지능 시스템 개발, KTH, 2019. 02 ~ 2019. 03 (2개월)

    • 목적: 홈쇼핑의 매출 예측을 통한 방송편성 자동화

    • 역할: 책임 (환경 조건 등에 따른 홈쇼핑 매출 예측 시스템 개발, 방송 추천 시스템 개발, 완료 보고서 작성)

  5. AI 알고리즘 적용 결과에 따른 설비 원인 분석 및 설비 제어 신호 개발과 실증사례 구현, 명화공업. 2019. 01 ~ 2019. 12 (1년)

    • 목적: 설비의 비가동 원인 판별 및 비가동 시점 예측 시스템 개발

    • 역할: 실무 책임 (제안서 작성, 파이썬을 활용한 시계열 데이터 전처리 모듈 및 딥러닝 기반의 비가동 시점 예측 모델 개발)

  6. 안전클레임 조기 검출을 위한 텍스트마이닝 툴 개발 (실무 책임). 현대자동차. 2018. 02 ~ 2018. 12 (10개월)

    • 목적: 자동차 분야의 클레임을 안전관련 클레임 혹은 비안전관련 클레임으로 분류하는 시스템 개발

    • 역할: 실무 책임 (제안서 작성, 파이썬을 활용한 텍스트 전처리 모듈 및 클레임 분류 시스템 개발)



패스트캠퍼스 (2018.09 ~ 2021.01)

상세 강의 이력

  1. Data Scientist 심화 과정 3기,  신한카드, 2020. 11 ~ 2020. 12.

  2. 데이터 분석 준전문가 양성 과정 (기초 수학, 데이터 전처리), 현대모비스, 2020. 08 ~ 2020. 09.

  3. 파이썬을 활용한 데이터 전처리 Level UP,  패스트캠퍼스 온라인 강의, 2020.08 ~ 2022.10.

  4. Data Scientist 과정 - 파이썬을 활용한 머신러닝, LG전자, 2020. 08.

  5. 디지털 유니버시티 빅데이터 과정, 하나카드, 2020. 06 ~ 2020. 07.

  6. AI Engineer 양성 과정, 한라인재개발원, 2020. 06.

  7. Data Scientist 과정 - 파이썬을 활용한 머신러닝, LG전자, 2020. 06.

  8. 빅데이터 직무전환자 과정, LG전자, 2020. 06.

  9. 파이썬을 활용한 머신러닝 과정, 대우조선해양, 2020. 02.

  10. 데이터 분석 준전문가 양성 과정 (머신러닝,  데이터 전처리), 현대모비스, 2019. 11 ~ 2019. 12.

  11. Data Scientist 과정 - 파이썬을 활용한 머신러닝, LG전자, 2019. 11.

  12. 빅데이터 전문가 과정, 미래에셋생명, 2019. 10 ~ 2019. 11.

  13. [2주 완성] Data Scientist 되기 5 ~ 6기, 패스트캠퍼스 , 2019. 09.

  14. Data Scientist 심화 과정, 신한카드, 2019. 06 ~ 2019. 07.

  15. 빅데이터 전문가 과정, 미래에셋생명, 2019. 05 ~ 2019. 07.

  16. ML & Text Mining, 롯데 캐피탈, 2019. 03 ~ 2019. 04.

  17. 데이터 사이언티스트 양성 과정, 신한금융그룹, 2018. 10 ~ 2018. 11.

  18. 파이썬을 활용한 데이터 전처리 Level-up CAMP 1기 ~ 5기, 패스트캠퍼스, 2018. 09 ~ 2019. 08.

수상 이력

  1. 포스트코로나 AI 챌린지 - 모델링 부문, 최우수상 (한국정보화진흥원장상), 2020. 05.

  2. KT 인공지능 소설 공모전, 기술지원금 지급 대상자, 2018. 08.

  3. NH농협생명 아이디어 공모전, 장려상, 2018.02.

  4. 미래에셋대우 핀테크 아이디어 공모전, 우수상, 2017. 11.

  5. 경기빅데이터 활용분석 경진대회, 장려상, 2017. 10.

  6. 키움증권 빅데이터 아이디어 공모전, 장려상, 2017. 08.

  7. 문화관광 빅데이터 분석대회, 금상, 2017. 08.

  8. 제 1회 산업안전 보건분야 대학(원)생 논문 공모전, 우수상, 2017. 07.

  9. 제 1회 미래에셋대우 빅데이터 페스티벌, 대상, 2017.06.

  10. 대한산업공학회 백암논문상, 2016. 11.

  11. KB 부동산 통계 아이디어 챌린지, 우수상, 2016. 11.

  12. 행정자치부 공공 빅데이터 아이디어 공모전, 장려상, 2016. 06.

  13. 공간 빅데이터 사업 아이디어 공모전, 장려상, 2016. 02.

  14. 한국소비자원 참가격 데이터를 활용한 콘텐츠 개발 아이디어 공모전, 우수상, 2015. 12.

  15. 한국산업경영시스템학회 추계학술대회, 우수연구상, 2015. 10.

  16. 제 1회 날씨 빅데이터 콘테스트, 기상청장상, 2015. 10.

  17. 대우증권 JUMP UP 논문 경진대회, 장려상, 2015. 09.

  18. 제 1회 롯데멤버스 Bigdata competition, 금상, 2015. 03

  19. 제 12회 SAS Mining Championship, 동상, 2014. 09

  20. 한국산업경영시스템학회 대학생 프로젝트 경진대회, 대상, 2014. 09.

  21. 한국산업경영시스템학회 대학생 프로젝트 경진대회, 대상, 2014. 05.


스킬

  • Python: 머신러닝 모듈 및 최적화 모듈 고급 사용 (numpy, scipy, pandas, scikit-learn, pytorch, pyomo 등)

  • Hive, PySpark: 대용량 데이터 처리 및 머신러닝 모델링

  • SQL: Hive QL, Google BigQuery

  • Dashboard: Looker Studio

  • A/B 테스트 설계 및 분석

  • 머신러닝/딥러닝

  • 시계열 데이터 분석

  • 확률/통계 분석

  • 수리 최적화 모델링

  • 데이터 사이언스 강의 및 컨설팅

  • 데이터 사이언스 과제 기획

Google Sites
Report abuse
Google Sites
Report abuse