정호영 |
Data / Analytics Intern Candidate
정호영 |
Data / Analytics Intern Candidate
Python · SQL 기반으로 재현 가능한 분석과 ETL-to-Dashboard 결과물을 구현하는 지원자입니다.
공개데이터 EDA, SQLite 적재, Streamlit 대시보드 프로젝트를 통해 데이터 수집-정제-적재-시각화의 흐름을 직접 구성했습니다.
데이터를 분석하는 데서 끝나지 않고, 지표를 실제로 전달 가능한 형태로 만드는 것에 관심이 있습니다.
GitHub https://github.com/cxo-ca
Resume
Email 2012hy5@naver.com
LinkedIn https://www.linkedin.com/in/%ED%98%B8%EC%98%81-%EC%A0%95-26356b388
About Me
안녕하세요. 데이터 분석 인턴을 준비 중인 정호영입니다.
Python과 SQL을 기반으로 데이터를 정리하고, 의미 있는 지표를 도출한 뒤, 이를 대시보드 형태로 전달하는 작업에 관심이 있습니다. 현재는 공개데이터를 활용한 EDA 프로젝트와 SQLite 기반 미니 ETL 프로젝트를 진행하며, 분석과 데이터 파이프라인을 함께 다루는 역량을 쌓고 있습니다.
단순히 그래프를 만드는 것보다, 어떤 데이터를 어떤 구조로 쌓고 어떤 지표로 보여줄 것인지를 고민하는 작업을 지향합니다.
Featured Projects
1) 공개데이터 EDA + Dashboard
한 줄 소개
CSV/XLSX 업로드 기반 EDA와 DB 기반 KPI 시각화를 결합한 Streamlit 대시보드 프로젝트입니다.
What
공개데이터를 업로드해 기본적인 탐색적 데이터 분석을 수행하고, SQLite에 적재된 데이터가 있을 경우 출퇴근 시간대의 핵심 지표를 대시보드 형태로 확인할 수 있도록 구성했습니다. GitHub README에는 AM 07–09 / PM 17–19 평균속도 KPI와 핵심 지표 카드/차트가 명시돼 있습니다.
Tech
Python, pandas, Streamlit, SQLite, Plotly
What I did
CSV/XLSX 업로드 기반 EDA 기능 구현
출퇴근 피크 시간대 시각화 및 핵심 지표 카드 구성
DB 적재 데이터가 있을 때 KPI를 바로 확인할 수 있는 구조 설계
Why it matters
데이터 파일을 한 번 확인하는 데서 끝나지 않고, 적재된 데이터를 기반으로 지표를 지속적으로 확인할 수 있게 만들어 분석 결과의 활용성을 높였습니다. 이는 GitHub 프로필에서 강조한 'ETL-to-Dashboard 전달' 방향과도 일치합니다.
Links
GitHub: project-eda-dashboard
Demo: Streamlit 배포 링크
2) Mini ETL + SQL
한 줄 소개
일 1회 수집·정제·적재 자동화를 통해 분석용 테이블을 누적 관리하는 SQLite 기반 미니 ETL 프로젝트입니다.
What
수집한 데이터를 정제해 SQLite에 누적 적재하고, 분석 및 대시보드에서 재사용할 수 있도록 데이터 구조를 관리했습니다. GitHub 프로필과 README에는 logs_road 테이블 누적, (date, hour) 기준 업서트, APP_DB_PATH를 통한 DB 경로 통일이 명시돼 있습니다.
Tech
Python, SQLite, SQL, pandas
What I did
일 1회 수집/정제/적재 흐름 구성
(date, hour) 기준 업서트 방식으로 중복 적재 방지
대시보드가 읽는 DB 경로를 통일해 재사용 가능한 구조 설계
Why it matters
분석 프로젝트가 일회성으로 끝나지 않으려면, 데이터를 안정적으로 누적하고 같은 기준으로 다시 읽을 수 있어야 합니다. 이 프로젝트는 그런 운영 관점의 기초를 직접 구현해본 경험을 보여줍니다. 이 설명은 README에 적힌 적재 자동화, 업서트, DB 경로 통일 내용을 바탕으로 한 해석입니다.
Links
GitHub: project-etl-sql
What I Can Do
EDA: 데이터 프로파일링, 결측치/이상치 점검, 기초 통계 확인, 지표 정의
SQL Analytics: 조인, 집계, CTE, 윈도우 함수 기반 분석 쿼리 작성
Dashboard: 핵심 지표 설계, 시각화, 배포 가능한 형태의 결과물 구성
ETL: 수집, 정제, SQLite 적재, 재사용 가능한 데이터 구조 관리
Collaboration: Git/GitHub 기반 프로젝트 정리 및 결과물 문서화
Skills
Python: pandas, numpy, scikit-learn
SQL: SQLite, CTE, window functions
Visualization: matplotlib, Plotly, Streamlit
Tools: Git, GitHub
Contact & Links
Email: 2012hy5@naver.com
GitHub: cxo-ca
Portfolio: Google Sites
LinkedIn: 프로필 링크
Resume: PDF 첨부 권장