2025Conference/Symposium/Workshop ProceedingsKIVI 기반 KV Cache 양자화의 Latency 분석 및 Layer Mixed Precision 개선 방안류태준, 유용승, 김동현, 박영준한국컴퓨터종합학술대회(KCC), 2025.07, 우수논문상Journal/Magazine Articles2024Conference/Symposium/Workshop Proceedings다중 GPU 시스템에서의 빠른 거대 언어 모델 (LLM) 추론을 위한 혼합 정수 계획법 기반 스케줄링 전략남궁석, 박태형, 정기웅, 김진영, 박영준한국컴퓨터종합학술대회(KCC), 2024.06Journal/Magazine ArticlesEfficient Scheduling for Inference of Complex Neural Network Models on Multi-GPU Systems (web, paper)정선욱, 이성주, 강범우, 박영준The Transactions of the Korea Information Processing Society, 13(11), 2024.11(정보처리학회 논문지 제13권 제11호(2024. 11))2023Conference/Symposium/Workshop Proceedings그래프 분할을 통한 딥러닝 모델의 최대 메모리 사용량 최적화 연구김현철, 김민우, 원준호, 남궁석, 박영준한국소프트웨어종합학술대회(KSC), 2023.12해석가능한 기계학습 기반 주요 플래그쌍 식별을 통한 오토튜너의 성능 향상 기법 연구최유철, 박영준한국소프트웨어종합학술대회(KSC), 2023.12NPU에서 심층 강화학습 기반 효율적인 레이어 퓨전 탐색 기법이영현, 김혜준, 유용승, 조명진, 서지원, 박영준, 우수발표논문상한국소프트웨어종합학술대회(KSC), 2023.12NPU를 위한 효율적인 Fused Convolution 스케줄링 기법이영현, 김혜준, 유용승, 조명진, 서지원, 박영준대한전자공학회 추계학술대회(IEIE), 2023,11초해상도를 위한 주파수 활용 다중 비트 양자화박재민, 박영준대한전자공학회 추계학술대회(IEIE), 2023,11최적 동작 주파수 탐색을 통한 2D-SIMD 전력 효율 최적화임기엽, 강석원, 엄홍준, 함종현, 김동현, 박영준대한전자공학회 하계학술대회(IEIE), 2023,06이기종 임베디드 디바이스 간 정보 공유를 통한 Zero-shot Recognition이민수 이인호 박영준한국컴퓨터종합학술대회(KCC), 2023.06, 우수발표논문상Journal/Magazine Articles2022Conference/Symposium/Workshop ProceedingsPIM 디바이스 대상 효율적인 GEMM 구현 및 분석김태훈 박태형 박영준한국소프트웨어종합학술대회(KSC), 2022.12다중 정밀도 지원 인공지능 가속기 시스템 구축 및 성능 분석이석호 이영현 박영준한국소프트웨어종합학술대회(KSC), 2022.12임베디드 디바이스의 이종 연산 장치를 활용한 협력 추론 분석이성주 원준호 박영준한국소프트웨어종합학술대회(KSC), 2022.12딥러닝 모델 파티션 자동화 및 최적화 기법원준호 이성주 박영준한국소프트웨어종합학술대회(KSC), 2022.12다중 GPU 시스템에서의 동적 워크로드 분배와 디바이스별 최적화를 위한 프레임워크김진영 황인용 박태형 박영준한국소프트웨어종합학술대회(KSC) 2022.12효과적인 차량 및 번호판 인식을 위한 이미지 분할 전략 탐색김용성 이희준 정선욱 박영준한국소프트웨어종합학술대회(KSC), 2022.12, 학부생 부문 최우수상그룹화를 통한 이종 시스템에서의 희소 행렬 곱셈 가속화박태형 박영준한국컴퓨터종합학술대회(KCC), 2022.06다중GPU 시스템에서의 복잡한 딥러닝 모델의 고성능 추론을 위한 스케줄링 전략 분석정선욱 이성주 강범우 오태욱 박영준한국컴퓨터종합학술대회(KCC), 2022.06, 우수논문상효율적인 연산 처리를 위한 RISC-V 기반 벡터 명령어 제안 및 컴파일러 지원 방법 연구 함종현 강석원 손영빈 엄홍준 이석호 임기엽 김동현 박영준 대한전자공학회 하계학술대회(IEIE), 2022.06Journal/Magazine Articles2021Conference/Symposium/Workshop ProceedingsFPGA에서의 HLS기반 NPU 하드웨어 자원 최적화김규진 이석호 엄홍준 박영준한국소프트웨어종합학술대회(KSC), 2021.12TVM을 활용한 딥러닝 모델 그래프 파티션원준호 정선욱 박영준한국소프트웨어종합학술대회(KSC), 2021.12, 학부생 부문 우수상RISC-V 환경에서의 GCC/LLVM-Clang 성능 비교손영빈,이석호,강석원,박영준한국컴퓨터종합학술대회(KCC), 2021.06이종 구조 기반 모바일 시스템에서의 신경망 계층 분배를 통한 추론 성능 최적화 연구강범우, 최경환, 박영준한국컴퓨터종합학술대회 (KCC), 2021.06Journal/Magazine Articles2020Conference/Symposium/Workshop ProceedingsNNStreamer를 이용한 실시간 동영상 기반 객체 인식 시스템 설계이성주, 최예찬, 박영준한국소프트웨어종합학술대회(KSC), 2020.12Loop Unrolling 을 통한 GPU 에서의 희소 행렬 곱셈 가속화박태형, 이정명, 박영준 한국소프트웨어종합학술대회(KSC), 2020.12, 학부생 부문 우수상모바일 GPU 대상 커널 특화 런타임 DVFS 시스템이새한, 박영준한국컴퓨터종합학술대회(KCC), 2020,07이종 시스템에서의 효율적인 추론을 위한 성능 기반 배치 분배 기법 연구이성주, 최경환, 박영준한국컴퓨터종합학술대회(KCC), 2020.07 뉴럴 네트워크 채널 Pruning을 통한 Inference 성능 변화 분석 및 최적화최경환, 박영준한국컴퓨터종합학술대회(KCC), 2020.7Journal/Magazine Articles2019Conference/Symposium/Workshop Proceedings희소 행렬 간 곱셈에서 중간 결과 합산 방식들의 성능 분석권혁무, 장명환, 김상욱, 박영준 한국소프트웨어종합학술대회(KSC), 2019.12데이터 크기에 따른 GPU 기반 쓰레드 블록 할당 제한 방법의 자원 효율성 변화 분석유용승, 강석원, 박영준한국소프트웨어종합학술대회(KSC), 2019.12GPU 기반 외적방식 희소행렬 곱셈의 최적화 방안이정명, 박영준한국소프트웨어종합학술대회(KSC), 2019.12, 우수논문상BNN 하드웨어 가속기의 계산 자원 추가에 따른 속도향상 분석이양기, 엄홍준, 박영준한국소프트웨어종합학술대회(KSC), 2019.12cuBLAS와의 성능 비교를 통한 CUTLASS의 딥러닝 활용성 분석류기하, 박영준한국소프트웨어종합학술대회(KSC), 2019.12동시에 실행되는 CTA수에 따른 성능 변화를 고려한 새로운 CTA 할당 방식을 통한 GPU의 성능 향상 기법이기택, 조경민, 강석원, 박영준한국소프트웨어종합학술대회(KSC), 2019.12OpenCL 커널의 메모리 인스트럭션 재배치 자동화 알고리즘이승재, 정두진, 김지은, 김시완, 유용승, 박영준한국소프트웨어종합학술대회(KSC), 2019.12GPU 가속을 이용한 뉴럴네트워크 기반 홍채인식 시스템정선욱, 김민섭, 이종욱, 이인호, 박영준한국소프트웨어종합학술대회(KSC), 2019.12소형 신경망의 계층별 확장에 따른 정확도 변화 분석류기하, 박영준대한임베디드공학회 추계학술대회, 2019. 11Journal/Magazine Articles플래시 저장장치에서의 쓰기 증폭 모델에 대한 고찰박창현, 원유집, 박영준대한전자공학회전자공학회논문지 56(7) 2019.072018Conference/Symposium/Workshop ProceedingsAutoScale: 자동화 명령어-레벨 정밀도 스케일링 프레임워크강석원, 박영준한국소프트웨어종합학술대회(KSC), 2018.12싱글 머신 기반 대용량 희소 행렬 간 곱셈 방법들의 구현 및 성능 분석권혁무, 장명환, 김상욱, 박영준 한국소프트웨어종합학술대회(KSC), 2018.12모바일 프로세서 최적화를 위한 Runtime-manager 개발정현교, 오승준, 박영준한국소프트웨어종합학술대회(KSC), 2018.12, 학부생 부문 장려상CUDA 커널의 메모리 인스트럭션 분포에 따른 성능 변화 분석손윤하, 이새한, 강석원, 박영준한국소프트웨어종합학술대회(KSC), 2018.12모바일 GPU 를 효율적으로 이용하기 위한 고효율 Frequency Governor 기법 개발이새한, 손윤하, 김동현, 박영준 한국소프트웨어종합학술대회(KSC), 2018.12Load instruction 기반 GPU 스레드의 실행 순서 profiler 구현오승준, 정현교, 강석원, 박영준한국소프트웨어종합학술대회(KSC), 2018.12LLVM-IR level approximation을 통한 OpenCL 2D convolution 커널 프로그램 속도 개선 탐구이재일, 임준수, 강석원, 박영준한국소프트웨어종합학술대회(KSC), 2018.12FPGA 기반 멀티 뉴럴 네트워크 가속기 프레임워크 설계이인호, 홍성민, 류기하, 박영준2018 한국컴퓨터종합학술대회 (KCC), 2018.06, 우수발표논문상LLVM 기반 OpenCL 환경 GPU 워크로드의 다이나믹 프로파일링유용승, 강석원, 박영준2018 한국컴퓨터종합학술대회 (KCC), 2018.06, 우수발표논문상다중 클락 기반 DVFS 지원 멀티 GPU 시뮬레이터차제희, 김지호, 박영준2018 한국컴퓨터종합학술대회 (KCC), 2018.06Journal/Magazine Articles