U-AIM SW STARLab - 공개 SW

공개 소프트웨어 목록

인과성 이해 기반 비디오 장면 이해 소프트 웨어
[2021] Weakly-Supervised Moment Retrieval Network for Video Corpus Moment Retrieval
설명: 약지도 학습 기반의 비디오 검색 시스템

[2022] SQuiDNet: Selective Query-guided Debiasing Network for Video Corpus Moment Retrieval
설명: 검색 비 인과성 (편향성) 문제를 해결할 수 있는 비디오 검색 고도화 프레임 워크

[2023] Video-Scene-Complexity-Estimation
설명: 주어진 비디오의 장면 복잡도를 인과적으로 계산하여 비디오 검색 난이도 인식할 수 있는 모듈
인과성 이해 기반 비디오 질의 응답 소프트웨어
[2023] 비디오 기반 인공지능 대화 시스템
설명: 주어진 비디오를 이해하고 사용자의 질의에 답변할 수 있는 인공지능 시스템

[2023] HEAR: Hearing Enhanced Audio Response for Video-grounded Dialogue
설명: 오디오를 무시하는 응답 편향성 문제를 해결할 수 있는 인공지능 대화 시스템
다차원 시각 정보 인식 소프트웨어
[2021] SphereRPN: Learning Spheres for High-Quality Region Proposals on 3D Point Clouds Object Detection
설명: 3차원 객체 인식을 위한 후보 영역 생성 시스템

[2022] SoftGroup for 3D Instance Segmentation on Point Clouds
설명: 3차원 점구름 데이터로부터 3차원 객체를 인식할 수 있는 시스템

[2023] Scalable SoftGroup for 3D Instance Segmentation on Point Clouds
설명: 3차원 점구름 데이터에서 3차원 객체 인지 성능 고도화 모듈

[2024] Progressive Fourier Neural Representation for Sequential Video Compilation
설명: 푸리에 기반 신경 표현을 사용해 여러 영상을 연속적으로 학습·통합하는 비디오 표현 모델

강화 학습 소프트웨어
[2021] CCFDM: Sample-efficient Reinforcement Learning Representation Learning with Curiosity Contrastive Forward Dynamics Model
설명: 대조 학습 기법을 적용하여 주어진 샘플을 효율적으로 활용할 수 있는 강화학습

[2022] Utilizing Skipped Frames in Action Repeats for Improving Sample Efficiency in Reinforcement Learning
설명: 로봇의 반복되는 동작에서 효과적 지식 획득을 가능하게 할 수 있는 강화학습

[2025] ConfPO: Exploiting Policy Model Confidence for Critical Token Selection in Preference Optimization
설명: 정책 모델의 신뢰도를 이용해 핵심 토큰만 선택적으로 학습하는 효율적 선호 최적화 기법

인공지능 계속 학습, 소수샷 학습, 편향성 제거 소프트웨어
[2022] Fast and Efficient MMD-based Fair PCA via Optimization over Stiefel Manifold
설명: 차원 축소 기법의 비인과성(편향성) 문제를 해결할 수 있는 모듈

[2022] Dual Temperature Helps Contrastive Learning Without Many Negative Samples: Towards Understanding and Simplifying MoCo
설명: 인공지능 학습을 위한 대조학습 기법의 효과를 향상시킬 수 있는 모듈

[2022] Forget-free Continual Learning with Winning Subnetworks
설명: 인공지능 학습을 망각하지 않고 지속할 수 있는 학습할 수 있는 프레임워크

[2023] On the Soft-Subnetwork for Few-Shot Class Incremental Learning
설명: 소수샷 학습 기법을 적용한 지속 학습 프레임워크

[2023] ESD: Expected Squared Difference as a Tuning-Free Trainable Calibration Measure
설명: 인공지능 설명 가능성 제공을 위한 calibration 모듈

[2024] SimPSI: A Simple Strategy to Preserve Spectral Information in Time Series Data Augmentation
설명: 시계열 데이터 증강 시 스펙트럼 정보를 보존하여 왜곡을 줄이는 경량 증강 기법

인공지능 기반 응용 소프트웨어
[2022] Dual-scale Doppler Attention for Human Identification
설명: 레이더 상에서 사람 인식할 수 있는 시스템

[2022] LAD: A Hybrid Deep Learning System for Benign Paroxysmal Positional Vertigo Disorders Diagnostic
설명: 동공 인지로부터 사람의 질병을 예측할 수 있는 소프트웨어

[2024] Causal Localization Network for Radar Human Localization with micro-Doppler signature
설명: 레이더 신호의 미세 도플러 특성을 활용해 사람 위치를 인과적으로 추정하는 모델

생성형 AI 및 비디오/이미지 편집 소프트웨어

[2024] FRAG: Frequency Adaptive Group for Diffuison Video Editing
설명: 주파수 특성을 반영해 영상 디테일을 보존하는 디퓨전 기반 비디오 편집 기법

[2024] Cross-view Masked Diffusion Transformers for Person Image Synthesis
설명: 다중 시점을 활용해 자연스러운 인물 이미지를 생성하는 마스크드 디퓨전 모델

[2024] FlexiEdit: Frequency-Aware Latent Refinement for Enhanced Non-Rigid Editing
설명: 주파수 정보를 이용해 비강체 이미지 편집 성능을 향상시키는 잠재공간 정제 기법

[2024] Querying Easily Flip-flopped Samples for Deep Active Learning
설명: 예측이 쉽게 뒤바뀌는 샘플을 선별해 라벨링 효율을 높이는 능동학습 전략

[2024] Physics Informed Distillation for Diffusion Models
설명:

[2024] BI-MDRG: Bridging Image History in Multimodal Dialogue Response Generation
설명: 이미지 히스토리를 활용해 멀티모달 대화 응답의 일관성과 정확도를 높이는 대화 생성 모델

[2025] ITA-MDT: Image-Timestep-Adaptive Masked Diffusion Transformer Framework for Image-Based Virtual Try-On
설명: 이미지 기반 가상 착용을 위해 시점 적응형 마스킹을 적용한 디퓨전 기반 합성 모델

[2025] MDSGen: Fast and Efficient Masked Diffusion Temporal-Aware Transformers for open-Domain Sound Generation
설명: 시간 정보를 반영해 다양한 음향을 생성하는 마스크드 디퓨전 기반 사운드 생성 모델

[2025] FlowDrag: 3D-aware Drag-based Image Editing with Mesh-guided Deformation Vector Flow Fields
설명: 3D 메쉬 정보를 이용해 드래그 기반 이미지 편집을 구조적으로 안정적으로 수행하는 기법

[2025] Occlusion-robust Stylization for Drawing-based 3D Animation
설명: 가려짐 상황에서도 스타일 일관성을 유지하는 3D 애니메이션용 스타일 변환 기법

멀티모달 이해 및 대규모 시각-언어 소프트웨어

[2025] Can Video LLMs Refuse to Answer? Alignment for Answerability in Video Large Language Models
설명: 비디오 LLM이 답할 수 없는 질문을 인지하고 거절하도록 정렬하는 프레임워크

[2025] Enhancing Rating-Based Reinforcement Learning to Effectively Leverage Feedback from Large Vision-Language
설명: VLM의 평점을 활용해 보상 모델 없이 정책을 효율적으로 개선하는 강화학습 기법

[2025] Policy Learning from Large Vision-Language Model Feedback Without Reward Modeling
설명: 보상 모델 없이 VLM의 선호 피드백만으로 정책을 학습하는 강화학습 방법

Page updated

Google Sites

Report abuse