박재식 연구실
컴퓨터공학부 박재식
박재식 연구실은 컴퓨터 비전 및 인공지능 분야에서 세계적인 수준의 연구를 수행하는 연구실입니다. 본 연구실은 시각정보처리, 3차원 장면 복원, 생성형 인공지능, 포인트 클라우드 처리 등 다양한 첨단 기술을 개발하고 있으며, 이론적 연구와 실용적 응용을 동시에 추구합니다.
연구실의 주요 연구 분야 중 하나는 이미지와 비디오를 활용한 3차원 장면 복원 기술입니다. RGB-D 카메라, 라이다, 멀티뷰 이미지 등 다양한 센서 데이터를 융합하여 실내외 환경의 3차원 구조를 정밀하게 재구성하는 알고리즘을 개발하고 있습니다. 이러한 기술은 자율주행, 증강현실, 로봇 비전 등 다양한 산업 분야에서 핵심적인 역할을 하고 있습니다.
또한, 생성형 인공지능 분야에서도 활발한 연구를 진행하고 있습니다. GAN, Diffusion Model 등 최신 생성 모델을 활용하여 고품질 이미지 합성, 텍스트-이미지 변환, 이미지 편집, 3D 아바타 복원 등 다양한 응용 기술을 개발하고 있습니다. 이와 관련된 다수의 특허와 논문을 통해 연구실의 기술력을 입증하고 있습니다.
포인트 클라우드 및 3D 데이터 처리 분야에서도 혁신적인 연구를 이어가고 있습니다. 대규모 3D 데이터의 정합, 분할, 특징 추출 등 다양한 문제를 해결하기 위한 효율적이고 정밀한 알고리즘을 개발하고 있으며, 실제 산업 현장에서 활용 가능한 기술로 발전시키고 있습니다.
박재식 연구실은 국내외 다양한 연구기관 및 기업과의 협력을 통해 실질적인 사회적, 산업적 가치를 창출하고 있습니다. 앞으로도 본 연구실은 컴퓨터 비전과 인공지능 분야의 선도적 연구를 지속하며, 미래 지능형 시스템의 핵심 기술 개발에 앞장설 것입니다.
3D Shape Assembly
Generative Adversarial Networks (GANs)
Image-Text Alignment
시각정보처리 및 3차원 장면 복원
박재식 연구실은 시각정보처리 분야에서 최첨단 연구를 수행하고 있습니다. 본 연구실은 이미지와 비디오 데이터를 활용하여 현실 세계의 3차원 구조를 정확하게 복원하는 기술 개발에 주력하고 있습니다. 특히, RGB-D 카메라, 라이다, 멀티뷰 이미지 등 다양한 센서 데이터를 통합하여 실내외 환경의 3차원 장면을 정밀하게 재구성하는 알고리즘을 연구합니다. 이러한 기술은 자율주행, 증강현실, 로봇 비전 등 다양한 응용 분야에서 핵심적인 역할을 합니다.
연구실은 고품질의 깊이 맵 업샘플링, 결손 영역 보완, 동적 객체의 3차원 복원 등 다양한 문제를 다루고 있습니다. 예를 들어, 'High-Quality Depth Map Upsampling and Completion for RGB-D Cameras' 논문에서는 RGB와 깊이 정보를 결합하여 노이즈가 많은 깊이 맵을 고해상도로 복원하는 프레임워크를 제안하였으며, 'TextureMe: High-Quality Textured Scene Reconstruction in Real Time' 연구에서는 실시간으로 고품질 텍스처를 복원하는 기술을 개발하였습니다. 또한, 'High-Speed Stereo Visual SLAM for Low-Powered Computing Devices' 논문에서는 임베디드 환경에서도 빠르고 정확한 SLAM 시스템을 구현하는 방법을 제시하였습니다.
이러한 연구 성과는 실제 환경에서의 실시간 3차원 인식 및 복원, 로봇의 자율 주행, 증강현실 기반 서비스 등 다양한 산업적 응용에 기여하고 있습니다. 앞으로도 박재식 연구실은 더욱 정밀하고 효율적인 3차원 시각정보처리 기술을 개발하여, 미래 지능형 시스템의 핵심 기반을 마련하는 데 앞장설 것입니다.
생성형 인공지능 및 이미지 합성
본 연구실은 생성형 인공지능(Generative AI) 분야에서도 활발한 연구를 진행하고 있습니다. 특히, GAN(Generative Adversarial Networks), Diffusion Model 등 최신 생성 모델을 활용하여 고품질 이미지 합성, 텍스트-이미지 변환, 이미지 편집 등 다양한 응용 기술을 개발하고 있습니다. 'StudioGAN: A Taxonomy and Benchmark of GANs for Image Synthesis', 'Distilling Diffusion Models into Conditional GANs', 'Scaling up GANs for Text-to-Image Synthesis' 등 다수의 논문을 통해 생성형 모델의 구조적 개선, 효율적 학습, 다양한 생성 태스크에 대한 성능 향상을 입증하였습니다.
특히, 텍스트 기반 이미지 생성 및 편집, 멀티모달 데이터 융합, 3D 아바타 복원 등 실질적 활용이 가능한 생성형 AI 기술에 집중하고 있습니다. 예를 들어, '멀티모달 확산 모델을 이용한 텍스트 기반 이미지 편집 장치 및 방법' 특허에서는 텍스트와 이미지를 결합하여 사용자가 원하는 이미지를 직관적으로 생성 및 편집할 수 있는 시스템을 제안하였고, '디퓨전 모델을 이용한 3D 아바타 복원 장치 및 방법' 특허에서는 2D/3D 데이터 기반의 아바타 생성 기술을 개발하였습니다.
이러한 연구는 엔터테인먼트, 메타버스, 의료 영상, 디자인 등 다양한 산업 분야에서 혁신적인 서비스와 제품 개발로 이어질 수 있습니다. 앞으로도 박재식 연구실은 생성형 인공지능의 한계를 극복하고, 더욱 창의적이고 실용적인 AI 기반 이미지 합성 및 편집 기술을 선도할 계획입니다.
포인트 클라우드 및 3D 데이터 처리
박재식 연구실은 포인트 클라우드와 3D 데이터의 정합, 분할, 특징 추출 등 다양한 3차원 데이터 처리 기술을 연구하고 있습니다. '3D Geometric Shape Assembly via Efficient Point Cloud Matching', 'Learning SO(3)-Invariant Semantic Correspondence via Local Shape Transform', 'Scene-level Point Cloud Colorization with Semantic-and-Geometric-aware Networks' 등 다수의 논문을 통해 대규모 3D 데이터의 효율적 처리와 정밀한 분석 방법을 제시하였습니다.
특히, 비정형 점군 데이터의 정합, 3D 객체의 조립 및 분할, 의미론적 분할 등 복잡한 3차원 데이터 처리 문제에 대한 혁신적인 알고리즘을 개발하고 있습니다. 예를 들어, '효율적이고 규모 가변적인 점 군집의 정합 방법' 프로젝트에서는 다양한 크기와 형태의 점군 데이터를 빠르고 정확하게 정합하는 기술을 연구하였으며, '점 군집 정합을 위한 특이대응점 기반 구조적 매칭 기법' 등 학회 발표를 통해 실질적인 성능 개선을 입증하였습니다.
이러한 연구는 자율주행, 로봇, 스마트 시티, 디지털 트윈 등 3D 데이터가 핵심이 되는 다양한 분야에서 활용될 수 있습니다. 앞으로도 연구실은 대용량 3D 데이터의 실시간 처리, 고정밀 분석, 다양한 센서 융합 기반의 3차원 인식 기술을 지속적으로 발전시켜 나갈 예정입니다.
1
Designing Concise ConvNets with Columnar Stages
박재식, Ashish Kumar
International Conference on Learning Representations, 202504
2
Locality-aware Gaussian Compression for Fast and High-quality Rendering
신승주, 조성현, 박재식
International Conference on Learning Representations, 202504
3
InstantDrag: Improving Interactivity in Drag-based Image Editing
박재식, 신중혁, 최대현
Special Interest Group on Computer Graphics and Interactive Techniques (SIGGRAPH Asia), 202412
1
동영상 4D-GS 모델 표현 및 압축 검증 소프트웨어 구현
2
지속가능한 생성형 인공지능 컴퓨팅 플랫폼 연구실
3
일상의 다층적 시각상식에 기반한 시공간 이해 및 생성 인공지능 개발