논문 | 전해곤 교수 연구실 | 연세대학교 인공지능학과

전해곤 교수 연구실

홈

기본 정보

연구 분야

프로젝트

논문

구성원

논문

연구 성과 추이

표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

5개년 연도별 논문 게재 수

54총합

5개년 연도별 피인용 수

601총합

주요 논문

*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.

article

인용수 4

2025

Social Reasoning-Aware Trajectory Prediction via Multimodal Language Model

Inhwan Bae, Junoh Lee, Hae‐Gon Jeon

IF 18.6 (2025)

IEEE Transactions on Pattern Analysis and Machine Intelligence

최근의 언어 모델 발전은 문맥 이해와 생성적 표상을 수행할 수 있는 능력을 보여주었다. 이러한 발전을 바탕으로, 우리는 VLMTraj라는 이름의 비전-언어 모델을 기반으로 한 새로운 멀티모달 궤적 예측(multimodal trajectory predictor)을 제안하며, 멀티모달 대규모 언어 모델의 사전 지식과 다양한 양식(modality) 정보 전반에 걸친 인간과 유사한 추론 능력을 충분히 활용한다. 본 모델의 핵심 아이디어는 궤적 예측 과제를 시각 질의응답(visual question answering) 형식으로 재구성하는 것이다. 역사적 정보를 문맥(context)으로 사용하고, 언어 모델에게 대화형 방식으로 예측을 수행하도록 지시한다. 구체적으로, 모든 입력을 자연어 스타일로 변환한다. 과거 궤적은 텍스트 프롬프트로 변환하고, 장면 이미지는 이미지 캡셔닝(image captioning)을 통해 기술한다. 또한 입력 이미지로부터 얻은 시각적 특징 역시 모달리티 인코더(modality encoder)와 커넥터(connector)를 통해 토큰으로 변환한다. 변환된 데이터는 이후 언어 모델에 사용될 수 있도록 포맷화된다. 다음으로, 장면 맥락과 보행자 간 사회적 관계와 같은 고수준 지식을 언어 모델이 이해하고 추론하도록 유도하기 위해, 보조적인 멀티태스크 질의응답(auxiliary multi-task question and answers)을 도입한다. 학습 단계에서는 먼저 프롬프트 데이터를 사용하여 수치 토크나이저(numerical tokenizer)를 최적화함으로써 정수와 소수 부분을 효과적으로 분리하여, 언어 모델에서 연속된 수들 간의 상관관계를 포착할 수 있도록 한다. 이후 모든 시각 질의응답 프롬프트를 사용하여 언어 모델을 학습한다. 모델 추론 시에는 빔서치(beam-search) 기반 최빈도(most-likely) 예측과 온도(temperature) 기반 멀티모달 생성(multimodal generation)을 통해 결정론적 및 확률론적 예측 방법을 모두 구현한다. VLMTraj는 언어 기반 모델이 강력한 보행자 궤적 예측기(pedestrian trajectory predictor)가 될 수 있음을 입증하며, 기존의 수치 기반 예측 방법을 능가한다. 광범위한 실험을 통해 VLMTraj는 사회적 관계를 성공적으로 이해하고, 공공 보행자 궤적 예측 벤치마크에서 멀티모달 미래를 정확하게 외삽(extrapolate)할 수 있음을 보여준다.

https://doi.org/10.1109/tpami.2025.3582000

Computer science

Closed captioning

Language model

Artificial intelligence

Context (archaeology)

Natural language processing

Question answering

Generative model

Task (project management)

Natural language

article

인용수 1

2024

What Makes Deviant Places?

Jin-Hwi Park, Young-Jae Park, Ilyung Cheong, Junoh Lee, Young Eun Huh, Hae‐Gon Jeon

IF 18.6 (2024)

IEEE Transactions on Pattern Analysis and Machine Intelligence

도시 안전은 시민의 삶의 질과 도시의 지속가능한 발전에 필수적인 역할을 한다. 최근 몇 년 동안 연구자들은 도시 안전의 발전에서 위치 특이적 속성이 차지하는 역할을 파악하기 위해 기계학습 기법을 적용하려는 시도를 해왔다. 그러나 기존 연구는 주로 상대적으로 큰 지리적 단위에 기반한 제한된 이미지(예: 지도 이미지, 단일 방향 또는 네 방향 이미지)에 의존해 왔으며, 중대한 범죄율에만 협소하게 초점을 맞춰 예측 성능과 도시 안전에 대한 함의를 제한한다. 본 연구에서는 공식적 일탈 범죄(예: 살인)와 비공식적 일탈 행위(예: 야간의 시끄러운 파티)를 모두 포함하는 개념인 “일탈(deviance)”을 예측하는 새로운 방법을 제안한다. 이를 위해 먼저, Google Street View에서 제공된 사건 현장 주변의 순차적 이미지와 함께, 일곱 개 광역도시의 사건 보고 데이터로 구성된 대규모 지오태그(geo-tagged) 데이터셋을 수집한다. 이후 우리는 일탈 거리(deviant streets)의 시공간적 시각 속성을 학습하는 합성곱 신경망을 설계한다. 실험 결과, 본 프레임워크는 다양한 도시에서 실제 세계의 일탈을 신뢰성 있게 인식할 수 있음을 보여준다. 또한 우리는 사회과학적 관점에서 일탈 식별 및 심각도 추정에 어떤 시각 속성이 중요한지, 그리고 신경망에서 활성화된 특징 맵(feature maps)이 무엇인지 분석한다.

https://doi.org/10.1109/tpami.2024.3393408

Computer science

Artificial intelligence

Computer vision

article

인용수 11

2023

DeepGT: Deep learning-based quantification of nanosized bioparticles in bright-field micrographs of Gires-Tournois biosensor

Jiwon Kang, Young Jin Yoo, Jin-Hwi Park, Joo Hwan Ko, Seungtaek Kim, Stefan G. Stanciu, Harald Stenmark, JinAh Lee, Abdullah Al Mahmud, Hae‐Gon Jeon, Young Min Song

IF 13.2 (2023)

Nano Today

감염 환자에서 바이러스 부하 프로파일을 신속하고 분산된 방식으로 정량화하는 것은 임상적 중증도를 평가하고 적절한 치료 전략을 맞춤화하는 데 필수적이다. 현미경 영상은 표지 및 증폭 없이 정량 진단을 제공할 가능성이 있으나, 생체입자의 작은 크기(직경 ∼100 nm)와 낮은 굴절률(n ∼1.5)은 정확한 추정의 달성에 어려움을 야기하여 결과적으로 검출한계(LoD)를 증가시킨다. 본 연구에서는 나노스케일 생체입자 계수 정확도를 향상시키기 위해 Gires-Tournois(GT) 센싱 플랫폼과 딥러닝 알고리즘을 결합한 새로운 시너지 바이오센싱 접근법 DeepGT를 제시한다. GT 센싱 플랫폼은 포토닉 공진자로서 명시야 현미경에서 생체입자의 가시성을 증가시키고 색채 대비를 최대화한다. DeepGT는 팽창(dilated)된 합성곱 신경망 아키텍처의 백엔드를 사용함으로써 인공물과 색상 편차를 효과적으로 정제하여, 규칙 기반 알고리즘( MAE ∼ 13.47)과 비교해 입자 추정 정확도를 유의하게 개선한다(1596개 이미지 전반에서 MAE ∼2.37). 특히, 보이지 않는 입자(예: 2개 또는 3개 입자)의 검출에서 향상된 정확도는 138 pg ml−1의 LoD를 가능하게 하며, 감염 스펙트럼에서 무증상부터 중증 사례에 이르기까지 임상 범위 내의 낮은 바이러스 농도 구간에서 동적인 선형 상관을 촉진한다. DeepGT는 공간 해상도 접근이 아닌 크로마토메트리(chromatometry) 기반 전략에 의존하면서, 전이학습을 활용한 결과 현미경 시스템의 가시광 최소 회절 한계(< 258 nm)보다 더 작은 다양한 크기의 입자를 분석할 때 탁월한 정밀도를 보인다. DeepGT 접근법은 출현하는 바이러스에 대한 조기 스크리닝 및 선별(triage)에 대한 가능성을 가지며, 진단에서의 비용과 시간 요구 사항을 줄일 수 있다.

https://doi.org/10.1016/j.nantod.2023.101968

Deep learning

Computer science

Materials science

Detection limit

Nanotechnology

Microscopy

Artificial intelligence

Biological system

Optics

Physics

article

인용수 21

2023

Full‐Control and Switching of Optical Fano Resonance by Continuum State Engineering

Joo Hwan Ko, Jin‐Hwi Park, Young Jin Yoo, Sehui Chang, Jiwon Kang, Aiguo Wu, Fang Yang, Sejeong Kim, Hae‐Gon Jeon, Young Min Song

IF 14.3 (2023)

Advanced Science

비대칭 선형상으로 알려진 파노 공명(Fano resonance)은 특히 센싱 응용 분야에서 포토닉스 분야에서 큰 주목을 받아 왔다. 그러나 단순한 기하학적 구조를 통해 조절 가능한 파노 파라미터를 구현하는 것은 여전히 어렵다. 본 연구에서는 준-로렌츠(quasi-Lorentzian)에서 로렌츠(Lorentzian)로, 다시 파노(Fano)로 이르는 전 구간의 스펙트럼 형상을 생성하기 위해 다공성 층을 포함한 박막 광 파노 공진기를 사용하는 새로운 접근법을 제안하고, 이를 실험적으로 입증한다. 사각 입사(glancing angle) 증착 기술을 활용하여 편광 의존적 Fano 공진기를 제작한다. s-편광과 p-편광 사이의 선형 편광을 변화시킴으로써, 준-로렌츠 상태와 음(-)의 파노 상태 사이를 전환 가능한 Fano 장치를 시연한다. 이러한 스펙트럼 형상의 변화는 굴절률이 낮은 물질을 검출하는 데 유리하다. 또한 생체 입자(bio-particle) 센싱 실험을 수행하여 신호 대 잡음비 및 예측 정확도가 향상됨을 보여준다. 마지막으로, 층 두께, 공극률(다공성), 재료 선택을 포함한 다수의 파라미터 간의 복잡한 상호작용 때문에 박막 기반 Fano 공진기를 최적화하는 과제를 다룬다. 다층 퍼셉트론(multilayer perceptron) 모델에 기반한 역설계 도구(inverse design tool)를 개발하여, 모든 범위의 Fano 파라미터에 대해 신속한 계산이 가능하도록 한다. 이 방법은 기존의 전수열거(conventional exhaustive enumeration) 방법(MVF = 0.37)보다 평균 검증 인자(mean validation factor, MVF = 0.07, q-q')에서 향상된 정확도를 제공한다.

https://doi.org/10.1002/advs.202304310

Fano resonance

Fano plane

Resonator

Polarization (electrochemistry)

Optics

Materials science

Physics

Optoelectronics

Plasmon

Mathematics

article

인용수 2

2022

CMSNet: Deep Color and Monochrome Stereo

Hae‐Gon Jeon, Sunghoon Im, Jaesung Choe, Minjun Kang, Joon‐Young Lee, Martial Hebert

IF 19.5 (2022)

International Journal of Computer Vision

https://doi.org/10.1007/s11263-021-01565-6

Monochrome

Artificial intelligence

Computer vision

Computer science

Chrominance

Noise (video)

Computer stereo vision

Convolutional neural network

Luminance

Color image

전체 논문

article

인용수 4

2025

Social Reasoning-Aware Trajectory Prediction via Multimodal Language Model

Inhwan Bae, Junoh Lee, Hae‐Gon Jeon

IF 18.6 (2025)

IEEE Transactions on Pattern Analysis and Machine Intelligence

https://doi.org/10.1109/tpami.2025.3582000

Computer science

Closed captioning

Language model

Artificial intelligence

Context (archaeology)

Natural language processing

Question answering

Generative model

Task (project management)

Natural language

article

인용수 1

2024

What Makes Deviant Places?

Jin-Hwi Park, Young-Jae Park, Ilyung Cheong, Junoh Lee, Young Eun Huh, Hae‐Gon Jeon

IF 18.6 (2024)

IEEE Transactions on Pattern Analysis and Machine Intelligence

https://doi.org/10.1109/tpami.2024.3393408

Computer science

Artificial intelligence

Computer vision

article

인용수 11

2023

DeepGT: Deep learning-based quantification of nanosized bioparticles in bright-field micrographs of Gires-Tournois biosensor

Jiwon Kang, Young Jin Yoo, Jin-Hwi Park, Joo Hwan Ko, Seungtaek Kim, Stefan G. Stanciu, Harald Stenmark, JinAh Lee, Abdullah Al Mahmud, Hae‐Gon Jeon, Young Min Song

IF 13.2 (2023)

Nano Today

https://doi.org/10.1016/j.nantod.2023.101968

Deep learning

Computer science

Materials science

Detection limit

Nanotechnology

Microscopy

Artificial intelligence

Biological system

Optics

Physics

article

인용수 21

2023

Full‐Control and Switching of Optical Fano Resonance by Continuum State Engineering

Joo Hwan Ko, Jin‐Hwi Park, Young Jin Yoo, Sehui Chang, Jiwon Kang, Aiguo Wu, Fang Yang, Sejeong Kim, Hae‐Gon Jeon, Young Min Song

IF 14.3 (2023)

Advanced Science

https://doi.org/10.1002/advs.202304310

Fano resonance

Fano plane

Resonator

Polarization (electrochemistry)

Optics

Materials science

Physics

Optoelectronics

Plasmon

Mathematics

article

인용수 2

2022

CMSNet: Deep Color and Monochrome Stereo

Hae‐Gon Jeon, Sunghoon Im, Jaesung Choe, Minjun Kang, Joon‐Young Lee, Martial Hebert

IF 19.5 (2022)

International Journal of Computer Vision

https://doi.org/10.1007/s11263-021-01565-6

Monochrome

Artificial intelligence

Computer vision

Computer science

Chrominance

Noise (video)

Computer stereo vision

Convolutional neural network

Luminance

Color image

article

인용수 0

2026

Motion Prior Distillation in Time Reversal Sampling for Generative Inbetweening

Wooseok Jeon, Seunghyun Shin, Dongmin Shin, Hae‐Gon Jeon

ArXiv.org

최근 이미지-투-비디오(I2V) 확산 모델의 발전은, 두 개의 핵심 프레임(keyframes) 사이에 의미적으로 그럴듯한 프레임을 생성하는 생성적 인비트위닝(generative inbetweening) 분야를 크게 진전시켰다. 특히, 추가 학습 없이 대규모 사전학습 I2V 모델의 생성적 사전지식(generative priors)을 활용하는 추론 시점 샘플링(inference-time sampling) 전략이 점점 더 인기를 얻고 있다. 그러나 기존의 추론 시점 샘플링은, 순방향 경로와 역방향 경로를 병렬로 결합하거나 순차적으로 교대로 사용하는 경우가 많지만, 두 경로가 생성한 결과 간의 정합성이 맞지 않아 시간적 불연속성과 바람직하지 않은 시각적 인공물(artifacts)이 종종 발생한다. 이는 각 경로가 자신이 조건화된 프레임에 의해 유도된 운동(motion) 사전지식을 따르기 때문이다. 본 연구에서는 전방 경로의 운동 잔차(motion residual)를 역방향 경로로 증류(distillation)함으로써 양방향 불일치(bidirectional mismatch)를 억제하는, 단순하면서도 효과적인 추론 시점 증류 기법인 운동 사전지식 증류(Motion Prior Distillation, MPD)를 제안한다. 우리의 방법은 경로의 모호성(ambiguity)을 초래하는 말단 조건(end-conditioned) 경로의 노이즈 제거(denoising)를 의도적으로 회피할 수 있으며, 전방 운동 사전지식을 활용하여 더 시간적으로 일관된 인비트위닝 결과를 제공한다. 우리는 표준 벤치마크에 대한 정량적 평가를 수행할 뿐만 아니라, 실제 시나리오에서 접근법의 효과를 입증하기 위해 광범위한 사용자 연구도 진행한다.

http://arxiv.org/abs/2602.12679

Leverage (statistics)

Path (computing)

Residual

Prior probability

Motion (physics)

Motion planning

Ambiguity

Aliasing

Sampling (signal processing)

article

인용수 0

2026

Universal Image Immunization against Diffusion-based Image Editing via Semantic Injection

Chanhui Lee, Seunghyun Shin, Donggyu Choi, Hae‐Gon Jeon, Jeany Son

arXiv (Cornell University)

최근 확산(diffusion) 모델의 발전은 자연어 프롬프트에 의해 유도되는 강력한 이미지 편집 기능을 가능하게 하여 새로운 창의적 가능성을 열었다. 그러나 이러한 기술은 딥페이크와 저작권이 있는 시각 콘텐츠의 무단 사용과 같은 중대한 윤리적·법적 위험을 함께 초래한다. 이러한 위험에 대응하기 위해 이미지 면역화(image immunization)는 AI 기반 의미론적 조작에 대한 유망한 방어책으로 부상하였다. 그럼에도 불구하고 대부분의 기존 접근법은 이미지별 맞춤 최적화를 필요로 하는 이미지 특화 적대적 교란(image-specific adversarial perturbations)에 의존하므로, 확장성과 실용성에 한계가 있다. 본 논문에서는 확산 기반 편집 파이프라인을 위해 특별히 설계된 단일의 보편적 적대적 교란( UAP )을 생성하는 최초의 범용 이미지 면역화 프레임워크를 제안한다. 표적 공격에서 사용되는 범용 적대적 교란(universal adversarial perturbation, UAP) 기법에서 영감을 받아, 본 방법은 보호 대상 이미지에 의미론적 표적(semantic target)을 내재시키는 UAP를 생성한다. 동시에 원본 콘텐츠를 억제하여 편집 과정에서 모델의 주의(attention)를 효과적으로 오도한다. 그 결과, 본 접근법은 UAP를 통해 이미지의 원본 의미론적 콘텐츠를 덮어씀으로써 악의적 편집 시도를 효과적으로 차단한다. 또한 본 방법은 학습 데이터나 도메인 지식에 대한 접근 없이도 요구하지 않는 데이터-프리(data-free) 설정에서도 효과적으로 작동하여, 실제 환경에서의 실용성과 광범위한 적용 가능성을 더욱 향상시킨다. 광범위한 실험 결과, 본 방법은 최초의 범용 면역화 접근으로서 UAP 설정에서 여러 기준 방법(baseline)보다 유의미하게 우수한 성능을 보인다. 더 나아가, 범용 교란의 내재적 어려움에도 불구하고, 본 방법은 보다 제한된 교란 예산 하에서 이미지 특화 방법과 동등한 수준의 성능을 달성하며, 서로 다른 확산 모델 간에서도 강한 블랙박스 전이성(transferability)을 보여준다.

http://arxiv.org/abs/2602.14679

Adversarial system

Image editing

Transferability

Limiting

Scalability

Image (mathematics)

Visualization

preprint

인용수 0

2026

RehearsalNeRF: Decoupling Intrinsic Neural Fields of Dynamic Illuminations for Scene Editing

C. Won, HyunJun Jung, Jungu Cho, Seonmi Park, Chi-Hoon Lee, Hae‐Gon Jeon

arXiv (Cornell University)

신경 복사도장(neural radiance fields)에서 상당한 진전이 있었음에도 불구하고, 동적 조명 변화에 관한 문제는 여전히 해결되지 않았다. 장면 내 시간-변화/시간-불변 성분을 매개변수화하는 관련 연구들과 달리, 피사체의 복사도는 시공간 영역에서 자기 자신이 방출하는 복사도 및 조명 색상과 매우 강하게 얽혀 있다. 본 논문에서는 심각한 조명 변화 하에서 분리된(disentangled) 신경 장을 학습하기 위한 새로운 효율적 방법인 RehearsalNeRF를 제안한다. 핵심 아이디어는 동적 조명이 발생하기 전에 쉽게 촬영할 수 있는 리허설 스테이지와 같은 안정적인 조명 조건에서 획득된 장면을 활용하여, 서로 다른 조명 조건 간의 기하학적 일관성을 강제하는 데 있다. 특히 RehearsalNeRF는 조명 효과를 위한 학습 가능한 벡터를 사용하며, 이는 시간 차원에서의 조명 색상을 나타내고, 투영된 빛의 색상을 장면 복사도에서 분리(disentangle)하는 데 사용된다. 또한 RehearsalNeRF는 시판(interactive) 마스크를 그대로 채택하는 것만으로 동적 객체의 신경 장을 재구성할 수 있다. 동적 객체를 분리하기 위해서는, 색상 분리(color disentanglement)에 대한 거친 감독(coarse supervision)을 제공하는 광류(optical flow)를 활용한 새로운 정규화 항을 제안한다. 동적 조명 조건에서 RehearsalNeRF의 유효성을 입증하기 위해, 새로운 시점 합성 및 장면 편집(scene editing)에서의 견고한 성능을 보인다. 소스 코드와 비디오 데이터셋은 공개될 예정이다.

https://doi.org/10.48550/arxiv.2603.27948

Radiance

Leverage (statistics)

Global illumination

View synthesis

Decoupling (probability)

Key (lock)

Color constancy

Regularization (linguistics)

article

인용수 0

2026

RehearsalNeRF: Decoupling Intrinsic Neural Fields of Dynamic Illuminations for Scene Editing

C. Won, HyunJun Jung, Jungu Cho, Seonmi Park, Chi-Hoon Lee, Hae‐Gon Jeon

ArXiv.org

신경 복사장(Neural Radiance Fields)에서 상당한 진전이 있었음에도 불구하고, 동적 조명 변화에 관한 문제는 여전히 해결되지 않은 상태이다. 장면 내의 시간에 따른/시간에 불변인 구성요소를 매개변수화하는 관련 연구들과 달리, 피사체의 복사도(radiance)는 시공간 영역에서 자기 자신의 방출 복사도와 조명 색상과 강하게 얽혀 있다. 본 논문에서는 심각한 조명 변화 하에서도 분리된(disentangled) 신경장(neural fields)을 학습하기 위한 새로운 효과적인 방법인 RehearsalNeRF를 제안한다. 우리의 핵심 아이디어는 동적 조명이 발생하기 전에 쉽게 촬영할 수 있는 연습 무대(rehearsal stages)와 같은 안정적인 조명 하에서 포착된 장면을 활용하여, 서로 다른 조명 조건 간의 기하학적 일관성을 강제하는 데 있다. 특히 RehearsalNeRF는 조명 효과를 위한 학습 가능 벡터를 사용하며, 이는 시간 차원에서 조명 색상을 나타내고, 투영된 빛의 색상을 장면의 복사도에서 분리하는 데 사용된다. 또한 RehearsalNeRF는 시판(interactive) 마스크를 그대로 채택하기만 함으로써 동적 객체의 신경장을 재구성할 수 있다. 동적 객체를 분리하기 위해서는, 색상 분리에 대한 거친 감독(coarse supervision)을 제공하는 광류(optical flow)를 활용한 새로운 정규화 항을 제안한다. 우리는 동적 조명 조건에서 새로운 시점 합성(novel view synthesis)과 장면 편집(scene editing)에서 RehearsalNeRF의 효과성을 견고한 성능으로 시연한다. 우리의 소스 코드와 비디오 데이터셋은 공개될 예정이다.

http://arxiv.org/abs/2603.27948

Radiance

Leverage (statistics)

Global illumination

View synthesis

Decoupling (probability)

Key (lock)

Color constancy

Regularization (linguistics)

article

인용수 0

2026

Relaxed Rigidity with Ray-based Grouping for Dynamic Gaussian Splatting

Junoh Leea, Junmyeong Lee, Yeon-Ji Song, Inhwan Bae, Jisu Shin, Hae‐Gon Jeon, Jin-Hwa Kim

ArXiv.org

3D Gaussian Splatting을 이용한 동적 3D 장면의 복원은 상당한 가능성을 보여주었다. 그러나 가장 핵심적인 과제는 현실 세계의 물리적 역학에 부합하는 방식으로 Gaussian의 운동을 정렬하지 못하는 경우가 많아, 실제적인 운동을 모델링하는 데에 여전히 어려움이 남아 있다는 점이다. 이러한 불일치는 단안 비디오 데이터셋에서 특히 문제가 되는데, 일관된 운동을 유지하지 못하면 국소적인 기하 구조가 붕괴되어 궁극적으로 복원 품질이 저하된다. 따라서 다수의 최신 접근법은 광류(optical flow)나 2D 트랙과 같은 외부 사전지식을 강하게 의존하여 시간적 일관성을 강제한다. 본 연구에서는 4D 장면에서 시간에 걸쳐 Gaussian의 국소 기하 구조를 명시적으로 보존하는 새로운 방법을 제안한다. 우리의 핵심 아이디어는 뷰-공간(view-space) 레이(ray) 그룹화 전략을 도입하여, 동일한 레이에 의해 교차되는 Gaussian들을 클러스터링하되

α

-블렌딩 가중치가 임계값을 초과하는 경우에 한해서만 고려하는 것이다. 이후 이러한 그룹들에 대해 일관된 공간적 분포를 유지하도록 제약을 적용함으로써, 국소 기하를 효과적으로 보존한다. 이 접근법은 국소 기하가 시간에 걸쳐 안정적으로 유지되도록 보장함으로써, 외부의 지시에 의존하지 않고도 보다 물리적으로 타당한 운동 모델을 강제한다. 두 가지 서로 다른 기준(baseline) 모델에 이를 통합하여, 본 방법의 효율성을 입증한다. 도전적인 단안 데이터셋에 대한 광범위한 실험 결과, 본 접근법은 기존 방법을 유의미하게 능가하며, 더 우수한 시간적 일관성과 복원 품질을 달성함을 보여준다.

http://arxiv.org/abs/2603.24994

Optical flow

Gaussian

Monocular

Key (lock)

Consistency (knowledge bases)

Motion (physics)

Rigidity (electromagnetism)

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

전체 논문

article

인용수 4

2025

Social Reasoning-Aware Trajectory Prediction via Multimodal Language Model

Inhwan Bae, Junoh Lee, Hae‐Gon Jeon

IF 18.6 (2025)

IEEE Transactions on Pattern Analysis and Machine Intelligence

https://doi.org/10.1109/tpami.2025.3582000

Computer science

Closed captioning

Language model

Artificial intelligence

Context (archaeology)

Natural language processing

Question answering

Generative model

Task (project management)

Natural language

article

인용수 1

2024

What Makes Deviant Places?

Jin-Hwi Park, Young-Jae Park, Ilyung Cheong, Junoh Lee, Young Eun Huh, Hae‐Gon Jeon

IF 18.6 (2024)

IEEE Transactions on Pattern Analysis and Machine Intelligence

https://doi.org/10.1109/tpami.2024.3393408

Computer science

Artificial intelligence

Computer vision

article

인용수 11

2023

DeepGT: Deep learning-based quantification of nanosized bioparticles in bright-field micrographs of Gires-Tournois biosensor

Jiwon Kang, Young Jin Yoo, Jin-Hwi Park, Joo Hwan Ko, Seungtaek Kim, Stefan G. Stanciu, Harald Stenmark, JinAh Lee, Abdullah Al Mahmud, Hae‐Gon Jeon, Young Min Song

IF 13.2 (2023)

Nano Today

https://doi.org/10.1016/j.nantod.2023.101968

Deep learning

Computer science

Materials science

Detection limit

Nanotechnology

Microscopy

Artificial intelligence

Biological system

Optics

Physics

article

인용수 21

2023

Full‐Control and Switching of Optical Fano Resonance by Continuum State Engineering

Joo Hwan Ko, Jin‐Hwi Park, Young Jin Yoo, Sehui Chang, Jiwon Kang, Aiguo Wu, Fang Yang, Sejeong Kim, Hae‐Gon Jeon, Young Min Song

IF 14.3 (2023)

Advanced Science

https://doi.org/10.1002/advs.202304310

Fano resonance

Fano plane

Resonator

Polarization (electrochemistry)

Optics

Materials science

Physics

Optoelectronics

Plasmon

Mathematics

article

인용수 2

2022

CMSNet: Deep Color and Monochrome Stereo

Hae‐Gon Jeon, Sunghoon Im, Jaesung Choe, Minjun Kang, Joon‐Young Lee, Martial Hebert

IF 19.5 (2022)

International Journal of Computer Vision

https://doi.org/10.1007/s11263-021-01565-6

Monochrome

Artificial intelligence

Computer vision

Computer science

Chrominance

Noise (video)

Computer stereo vision

Convolutional neural network

Luminance

Color image

article

인용수 0

2026

Motion Prior Distillation in Time Reversal Sampling for Generative Inbetweening

Wooseok Jeon, Seunghyun Shin, Dongmin Shin, Hae‐Gon Jeon

ArXiv.org

http://arxiv.org/abs/2602.12679

Leverage (statistics)

Path (computing)

Residual

Prior probability

Motion (physics)

Motion planning

Ambiguity

Aliasing

Sampling (signal processing)

article

인용수 0

2026

Universal Image Immunization against Diffusion-based Image Editing via Semantic Injection

Chanhui Lee, Seunghyun Shin, Donggyu Choi, Hae‐Gon Jeon, Jeany Son

arXiv (Cornell University)

http://arxiv.org/abs/2602.14679

Adversarial system

Image editing

Transferability

Limiting

Scalability

Image (mathematics)

Visualization

preprint

인용수 0

2026

RehearsalNeRF: Decoupling Intrinsic Neural Fields of Dynamic Illuminations for Scene Editing

C. Won, HyunJun Jung, Jungu Cho, Seonmi Park, Chi-Hoon Lee, Hae‐Gon Jeon

arXiv (Cornell University)

https://doi.org/10.48550/arxiv.2603.27948

Radiance

Leverage (statistics)

Global illumination

View synthesis

Decoupling (probability)

Key (lock)

Color constancy

Regularization (linguistics)

article

인용수 0

2026

RehearsalNeRF: Decoupling Intrinsic Neural Fields of Dynamic Illuminations for Scene Editing

C. Won, HyunJun Jung, Jungu Cho, Seonmi Park, Chi-Hoon Lee, Hae‐Gon Jeon

ArXiv.org

http://arxiv.org/abs/2603.27948

Radiance

Leverage (statistics)

Global illumination

View synthesis

Decoupling (probability)

Key (lock)

Color constancy

Regularization (linguistics)

article

인용수 0

2026

Relaxed Rigidity with Ray-based Grouping for Dynamic Gaussian Splatting

Junoh Leea, Junmyeong Lee, Yeon-Ji Song, Inhwan Bae, Jisu Shin, Hae‐Gon Jeon, Jin-Hwa Kim

ArXiv.org

α

http://arxiv.org/abs/2603.24994

Optical flow

Gaussian

Monocular

Key (lock)

Consistency (knowledge bases)

Motion (physics)

Rigidity (electromagnetism)

주요 논문

*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.

article

인용수 4

2025

Social Reasoning-Aware Trajectory Prediction via Multimodal Language Model

Inhwan Bae, Junoh Lee, Hae‐Gon Jeon

IF 18.6 (2025)

IEEE Transactions on Pattern Analysis and Machine Intelligence

https://doi.org/10.1109/tpami.2025.3582000

Computer science

Closed captioning

Language model

Artificial intelligence

Context (archaeology)

Natural language processing

Question answering

Generative model

Task (project management)

Natural language

article

인용수 1

2024

What Makes Deviant Places?

Jin-Hwi Park, Young-Jae Park, Ilyung Cheong, Junoh Lee, Young Eun Huh, Hae‐Gon Jeon

IF 18.6 (2024)

IEEE Transactions on Pattern Analysis and Machine Intelligence

https://doi.org/10.1109/tpami.2024.3393408

Computer science

Artificial intelligence

Computer vision

article

인용수 11

2023

DeepGT: Deep learning-based quantification of nanosized bioparticles in bright-field micrographs of Gires-Tournois biosensor

Jiwon Kang, Young Jin Yoo, Jin-Hwi Park, Joo Hwan Ko, Seungtaek Kim, Stefan G. Stanciu, Harald Stenmark, JinAh Lee, Abdullah Al Mahmud, Hae‐Gon Jeon, Young Min Song

IF 13.2 (2023)

Nano Today

https://doi.org/10.1016/j.nantod.2023.101968

Deep learning

Computer science

Materials science

Detection limit

Nanotechnology

Microscopy

Artificial intelligence

Biological system

Optics

Physics

article

인용수 21

2023

Full‐Control and Switching of Optical Fano Resonance by Continuum State Engineering

Joo Hwan Ko, Jin‐Hwi Park, Young Jin Yoo, Sehui Chang, Jiwon Kang, Aiguo Wu, Fang Yang, Sejeong Kim, Hae‐Gon Jeon, Young Min Song

IF 14.3 (2023)

Advanced Science

https://doi.org/10.1002/advs.202304310

Fano resonance

Fano plane

Resonator

Polarization (electrochemistry)

Optics

Materials science

Physics

Optoelectronics

Plasmon

Mathematics

article

인용수 2

2022

CMSNet: Deep Color and Monochrome Stereo

Hae‐Gon Jeon, Sunghoon Im, Jaesung Choe, Minjun Kang, Joon‐Young Lee, Martial Hebert

IF 19.5 (2022)

International Journal of Computer Vision

https://doi.org/10.1007/s11263-021-01565-6

Monochrome

Artificial intelligence

Computer vision

Computer science

Chrominance

Noise (video)

Computer stereo vision

Convolutional neural network

Luminance

Color image