손진희 교수 연구실 | 포항공과대학교 인공지능대학원

손진희 연구실

포항공과대학교 인공지능대학원 손진희 교수

Referring Image Segmentation

Vision-Language Interaction

Self-supervised Visual Intelligence

손진희 교수 연구실

홈

기본 정보

연구 분야

프로젝트

논문

구성원

홈

손진희 연구실

포항공과대학교 인공지능대학원 손진희 교수

손진희 연구실은 인공지능대학원에서 시각지능과 멀티모달 학습을 기반으로 픽셀 단위 예측과 객체 위치추정, 적대적 교란의 보안 응용을 함께 수행합니다. Referring Image Segmentation에서는 단일 인코더 구조로 두 양식의 밀집 상호작용을 모델링하고, 수작업 라벨 없이 pseudo supervisions을 생성하는 전략을 적용합니다. 또한 자기지도 기반 표현을 활용한 무지도 객체 위치추정의 설명 가능성을 representer point selection으로 구현합니다. 더불어 데이터 접근 없이도 전이성이 높은 보편 적대 교란과 확산 모델 편집에 대한 universal image immunization을 연구합니다.

Referring Image SegmentationVision-Language InteractionSelf-supervised Visual IntelligenceUnsupervised Object LocalizationPseudo-supervision Generation

대표 연구 분야

연구 영역 전체보기

단일 인코더 기반 시각-언어 지시 분할 및 의사감독 생성 연구

Single-encoder Vision-Language Referring Image Segmentation and Pseudo-supervision Generation

연구 분야 상세보기

단일 인코더 기반 시각-언어 지시 분할 및 의사감독 생성 연구

Single-encoder Vision-Language Referring Image Segmentation and Pseudo-supervision Generation

연구 분야 상세보기

Representer Point Selection 기반 무지도 객체 위치추정 연구

Unsupervised Object Localization with Representer Point Selection

연구 분야 상세보기

데이터프리 보편 적대 교란과 확산 편집 면역화 연구

Data-free Universal Adversarial Perturbation and Diffusion-based Image Editing Immunization

연구 분야 상세보기

연구 성과 추이

표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

5개년 연도별 논문 게재 수

6총합

5개년 연도별 피인용 수

28총합

주요 논문

논문 전체보기

preprint

인용수 0

2026

Universal Image Immunization against Diffusion-based Image Editing via Semantic Injection

Chanhui Lee, Seunghyun Shin, Donggyu Choi, Hae‐Gon Jeon, Jeany Son

Open MIND

최근 확산(diffusion) 모델의 발전은 자연어 프롬프트에 의해 유도되는 강력한 이미지 편집 능력을 가능하게 하여 새로운 창의적 가능성을 열었다. 그러나 이러한 기술은 딥페이크와 저작권이 있는 시각 콘텐츠의 무단 사용과 같은 중대한 윤리적·법적 위험을 야기한다. 이러한 위험에 대응하기 위해, 이미지 면역화(image immunization)가 AI 기반 의미론적 조작에 대한 유망한 방어책으로 부상하였다. 그럼에도 불구하고 대부분의 기존 접근법은 이미지별 적대적 교란(adversarial perturbations)에 의존하며, 각 이미지에 대해 개별 최적화를 요구함으로써 확장성 및 실용성이 제한된다. 본 논문에서는 확산 기반 편집 파이프라인을 위해 특별히 설계된 단일의 범용(adversarial) 교란을 생성하는 최초의 범용 이미지 면역화 프레임워크를 제안한다. 표적 공격에서 사용되는 범용 적대적 교란(universal adversarial perturbation, UAP) 기법에 영감을 받아, 우리의 방법은 보호하고자 하는 이미지에 의미론적 목표(semantic target)를 내재시키는 UAP를 생성한다. 동시에 원래 콘텐츠를 억제함으로써 편집 과정에서 모델의 주의를 효과적으로 오도한다. 그 결과, 우리의 접근법은 UAP를 통해 이미지의 원래 의미론적 콘텐츠를 덮어써 악의적인 편집 시도를 효과적으로 차단한다. 또한 본 방법은 학습 데이터나 도메인 지식에 대한 접근을 요구하지 않는 데이터 프리(data-free) 설정에서도 효과적으로 동작하여, 실제 환경에서의 실용성과 광범위한 적용 가능성을 한층 더 높인다. 광범위한 실험 결과, 본 방법은 최초의 범용 면역화 접근으로서 UAP 설정에서 여러 기준 모델(baselines)보다 유의미하게 성능이 우수함을 보였다. 더 나아가 범용 교란의 고유한 어려움에도 불구하고, 본 방법은 보다 제한된 교란 예산에서 이미지별 방식과 동등한 수준의 성능을 달성하며, 서로 다른 확산 모델 간에서도 강한 블랙박스 전이성(black-box transferability)을 보여준다.

https://doi.org/10.48550/arxiv.2602.14679

Adversarial system

Image editing

Transferability

Limiting

Scalability

Image (mathematics)

Visualization

article

인용수 0

2026

Universal Image Immunization against Diffusion-based Image Editing via Semantic Injection

Chanhui Lee, Seunghyun Shin, Donggyu Choi, Hae‐Gon Jeon, Jeany Son

arXiv (Cornell University)

최근 확산(diffusion) 모델의 발전은 자연어 프롬프트에 의해 유도되는 강력한 이미지 편집 기능을 가능하게 하여 새로운 창의적 가능성을 열었다. 그러나 이러한 기술은 딥페이크와 저작권이 있는 시각 콘텐츠의 무단 사용과 같은 중대한 윤리적·법적 위험을 함께 초래한다. 이러한 위험에 대응하기 위해 이미지 면역화(image immunization)는 AI 기반 의미론적 조작에 대한 유망한 방어책으로 부상하였다. 그럼에도 불구하고 대부분의 기존 접근법은 이미지별 맞춤 최적화를 필요로 하는 이미지 특화 적대적 교란(image-specific adversarial perturbations)에 의존하므로, 확장성과 실용성에 한계가 있다. 본 논문에서는 확산 기반 편집 파이프라인을 위해 특별히 설계된 단일의 보편적 적대적 교란( UAP )을 생성하는 최초의 범용 이미지 면역화 프레임워크를 제안한다. 표적 공격에서 사용되는 범용 적대적 교란(universal adversarial perturbation, UAP) 기법에서 영감을 받아, 본 방법은 보호 대상 이미지에 의미론적 표적(semantic target)을 내재시키는 UAP를 생성한다. 동시에 원본 콘텐츠를 억제하여 편집 과정에서 모델의 주의(attention)를 효과적으로 오도한다. 그 결과, 본 접근법은 UAP를 통해 이미지의 원본 의미론적 콘텐츠를 덮어씀으로써 악의적 편집 시도를 효과적으로 차단한다. 또한 본 방법은 학습 데이터나 도메인 지식에 대한 접근 없이도 요구하지 않는 데이터-프리(data-free) 설정에서도 효과적으로 작동하여, 실제 환경에서의 실용성과 광범위한 적용 가능성을 더욱 향상시킨다. 광범위한 실험 결과, 본 방법은 최초의 범용 면역화 접근으로서 UAP 설정에서 여러 기준 방법(baseline)보다 유의미하게 우수한 성능을 보인다. 더 나아가, 범용 교란의 내재적 어려움에도 불구하고, 본 방법은 보다 제한된 교란 예산 하에서 이미지 특화 방법과 동등한 수준의 성능을 달성하며, 서로 다른 확산 모델 간에서도 강한 블랙박스 전이성(transferability)을 보여준다.

http://arxiv.org/abs/2602.14679

Adversarial system

Image editing

Transferability

Limiting

Scalability

Image (mathematics)

Visualization

preprint

인용수 0

2025

Data-free Universal Adversarial Perturbation with Pseudo-semantic Prior

Chanhui Lee, Yeonghwan Song, Jeany Son

ArXiv.org

데이터 비의존 보편적 적대적 교란(Data-free Universal Adversarial Perturbation, UAP)은 데이터 사전지식에 의존하지 않고 무작위 잡음만으로 생성된 단일 교란을 사용하여, 이미지에 무관하게 심층 신경망을 기만하는 공격이다. 그러나 기존의 데이터 비의존 UAP 방법들은 무작위 잡음에 의미(semantic) 내용이 부재하기 때문에 전이 가능성이 제한되는 문제가 자주 발생한다. 이러한 문제를 해결하기 위해, 우리는 학습 과정에서 UAP로부터 의사-의미적(pseudo-semantic) 사전지식을 재귀적으로 추출하여, 데이터 비의존 UAP 프레임워크 내의 의미 내용을 풍부하게 하는 새로운 데이터 비의존 보편 공격 방법을 제안한다. 우리의 접근은 영역 샘플링(region sampling)을 통해 UAP 안에 내재된 잠재 의미 정보를 효과적으로 활용하며, 의미 단서의 부재로 인해 전통적인 데이터 비의존 UAP 방법에서는 일반적으로 비효율적인 입력 변환(input transformations)에서도 성공을 가능하게 하고, 블랙박스 전이 가능성을 유의미하게 향상시킨다. 또한 무작위 샘플링과 변환으로 인해 발생할 수 있는 잠재적 불균형을 완화하기 위해, UAP의 영향을 상대적으로 덜 받는 어려운 예(hard examples)에 더 큰 비중을 두는 표본 재가중(sample reweighting) 기법을 도입한다. ImageNet에 대한 포괄적 실험 결과, 본 방법은 평균 기만률(average fooling rate)에서 상당한 격차로 최첨단 성능을 달성하였고, 기존 데이터 비의존 UAP 방법에 비해 다양한 CNN 아키텍처 전반에서 공격 전이 가능성을 현저히 개선했으며, 나아가 데이터 의존적 UAP 방법을 포함하여 그 성능을 능가한다. 코드는 다음에서 제공된다: https://github.com/ChnanChan/PSP-UAP.

http://arxiv.org/abs/2502.21048

Adversarial system

Transferability

Prior probability

Perturbation (astronomy)

Deep neural networks

Semantics (computer science)

Random noise

최신 정부 과제

과제 전체보기

2025년 8월-2026년 8월

|94,569,000원

객체 중심 시각 정보 기반 멀티모달 AI 지식 통합 기술 개발

본 연구실은 초거대 멀티 모달 모델이 가지는 인지적 가소성을 제어함으로써, 다양한 현실 상황 속에서 모델이 유연하게 적응하고 진화할 수 있는 기반 기술을 개발하는 것을 궁극적 목표로 한다. 이를 달성하기 위해, 본 과제에서는 다음 조건을 충족하는 핵심 기술 개발을 최종 목표로 설정한다: 즉 모델이 활용 가능한 다양한 모달리티에 대해 객체 단위 수준에서 의미...

인공지능

멀티모달

객체 중심

시각 표현

지식 통합

주관|

2023년 7월-2025년 12월

|441,000,000원

청각장애인과 청인의 의사소통을 위한 인공지능 기반 수어 통번역 서비스 기술 개발

본 과제는 한국수어를 제1언어로 사용하는 청각장애인이 공공기관·문화기반 시설에서 수어 통역사 없이도 청인과 기본 의사소통을 할 수 있게 하는 인공지능 기반 양방향 한국수어 통·번역 서비스 기술을 개발하는 연구임. 연구 목표는 한국어-한국수어 번역기, 수어인식·영상인식, 전시해설용 음성인식 및 음성합성, 수어 아바타, 지능형 수어 UI/UX가 결합된 스마트 플랫폼 구축임. 핵심 연구 내용은 한국수어 말뭉치·모션데이터 수집, 신경망 기계번역 파이프라인 설계, 확률/통계학적 제스처 인식 모델, 수형/비수지 구현 최적화 아바타 개발, 수어 영상 스크립트 생성 시스템 설계임. 기대 효과는 수어 인식률과 개인 어휘력 고려 맞춤형 서비스 고도화 및 반복적 완성도 제고, 수어 관련 수집 데이터 공공화로 지속 연구 확대 유도됨.

청각장애인

가상 캐릭터

영상인식

한국수어

음성인식

2023년 7월-2025년 12월

|1,021,164,000원

청각장애인과 청인의 의사소통을 위한 인공지능 기반 수어 통번역 서비스 기술 개발

한국수어를 제1언어로 사용하는 청각장애인이 공공기관 또는 문화기반 시설 등에서 수어 통역사 부재 시 청인과 기본적인 의사소통을 보조해 주는 인공지능 기반 양방향 한국수어 통·번역 서비스 기술을 개발함

청각장애인

가상 캐릭터

영상인식

한국수어

음성인식

최신 특허

특허 전체보기

상태	출원연도	과제명	출원번호	상세정보
공개	2023	참조 이미지 세그멘테이션 방법 및 장치	1020230159100
공개	2023	오브젝트 로컬리라이제이션 방법 및 장치	1020230156160