RnDCircle Logo
손진희 연구실
포항공과대학교 인공지능대학원 손진희 교수
Referring Image Segmentation
Vision-Language Interaction
Self-supervised Visual Intelligence
손진희 교수 연구실
기본 정보
연구 분야
프로젝트
논문
구성원

손진희 연구실

포항공과대학교 인공지능대학원 손진희 교수

손진희 연구실은 인공지능대학원에서 시각지능과 멀티모달 학습을 기반으로 픽셀 단위 예측과 객체 위치추정, 적대적 교란의 보안 응용을 함께 수행합니다. Referring Image Segmentation에서는 단일 인코더 구조로 두 양식의 밀집 상호작용을 모델링하고, 수작업 라벨 없이 pseudo supervisions을 생성하는 전략을 적용합니다. 또한 자기지도 기반 표현을 활용한 무지도 객체 위치추정의 설명 가능성을 representer point selection으로 구현합니다. 더불어 데이터 접근 없이도 전이성이 높은 보편 적대 교란과 확산 모델 편집에 대한 universal image immunization을 연구합니다.

Referring Image SegmentationVision-Language InteractionSelf-supervised Visual IntelligenceUnsupervised Object LocalizationPseudo-supervision Generation
대표 연구 분야
연구 영역 전체보기
단일 인코더 기반 시각-언어 지시 분할 및 의사감독 생성 연구 thumbnail
단일 인코더 기반 시각-언어 지시 분할 및 의사감독 생성 연구
Single-encoder Vision-Language Referring Image Segmentation and Pseudo-supervision Generation
연구 분야 상세보기
연구 성과 추이
표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

5개년 연도별 논문 게재 수

6총합

5개년 연도별 피인용 수

28총합
주요 논문
5
논문 전체보기
1
preprint
|
인용수 0
·
2026
Universal Image Immunization against Diffusion-based Image Editing via Semantic Injection
Chanhui Lee, Seunghyun Shin, Donggyu Choi, Hae‐Gon Jeon, Jeany Son
Open MIND
최근 확산(diffusion) 모델의 발전은 자연어 프롬프트에 의해 유도되는 강력한 이미지 편집 능력을 가능하게 하여 새로운 창의적 가능성을 열었다. 그러나 이러한 기술은 딥페이크와 저작권이 있는 시각 콘텐츠의 무단 사용과 같은 중대한 윤리적·법적 위험을 야기한다. 이러한 위험에 대응하기 위해, 이미지 면역화(image immunization)가 AI 기반 의미론적 조작에 대한 유망한 방어책으로 부상하였다. 그럼에도 불구하고 대부분의 기존 접근법은 이미지별 적대적 교란(adversarial perturbations)에 의존하며, 각 이미지에 대해 개별 최적화를 요구함으로써 확장성 및 실용성이 제한된다. 본 논문에서는 확산 기반 편집 파이프라인을 위해 특별히 설계된 단일의 범용(adversarial) 교란을 생성하는 최초의 범용 이미지 면역화 프레임워크를 제안한다. 표적 공격에서 사용되는 범용 적대적 교란(universal adversarial perturbation, UAP) 기법에 영감을 받아, 우리의 방법은 보호하고자 하는 이미지에 의미론적 목표(semantic target)를 내재시키는 UAP를 생성한다. 동시에 원래 콘텐츠를 억제함으로써 편집 과정에서 모델의 주의를 효과적으로 오도한다. 그 결과, 우리의 접근법은 UAP를 통해 이미지의 원래 의미론적 콘텐츠를 덮어써 악의적인 편집 시도를 효과적으로 차단한다. 또한 본 방법은 학습 데이터나 도메인 지식에 대한 접근을 요구하지 않는 데이터 프리(data-free) 설정에서도 효과적으로 동작하여, 실제 환경에서의 실용성과 광범위한 적용 가능성을 한층 더 높인다. 광범위한 실험 결과, 본 방법은 최초의 범용 면역화 접근으로서 UAP 설정에서 여러 기준 모델(baselines)보다 유의미하게 성능이 우수함을 보였다. 더 나아가 범용 교란의 고유한 어려움에도 불구하고, 본 방법은 보다 제한된 교란 예산에서 이미지별 방식과 동등한 수준의 성능을 달성하며, 서로 다른 확산 모델 간에서도 강한 블랙박스 전이성(black-box transferability)을 보여준다.
https://doi.org/10.48550/arxiv.2602.14679
Adversarial system
Image editing
Transferability
Limiting
Scalability
Image (mathematics)
Visualization
2
article
|
인용수 0
·
2026
Universal Image Immunization against Diffusion-based Image Editing via Semantic Injection
Chanhui Lee, Seunghyun Shin, Donggyu Choi, Hae‐Gon Jeon, Jeany Son
arXiv (Cornell University)
최근 확산(diffusion) 모델의 발전은 자연어 프롬프트에 의해 유도되는 강력한 이미지 편집 기능을 가능하게 하여 새로운 창의적 가능성을 열었다. 그러나 이러한 기술은 딥페이크와 저작권이 있는 시각 콘텐츠의 무단 사용과 같은 중대한 윤리적·법적 위험을 함께 초래한다. 이러한 위험에 대응하기 위해 이미지 면역화(image immunization)는 AI 기반 의미론적 조작에 대한 유망한 방어책으로 부상하였다. 그럼에도 불구하고 대부분의 기존 접근법은 이미지별 맞춤 최적화를 필요로 하는 이미지 특화 적대적 교란(image-specific adversarial perturbations)에 의존하므로, 확장성과 실용성에 한계가 있다. 본 논문에서는 확산 기반 편집 파이프라인을 위해 특별히 설계된 단일의 보편적 적대적 교란( UAP )을 생성하는 최초의 범용 이미지 면역화 프레임워크를 제안한다. 표적 공격에서 사용되는 범용 적대적 교란(universal adversarial perturbation, UAP) 기법에서 영감을 받아, 본 방법은 보호 대상 이미지에 의미론적 표적(semantic target)을 내재시키는 UAP를 생성한다. 동시에 원본 콘텐츠를 억제하여 편집 과정에서 모델의 주의(attention)를 효과적으로 오도한다. 그 결과, 본 접근법은 UAP를 통해 이미지의 원본 의미론적 콘텐츠를 덮어씀으로써 악의적 편집 시도를 효과적으로 차단한다. 또한 본 방법은 학습 데이터나 도메인 지식에 대한 접근 없이도 요구하지 않는 데이터-프리(data-free) 설정에서도 효과적으로 작동하여, 실제 환경에서의 실용성과 광범위한 적용 가능성을 더욱 향상시킨다. 광범위한 실험 결과, 본 방법은 최초의 범용 면역화 접근으로서 UAP 설정에서 여러 기준 방법(baseline)보다 유의미하게 우수한 성능을 보인다. 더 나아가, 범용 교란의 내재적 어려움에도 불구하고, 본 방법은 보다 제한된 교란 예산 하에서 이미지 특화 방법과 동등한 수준의 성능을 달성하며, 서로 다른 확산 모델 간에서도 강한 블랙박스 전이성(transferability)을 보여준다.
http://arxiv.org/abs/2602.14679
Adversarial system
Image editing
Transferability
Limiting
Scalability
Image (mathematics)
Visualization
3
preprint
|
인용수 0
·
2025
Data-free Universal Adversarial Perturbation with Pseudo-semantic Prior
Chanhui Lee, Yeonghwan Song, Jeany Son
ArXiv.org
데이터 비의존 보편적 적대적 교란(Data-free Universal Adversarial Perturbation, UAP)은 데이터 사전지식에 의존하지 않고 무작위 잡음만으로 생성된 단일 교란을 사용하여, 이미지에 무관하게 심층 신경망을 기만하는 공격이다. 그러나 기존의 데이터 비의존 UAP 방법들은 무작위 잡음에 의미(semantic) 내용이 부재하기 때문에 전이 가능성이 제한되는 문제가 자주 발생한다. 이러한 문제를 해결하기 위해, 우리는 학습 과정에서 UAP로부터 의사-의미적(pseudo-semantic) 사전지식을 재귀적으로 추출하여, 데이터 비의존 UAP 프레임워크 내의 의미 내용을 풍부하게 하는 새로운 데이터 비의존 보편 공격 방법을 제안한다. 우리의 접근은 영역 샘플링(region sampling)을 통해 UAP 안에 내재된 잠재 의미 정보를 효과적으로 활용하며, 의미 단서의 부재로 인해 전통적인 데이터 비의존 UAP 방법에서는 일반적으로 비효율적인 입력 변환(input transformations)에서도 성공을 가능하게 하고, 블랙박스 전이 가능성을 유의미하게 향상시킨다. 또한 무작위 샘플링과 변환으로 인해 발생할 수 있는 잠재적 불균형을 완화하기 위해, UAP의 영향을 상대적으로 덜 받는 어려운 예(hard examples)에 더 큰 비중을 두는 표본 재가중(sample reweighting) 기법을 도입한다. ImageNet에 대한 포괄적 실험 결과, 본 방법은 평균 기만률(average fooling rate)에서 상당한 격차로 최첨단 성능을 달성하였고, 기존 데이터 비의존 UAP 방법에 비해 다양한 CNN 아키텍처 전반에서 공격 전이 가능성을 현저히 개선했으며, 나아가 데이터 의존적 UAP 방법을 포함하여 그 성능을 능가한다. 코드는 다음에서 제공된다: https://github.com/ChnanChan/PSP-UAP.
http://arxiv.org/abs/2502.21048
Adversarial system
Transferability
Prior probability
Perturbation (astronomy)
Deep neural networks
Semantics (computer science)
Random noise
최신 정부 과제
17
과제 전체보기
1
2025년 8월-2026년 8월
|94,569,000
객체 중심 시각 정보 기반 멀티모달 AI 지식 통합 기술 개발
본 연구실은 초거대 멀티 모달 모델이 가지는 인지적 가소성을 제어함으로써, 다양한 현실 상황 속에서 모델이 유연하게 적응하고 진화할 수 있는 기반 기술을 개발하는 것을 궁극적 목표로 한다. 이를 달성하기 위해, 본 과제에서는 다음 조건을 충족하는 핵심 기술 개발을 최종 목표로 설정한다: 즉 모델이 활용 가능한 다양한 모달리티에 대해 객체 단위 수준에서 의미...
인공지능
멀티모달
객체 중심
시각 표현
지식 통합
2
주관|
2023년 7월-2025년 12월
|441,000,000
청각장애인과 청인의 의사소통을 위한 인공지능 기반 수어 통번역 서비스 기술 개발
본 과제는 한국수어를 제1언어로 사용하는 청각장애인이 공공기관·문화기반 시설에서 수어 통역사 없이도 청인과 기본 의사소통을 할 수 있게 하는 인공지능 기반 양방향 한국수어 통·번역 서비스 기술을 개발하는 연구임. 연구 목표는 한국어-한국수어 번역기, 수어인식·영상인식, 전시해설용 음성인식 및 음성합성, 수어 아바타, 지능형 수어 UI/UX가 결합된 스마트 플랫폼 구축임. 핵심 연구 내용은 한국수어 말뭉치·모션데이터 수집, 신경망 기계번역 파이프라인 설계, 확률/통계학적 제스처 인식 모델, 수형/비수지 구현 최적화 아바타 개발, 수어 영상 스크립트 생성 시스템 설계임. 기대 효과는 수어 인식률과 개인 어휘력 고려 맞춤형 서비스 고도화 및 반복적 완성도 제고, 수어 관련 수집 데이터 공공화로 지속 연구 확대 유도됨.
청각장애인
가상 캐릭터
영상인식
한국수어
음성인식
3
2023년 7월-2025년 12월
|1,021,164,000
청각장애인과 청인의 의사소통을 위한 인공지능 기반 수어 통번역 서비스 기술 개발
한국수어를 제1언어로 사용하는 청각장애인이 공공기관 또는 문화기반 시설 등에서 수어 통역사 부재 시 청인과 기본적인 의사소통을 보조해 주는 인공지능 기반 양방향 한국수어 통·번역 서비스 기술을 개발함
청각장애인
가상 캐릭터
영상인식
한국수어
음성인식
최신 특허
특허 전체보기
상태출원연도과제명출원번호상세정보
공개2023참조 이미지 세그멘테이션 방법 및 장치1020230159100
공개2023오브젝트 로컬리라이제이션 방법 및 장치1020230156160
전체 특허

참조 이미지 세그멘테이션 방법 및 장치

상태
공개
출원연도
2023
출원번호
1020230159100

오브젝트 로컬리라이제이션 방법 및 장치

상태
공개
출원연도
2023
출원번호
1020230156160

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.