RnDCircle Logo
김진규 연구실
고려대학교 컴퓨터학과
김진규 교수
기본 정보
연구 분야
프로젝트
발행물
구성원

김진규 연구실

고려대학교 컴퓨터학과 김진규 교수

김진규 연구실은 고려대학교 컴퓨터학과를 기반으로 멀티모달 인공지능, 생성형 AI, 컴퓨터 비전, 자율주행 지능, 설명 가능한 인공지능, 그리고 인간과 상호작용하는 지능형 에이전트 기술을 폭넓게 연구하며, 시각·청각·언어 정보를 통합하는 차세대 AI 모델과 실제 환경에서 신뢰성 있게 동작하는 응용 시스템 개발에 중점을 두고 있다.

대표 연구 분야
연구 영역 전체보기
멀티모달 인공지능과 생성형 모델 thumbnail
멀티모달 인공지능과 생성형 모델
주요 논문
5
논문 전체보기
1
article
|
인용수 4
·
2024
Audio-guided implicit neural representation for local image stylization
Seung Hyun Lee, Sieun Kim, Wonmin Byeon, Gyeongrok Oh, Sumin In, Hyeongcheol Park, Sang Ho Yoon, Sunghee Hong, Jinkyu Kim, Sangpil Kim
IF 18.3
Computational Visual Media
We present a novel framework for audio-guided localized image stylization. Sound often provides information about the specific context of a scene and is closely related to a certain part of the scene or object. However, existing image stylization works have focused on stylizing the entire image using an image or text input. Stylizing a particular part of the image based on audio input is natural but challenging. This work proposes a framework in which a user provides an audio input to localize the target in the input image and another to locally stylize the target object or scene. We first produce a fine localization map using an audio-visual localization network leveraging CLIP embedding space. We then utilize an implicit neural representation (INR) along with the predicted localization map to stylize the target based on sound information. The INR manipulates local pixel values to be semantically consistent with the provided audio input. Our experiments show that the proposed framework outperforms other audio-guided stylization methods. Moreover, we observe that our method constructs concise localization maps and naturally manipulates the target object or scene in accordance with the given audio input.
https://doi.org/10.1007/s41095-024-0413-5
Representation (politics)
Computer science
Computer graphics
Image (mathematics)
Computer graphics (images)
Graphics
Artificial intelligence
Computer vision
Artificial neural network
2
article
|
인용수 1
·
2024
Robust sound-guided image manipulation
Seung Hyun Lee, Hyung‐gun Chi, Gyeongrok Oh, Wonmin Byeon, Sang Ho Yoon, Hyunje Park, Wonjun Cho, Jinkyu Kim, Sangpil Kim
IF 6.3
Neural Networks
https://doi.org/10.1016/j.neunet.2024.106271
Computer science
Artificial intelligence
Image (mathematics)
Sound (geography)
Computer vision
Acoustics
3
article
|
인용수 4
·
2024
FPANet: Frequency-based video demoiréing using frame-level post alignment
Gyeongrok Oh, Sungjune Kim, Sungjune Kim, Heon Gu, Sang Ho Yoon, Jinkyu Kim, Sangpil Kim, Sangpil Kim
IF 6.3
Neural Networks
https://doi.org/10.1016/j.neunet.2024.107021
Computer science
Frame (networking)
Artificial intelligence
Computer vision
Pattern recognition (psychology)
Telecommunications
정부 과제
8
과제 전체보기
1
2024년 3월-2027년 12월
|1,990,000,000
LLM 기반 응용서비스 기술 개발을 통한 생성 AI 인재양성
자체 개발한 생성 AI 파운데이션 모델을 활용하여 기업과 대학 이 함께 실수요에 기반한 4가지 생성 AI 기술을 연구개발하는 프로젝트를 진행하며 실무형 고급인재를 육성하는 것을 목표
생성형 인공지능
인재 양성
파운데이션 모델
거대언어모델
멀티모달 언어모델
2
2022년 3월-2026년 12월
|1,742,100,000
개성 형성이 가능한 에이전트 플랫폼 기술 개발
모사 대상과 인지적 상호 작용을 통하여 자신의 페르소나를 형성해 가는 인공지능 에이전트 기술 개발ㅇ 모사 대상에 대한 멀티 모달 정보로 개성을 형성하고 상대에 맞게 학습하며 사회성을 가지는 인공지능 에이전트 기술 개발ㅇ 형성된 개성을 기반으로 상호 작용에 따라 새로운 개성을 생성하기 위해 모방, 변형, 조합, 예측 등을 수행하며 진화하는 개성 형성 기술 개...
개성
휴먼 컴퓨터 인터랙션
다중 양상
사회성
지능형 에이전트
3
주관|
2022년 3월-2026년 12월
|2,000,000,000
개성 형성이 가능한 에이전트 플랫폼 기술 개발
□ 주관연구개발기관 (한국전자기술연구원) ㅇ 멀티모달 정보를 이용하여 모사 대상과 에이전트가 상호 작용 하는 기술 ㅇ 모사 대상의 감정/의도를 인식하고 에이전트에 반영하여 사회성을 형성하는 기술 ㅇ 개성에 대한 다양한 평가를 위한 방법 연구 ㅇ 모사 대상에 따라 개성 학습에 적합한 잠재 변수를 도출하는 기술 □ 공동연구개발기관 1 (고려대학교) ㅇ 멀티모달 정보를 이용하여 모사 대상과 에이전트가 상호 작용 하는 기술 ㅇ 모사 대상의 감정/의도를 인식하고 에이전트에 반영하여 사회성을 형성하는 기술 ㅇ 개성 범주 별 인공지능 모델 구축 및 선택을 통한 개성 특화형 에이전트 학습 기술 연구 □ 공동연구개발기관 2 (서울과학기술대학교) ㅇ 모사 대상에 따라 개성 학습에 적합한 잠재 변수를 도출하는 기술 ㅇ 개성 학습에 대한 인공지능 모델 내 잠재 변수의 영향을 평가하는 기술 ㅇ 모사 대상의 개성 정보를 정형화(임베딩) 하는 기술 □ 공동연구개발기관 3 (성균관대학교) ㅇ 모사 대상 데이터에 따라 개성 학습에 적합한 잠재 변수를 도출하는 기술 ㅇ 모사 대상의 추가적인 멀티모달 정보로부터 진화된 개성을 학습하는 기술 ㅇ 모사 대상의 점진적 개성 변이에 능동적으로 대응하며 학습하는 기술 □ 공동연구개발기관 4 ((주)아크릴) ㅇ 개별 개성 모델을 체계적으로 데이터베이스화 하는 시스템 기술 개발 ㅇ 사용자의 요구에 따라 기본 개성 모델을 조합하여 제공하는 플랫폼 기술 ㅇ 에이전트 기본 개성 범주 정의 및 범주별 학습 및 평가 데이터 구축 ㅇ 인공지능 에이전트 개성 학습 플랫폼 기반 에이전트 서비스
개성
다중 양상
사회성
지능형 에이전트
휴먼 컴퓨터 인터랙션
최신 특허
특허 전체보기
상태출원연도과제명출원번호상세정보
공개20243차원 객체 탐지 방법 및 그 장치1020240099581
공개2024인공지능을 이용한 객체 간 상호작용 분석을 통한 경로 예측 방법 및 이를 이용하는 모빌리티 장치1020240038555
공개2024자율 주행을 위한 에이전트의 거동 예측 방법 및 모빌리티 장치1020240034457
전체 특허

3차원 객체 탐지 방법 및 그 장치

상태
공개
출원연도
2024
출원번호
1020240099581

인공지능을 이용한 객체 간 상호작용 분석을 통한 경로 예측 방법 및 이를 이용하는 모빌리티 장치

상태
공개
출원연도
2024
출원번호
1020240038555

자율 주행을 위한 에이전트의 거동 예측 방법 및 모빌리티 장치

상태
공개
출원연도
2024
출원번호
1020240034457