RnDCircle Logo
이정범 연구실
고려대학교 컴퓨터학과 이정범 교수
연구 영역
기본 정보
논문·특허
구성원

이정범 연구실

고려대학교 컴퓨터학과 이정범 교수

이정범 연구실은 고려대학교 컴퓨터학과 소속으로 연구를 수행합니다. 제공된 연구 키워드, 논문, 특허, 과제, 장비 정보가 없어 구체적인 원천 기술 사양과 성과 기반 연구 주제의 확인은 제한됩니다. 다만 컴퓨터학과 분야에서 데이터 기반 분석, 소프트웨어 및 시스템 구현, 인공지능 활용 가능성으로 이어질 수 있는 연구 방향을 중심으로 연구 수행 절차를 체계화하는 방식으로 운영되는 것으로 해석할 수 있습니다.

대표 연구 분야
연구 영역 전체보기
인공지능 학습 및 추론 기반 지능화 연구 thumbnail
인공지능 학습 및 추론 기반 지능화 연구
Intelligent Learning and Inference for AI Systems
연구 분야 상세보기
연구 성과 추이
표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

5개년 연도별 논문 게재 수

19총합

5개년 연도별 피인용 수

528총합
최신 논문
27
논문 전체보기
1
Article
|
인용수 0
·
2024
Toward Interactive Regional Understanding in Vision-Large Language Models
Jungbeom Lee, Sanghyuk Chun, Sangdoo Yun
정범 리, 상혁 천, 상두 윤. Computational Linguistics 학회 북미 지부(Association for Computational Linguistics: North American Chapter) 2024년 학술대회 논문집: 인문 언어 기술(Human Language Technologies) (제1권: 장편 논문). 2024.
http://dx.doi.org/10.18653/v1/2024.naacl-long.356
Computer science
Human–computer interaction
Artificial intelligence
Natural language processing
2
Preprint
|
인용수 7
·
2023
Improving Visual Prompt Tuning for Self-supervised Vision Transformers
Seungryong Yoo, Eunji Kim, Dahuin Jung, Jungbeom Lee, Sungroh Yoon
arXiv (Cornell University)
시각 프롬프트 튜닝(Visual Prompt Tuning, VPT)은 사전학습된 비전 트랜스포머(Vision Transformers, ViT)를 하위 과제에 맞게 조정하는 데 효과적인 튜닝 방법이다. VPT는 동결된 사전학습 ViT를 이끄는 추가 학습 가능한 토큰인 프롬프트를 활용한다. VPT는 지도 학습 비전 트랜스포머에서의 적용 가능성을 보여주었으나, 종종 자기지도 학습 모델에서는 성능이 저하된다. 경험적 관찰을 통해, VPT의 효과는 프롬프트 토큰이 상호작용하는 ViT 블록에 크게 좌우된다는 점을 추론하였다. 구체적으로, VPT는 프롬프트 토큰을 첫 번째 블록이 아니라 더 뒤의 블록에 삽입할 때, MAE 및 MoCo v3에 대한 이미지 분류 과제에서 성능이 향상된다. 이러한 관찰은 프롬프트 토큰 삽입을 위한 블록의 최적 위치가 존재함을 시사한다. 그러나 다양한 미래 시나리오에서 각 자기지도 학습 ViT에 대해 프롬프트의 최적 블록을 식별하는 과정은 비용이 많이 든다. 이 문제를 완화하기 위해, 각 ViT 블록마다 프롬프트 토큰에 대한 개입(intervention)을 조정하는 게이트를 학습하는 간단하면서도 효과적인 방법을 제안한다. 본 방법에서는 과제 적응을 위해 조향(steering)이 필요한 블록에 의해 프롬프트 토큰이 선택적으로 영향을 받는다. 우리의 방법은 FGVC 및 VTAB 이미지 분류와 ADE20K 의미론적 분할에서 VPT 변형들보다 우수한 성능을 보인다. 코드는 https://github.com/ryongithub/GatedPromptTuning 에서 제공된다.
http://arxiv.org/abs/2306.05067
Computer science
Transformer
Segmentation
Artificial intelligence
Machine learning
Code (set theory)
Block (permutation group theory)
Pattern recognition (psychology)
Set (abstract data type)
Mathematics
3
Article
|
·
인용수 16
·
2023
Weakly Supervised Referring Image Segmentation with Intra-Chunk and Inter-Chunk Consistency
Jungbeom Lee, Sungjin Lee, Jinseok Nam, Seunghak Yu, Jaeyoung Do, Tara Taghavi
지시(지시어) 이미지 분할(referring image segmentation)은 자연어 표현으로 지시된 이미지에서 객체의 위치를 국소화하는 것을 목표로 한다. 대부분의 선행 연구는 분할 라벨을 포함한 대규모 데이터셋으로 지시 이미지 분할을 학습하지만, 이는 비용이 많이 든다. 본 연구에서는 손쉽게 이용 가능한 이미지-텍스트 쌍만을 사용하는, 약지도(weakly supervised) 학습 기반 지시 이미지 분할 방법을 제안한다. 먼저 이미지-텍스트 매칭을 위한 시각-언어 모델을 학습하고, Grad-CAM을 통해 시각적 중요도(saliency) 맵을 추출하여 각 단어에 대응되는 이미지 영역을 식별한다. 그러나 Grad-CAM에는 두 가지 주요 문제가 있음을 발견하였다. 첫째, 단어 간의 핵심 의미 관계를 고려하지 못한다. 우리는 단어 간의 관계를 intra-chunk 및 inter-chunk 일관성을 통해 모델링함으로써 이 문제를 해결한다. 둘째, Grad-CAM은 지시된 객체의 작은 영역만을 식별하여 재현율(recall)이 낮다. 따라서 우리는 Transformer의 self-attention과 비지도 객체 형태 prior를 이용하여 국소화 맵을 정제한다. 세 가지 인기 벤치마크(RefCOCO, RefCOCO+, G-Ref)에서, 본 방법은 최근의 비교 가능한 기법들보다 유의미하게 우수한 성능을 보인다. 또한 본 방법이 다양한 수준의 감독(supervision)에 적용 가능하며, 최근 방법들보다 더 나은 성능을 얻을 수 있음을 보여준다.
https://doi.org/10.1109/iccv51070.2023.01999
Computer science
Artificial intelligence
Segmentation
Consistency (knowledge bases)
Object (grammar)
Image segmentation
Pattern recognition (psychology)
Text segmentation
Image (mathematics)
Natural language processing