논문 | 김은솔 교수 연구실 | 한양대학교 컴퓨터소프트웨어학부

김은솔 교수 연구실

홈

기본 정보

연구 분야

프로젝트

논문

구성원

논문

연구 성과 추이

표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

5개년 연도별 논문 게재 수

26총합

5개년 연도별 피인용 수

673총합

주요 논문

*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.

article

인용수 3

2024

Compositional Video Understanding with Spatiotemporal Structure-based Transformers

Hoyeoung Yun, Jinwoo Ahn, Minseo Kim, Eun‐Sol Kim

본 논문에서는 긴 비디오 입력을 통해 복잡한 의미 구조를 이해하기 위한 새로운 참신한 방법을 제안한다. 기존의 비디오 이해 방법들은 단기 클립에 집중해 왔으며, 합성곱 신경망 또는 트랜스포머 아키텍처를 사용하여 해당 단기 클립을 위한 시각적 표현을 얻도록 학습되어 있다. 그러나 대부분의 현실 세계 비디오는 수 분에서 수 시간에 이르는 긴 비디오로 구성되므로, 이를 작은 클립으로 분할하고 그로부터 표현을 학습하는 방식은 본질적으로 긴 비디오 전체의 의미 구조를 이해하는 데 한계를 초래한다. 본 연구에서는 객체 기반 표현을 의미 단위로 정의하고, 그들 사이에 시공간적 고차 관계를 설정함으로써 비디오의 다중 과립(다중 그레인) 의미 구조를 학습하기 위한 새로운 알고리즘을 제안한다. 제안 방법은 시공간 그래프를 학습할 수 있는 새로운 트랜스포머 아키텍처와, 각 의미 단위에 대해 분리된 특징을 학습하기 위한 조합적 학습(compositional learning) 방법을 포함한다. 제안된 방법을 사용하여, 보지 못한 비디오에 대한 조합적 일반화 이해(compositional generalization understanding)라는 도전적인 비디오 과제를 해결한다. 실험을 통해 두 개의 도전적인 비디오 데이터셋에서 새로운 최첨단 성능을 입증한다.

https://doi.org/10.1109/cvpr52733.2024.01774

Computer science

Transformer

Computer vision

Engineering

Electrical engineering

Voltage

article

인용수 0

2024

A New Graph Transformer Algorithm for Leveraging External Knowledge Graph

Karl An, Eun‐Sol Kim

KIISE Transactions on Computing Practices

시각적 상식 추론은 추론 시 단순한 영상 내 객체 간의 특성이나, 관계 등 시각적 정보만을 요구하는 시각적 질문응답과 비교하여 질문 이외에 장면에 대한 맥락적 이해와 관련하여 일반 상식을 요구하는 도전적인 문제다. 본 연구에서는 일반 상식과 관련한 지식을 외부 지식 체계로부터 결합하기 위한 지식 그래프 생성 및 그래프 변환기 학습 알고리즘을 제안한다. 제안 모델에서는 외부 지식 체계인 ConceptNet으로부터 주어진 양상 정보와 관련된 지식을 검색하여 지식 그래프를 생성한다. 시각 객체와 문장 객체와 함께 지식 그래프를 정점과 간선 구분 없이 하나의 입력 단위로 그래프 변환기의 입력으로 학습한다. 본 논문에서 제안한 모델의 우수성을 입증하기 위해 시각적 상식 추론 데이터 집합을 통한 실험으로 기존 모델과 개선된 성능을 비교한다.

https://doi.org/10.5626/ktcp.2024.30.11.588

Computer science

Null graph

Graph

Transformer

Algorithm

Butterfly graph

Voltage graph

Line graph

Theoretical computer science

Electrical engineering

article

인용수 1

2024

Structure-Aware Multimodal Sequential Learning for Visual Dialog

Youngjin Kim, Min-Jun Kim, Kyunghwan An, Jinwoo Ahn, Jaeseok Kim, Yu‐Jung Heo, Du-Seong Chang, Eun‐Sol Kim

Proceedings of the AAAI Conference on Artificial Intelligence

웹에서 방대한 양의 이미지 및 자연어 데이터를 수집할 수 있게 되면서 대규모 언어 모델(Large-scale Language Models, LLMs)의 비약적인 발전이 이루어졌다. 이러한 진전은 인간과의 대화에서 유창한 대화를 수행할 수 있는 챗봇과 대화 시스템의 출현으로 이어졌다. 인간과 에이전트 간의 상호작용을 가능하게 하는 장치의 다양성이 확장되고 텍스트 기반 대화 시스템의 성능이 향상됨에 따라, 최근에는 비주얼 다이얼로그(visual dialog)에 관한 연구가 제안되었다. 그러나 비주얼 다이얼로그는 이미지와 문장으로 구성된 쌍의 순차를 이해해야 하므로, 웹으로부터 대규모 모델 학습에 충분한 데이터를 수집하기가 어렵다. 본 논문에서는 각 양식(modality)별로 설계된 기존 대규모 모델을 활용하는 새로운 멀티모달 학습 방법을 제안하여, 소규모 비주얼 다이얼로그 데이터셋으로 비주얼 다이얼로그를 위한 모델 학습을 가능하게 한다. 제안 접근법의 핵심 아이디어는 다음과 같다. 1) 비주얼 다이얼로그 진행 과정에서의 이력 또는 문맥을 시공간 그래프(spatiotemporal graphs) 형태로 저장하고, 2) 양식별 모델과 그래프 사이에 소형 모듈레이션 블록(small modulation blocks)을 도입하여 의미적 공간을 정렬하는 것이다. 구현을 위해, 사전학습된 모델로부터 발화 생성에 필요한 관련 이미지 및 텍스트 지식을 검색하는 구조 인식형 크로스-어텐션(structure-aware cross-attention) 방법을 새롭게 제안한다. 실험 결과, 가장 도전적인 데이터셋인 COMET을 포함하여 세 개의 비주얼 다이얼로그 데이터셋에서 새로운 최신(state-of-the-art) 성능을 달성하였다.

http://dx.doi.org/10.1609/aaai.v38i12.29219

Dialog box

Computer science

Artificial intelligence

Human–computer interaction

Natural language processing

World Wide Web

preprint

인용수 1

2024

Solution for SMART-101 Challenge of CVPR Multi-modal Algorithmic Reasoning Task 2024

Jinwoo Ahn, Jun-Hyeok Park, Min-Jun Kim, K. Kim, So-Yeong Sohn, Yunji Lee, Du-Seong Chang, Yu‐Jung Heo, Eun‐Sol Kim

arXiv (Cornell University)

본 논문에서는 Multimodal Algorithmic Reasoning Task: SMART-101 CVPR 2024 Challenge에 대한 HYU MLLAB KT Team의 해법을 제시한다. 본 SMART-101 챌린지는 기존의 일반적인 시각 질의응답 문제를 넘어, 6-8세 연령대의 아동을 위해 설계된 복잡한 비지오-언어(viiso-linguistic) 퍼즐을 다룸으로써 인간 수준의 멀티모달 이해를 달성하는 것을 목표로 한다. 이 문제를 해결하기 위해 두 가지 핵심 아이디어를 제안한다. 첫째, 대규모 언어 모델(LLM)의 추론 능력을 활용하기 위해, 주어진 시각적 단서(이미지)를 텍스트 양식에 정합(grounding)한다. 이를 위해 우리는 이미지의 맥락을 자세히 서술하는 고도로 상세한 텍스트 캡션을 생성하고, 해당 캡션을 LLM의 입력으로 사용한다. 둘째, 퍼즐 이미지의 특성상 종종 다양한 기하학적 시각 패턴을 포함하므로, 캡션 생성 과정에서 이러한 패턴이 누락되지 않도록 객체 탐지 알고리즘을 활용한다. 서로 다른 크기의 객체를 탐지할 수 있는 SAM 알고리즘을 사용하여 이러한 기하학적 패턴의 시각적 특징을 포착하고, 그 정보를 LLM의 입력으로 활용하였다. 퍼즐 분할(puzzle split) 구성 하에서, 테스트 세트에서 선택 정답률 Oacc 29.5, 챌린지 세트에서 가중 선택 정답률(WOSA) 27.1을 달성하였다.

http://arxiv.org/abs/2406.05963

Task (project management)

Modal

Computer science

Artificial intelligence

Human–computer interaction

Systems engineering

Engineering

Chemistry

article

인용수 68

2023

Organic Memristor‐Based Flexible Neural Networks with Bio‐Realistic Synaptic Plasticity for Complex Combinatorial Optimization

Hyeongwook Kim, Mi‐Seong Kim, Aejin Lee, Hea‐Lim Park, Jaewon Jang, Jin‐Hyuk Bae, In Man Kang, Eun‐Sol Kim, Sin‐Hyung Lee

IF 14.3 (2023)

Advanced Science

기계적 유연성을 갖춘 하드웨어 신경망은 스마트 웨어러블 전자소자를 위한 차세대 컴퓨팅 시스템으로서 유망하다. 실제 응용을 위한 유연한 신경망에 관한 여러 연구가 수행되었으나, 조합 최적화를 위한 완전한 시냅스 가소성을 갖춘 시스템을 개발하는 일은 여전히 어렵다. 본 연구에서는 유기 멤리스터에서 전도성 필라멘트의 확산성 매개변수로서 금속 이온 주입 밀도를 탐구하였다. 또한, 금속 이온 주입을 체계적으로 설계한 유기 멤리스터를 사용하여 생물학적 수준에 부합하는 시냅스 가소성을 갖는 유연한 인공 시냅스를 처음으로 개발하였다. 제안된 인공 시냅스에서는 단기 가소성(STP), 장기 가소성, 항상성 가소성이 각각 독립적으로 구현되며, 이는 생물학적 대응물과 유사하다. STP와 항상성 가소성의 시간 창은 각각 이온 주입 밀도와 전기적 신호 조건에 의해 제어된다. 더 나아가, 개발된 시냅스 어레이에서 스파이크 의존적 연산 하에 복잡한 조합 최적화에 대한 안정적인 성능이 입증되었다. 복잡한 조합 최적화를 위한 유연한 뉴로모픽 시스템을 구현하기 위한 이러한 효과적인 개념은, 인공지능 시스템과 연계된 새로운 패러다임의 웨어러블 스마트 전자소자를 달성하는 데 필수적인 구성 요소이다.

https://doi.org/10.1002/advs.202300659

Neuromorphic engineering

Memristor

Synapse

Computer science

Synaptic plasticity

Artificial neural network

Materials science

Homeostatic plasticity

Nanotechnology

Artificial intelligence

전체 논문

article

인용수 3

2024

Compositional Video Understanding with Spatiotemporal Structure-based Transformers

Hoyeoung Yun, Jinwoo Ahn, Minseo Kim, Eun‐Sol Kim

https://doi.org/10.1109/cvpr52733.2024.01774

Computer science

Transformer

Computer vision

Engineering

Electrical engineering

Voltage

article

인용수 0

2024

A New Graph Transformer Algorithm for Leveraging External Knowledge Graph

Karl An, Eun‐Sol Kim

KIISE Transactions on Computing Practices

https://doi.org/10.5626/ktcp.2024.30.11.588

Computer science

Null graph

Graph

Transformer

Algorithm

Butterfly graph

Voltage graph

Line graph

Theoretical computer science

Electrical engineering

article

인용수 1

2024

Structure-Aware Multimodal Sequential Learning for Visual Dialog

Youngjin Kim, Min-Jun Kim, Kyunghwan An, Jinwoo Ahn, Jaeseok Kim, Yu‐Jung Heo, Du-Seong Chang, Eun‐Sol Kim

Proceedings of the AAAI Conference on Artificial Intelligence

http://dx.doi.org/10.1609/aaai.v38i12.29219

Dialog box

Computer science

Artificial intelligence

Human–computer interaction

Natural language processing

World Wide Web

preprint

인용수 1

2024

Solution for SMART-101 Challenge of CVPR Multi-modal Algorithmic Reasoning Task 2024

Jinwoo Ahn, Jun-Hyeok Park, Min-Jun Kim, K. Kim, So-Yeong Sohn, Yunji Lee, Du-Seong Chang, Yu‐Jung Heo, Eun‐Sol Kim

arXiv (Cornell University)

http://arxiv.org/abs/2406.05963

Task (project management)

Modal

Computer science

Artificial intelligence

Human–computer interaction

Systems engineering

Engineering

Chemistry

article

인용수 68

2023

Organic Memristor‐Based Flexible Neural Networks with Bio‐Realistic Synaptic Plasticity for Complex Combinatorial Optimization

Hyeongwook Kim, Mi‐Seong Kim, Aejin Lee, Hea‐Lim Park, Jaewon Jang, Jin‐Hyuk Bae, In Man Kang, Eun‐Sol Kim, Sin‐Hyung Lee

IF 14.3 (2023)

Advanced Science

https://doi.org/10.1002/advs.202300659

Neuromorphic engineering

Memristor

Synapse

Computer science

Synaptic plasticity

Artificial neural network

Materials science

Homeostatic plasticity

Nanotechnology

Artificial intelligence

preprint

인용수 0

2023

Clustering-based Image-Text Graph Matching for Domain Generalization

Nokyung Park, Daewon Chae, Jeongyong Shim, Sangpil Kim, Eun‐Sol Kim, Jinkyu Kim

arXiv (Cornell University)

학습 영역-불변적 시각 표현을 학습하는 것은 보지 못한 대상 작업 도메인에 대해서도 잘 일반화할 수 있는 모델을 훈련하는 데 중요하다. 최근 연구들은 텍스트 기술이 높은 수준의 클래스-구분 정보를 포함하고 있으며, 이러한 보조적 의미 단서가 도메인 일반화 문제에서 효과적인 피벗 임베딩으로 활용될 수 있음을 보여준다. 그러나 기존 방법들은 피벗 임베딩을 전역 방식으로 사용한다(즉, 이미지 임베딩을 문장 수준의 텍스트 임베딩에 정렬)고, 이는 주어진 텍스트 기술의 의미 단서를 충분히 활용하지 못한다. 본 연구에서는 이미지 영역과 해당 텍스트 기술 간의 국소 정렬(local alignment)을 사용하여 도메인-불변 특징을 얻는 것을 제안한다. 이를 위해 먼저 이미지와 텍스트 입력을 그래프로 표현한다. 그 다음, 이들 그래프 내의 노드를 클러스터링하고, 그래프 기반 이미지 노드 특징을 텍스트 그래프의 노드들에 매칭한다. 이러한 매칭 과정은 전역 및 국소 모두에서 수행되어, 시각과 텍스트 간의 의미 하위 구조를 면밀하게 정렬한다. 우리는 CUB-DG 및 DomainBed와 같은 대규모 공개 데이터셋에서 실험을 수행하였으며, 본 모델은 이들 데이터셋에서 기존의 최신 성능과 동등하거나 더 나은 성능을 달성한다. 코드는 다음에서 제공된다: https://github.com/noparkee/Graph-Clustering-based-DG

http://arxiv.org/abs/2310.02692

Bridging (networking)

Cluster analysis

Computer science

Graph

Matching (statistics)

Information retrieval

Image (mathematics)

Artificial intelligence

Data mining

Pattern recognition (psychology)

book-chapter

인용수 13

2023

BaSSL: Boundary-aware Self-Supervised Learning for Video Scene Segmentation

Jonghwan Mun, Minchul Shin, Gunsoo Han, Sangho Lee, Seongsu Ha, Joonseok Lee, Eun‐Sol Kim

Lecture notes in computer science

https://doi.org/10.1007/978-3-031-26316-3_29

Computer science

Pretext

Artificial intelligence

Segmentation

Leverage (statistics)

Matching (statistics)

Machine learning

Computer vision

article

인용수 21

2023

DeepFold: enhancing protein structure prediction through optimized loss functions, improved template features, and re-optimized energy function

Jae-Won Lee, Jong-Hyun Won, Seonggwang Jeon, Yujin Choo, Yubin Yeon, Jin-Seon Oh, Minsoo Kim, SeonHwa Kim, InSuk Joung, Cheongjae Jang, Sung Jong Lee, Tae Hyun Kim, Kyong Hwan Jin, Giltae Song, Eun‐Sol Kim, Jejoong Yoo, Eunok Paek, Yung‐Kyun Noh, Keehyoung Joo

IF 4.4 (2023)

Bioinformatics

동기: 높은 정확도로 단백질 구조를 예측하는 것은 생명과학 전반과 산업계를 아우르는 커뮤니티에 있어 중요한 도전 과제이다. AlphaFold2와 같은 딥 뉴럴 네트워크의 발전에도 불구하고, 단백질 골격(backbone) 구조뿐 아니라 측쇄(side-chain)와 같은 세부 구조의 품질을 더 향상시킬 필요가 있다. 결과: AlphaFold2의 성과를 바탕으로 우리가 수행한 수정 사항에는 측쇄 토션 각(side-chain torsion angles)과 프레임 정렬 점오차(frame aligned point error)의 손실을 변경하는 것, 측쇄 신뢰도(side chain confidence) 및 2차 구조 예측에 대한 손실 함수를 추가하는 것, 그리고 템플릿 특징 생성(template feature generation)을 조건부 랜덤 필드(conditional random fields)에 기반한 새로운 정렬 정렬(alignment) 방법으로 대체하는 것이 포함된다. 또한 distogram과 측쇄 예측에서 얻은 퍼텐셜 에너지를 통합하는 분자역학 에너지 함수(molecular mechanics energy function)를 사용하여 형태공간(Conformational space) 어닐링(conformational space annealing)으로 재최적화(re-optimization)를 수행하였다. 단백질 및 도메인 모델링을 위한 CASP15 맹검 시험(single protein and domain modeling; 109개 도메인)에서 DeepFold는 132개 그룹 중 4위를 차지했으며, 골격, 측쇄 및 Molprobity 측면에서 구조의 세부 사항에 대한 개선을 보였다. 단백질 골격 정확도와 관련하여 DeepFold는 GDT-TS 점수 중앙값 88.64를 달성하였고, 이는 AlphaFold2의 85.88과 비교된다. TBM-easy/hard 타깃(target)에서는 DeepFold가 GDT-TS에 대한 Z-score를 기준으로 최상위에 랭크되었다. 이는 고도로 정확한 구조를 요구하는 구조생물학 커뮤니티에 대한 DeepFold의 실용적 가치를 보여준다. 또한 공개적으로 이용 가능한 구조를 가진 39개 타깃에서 55개 도메인을 대상으로 수행한 철저한 분석 결과에 따르면, DeepFold는 상위 성능 그룹들 중에서 측쇄 정확도와 Molprobity 점수에서 우수함을 보인다. 제공 및 구현: DeepFold 도구는 https://github.com/newtonjoo/deepfold 에서 제공되는 오픈 소스 소프트웨어이다.

https://doi.org/10.1093/bioinformatics/btad712

Protein structure prediction

Computer science

Side chain

Simulated annealing

Algorithm

Protein structure

Artificial intelligence

Materials science

Physics

article

인용수 3

2023

Dense but Efficient VideoQA for Intricate Compositional Reasoning

Jihyeon Lee, Wooyoung Kang, Eun‐Sol Kim

2023 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV)

대부분의 기존 비디오 질의응답(VideoQA) 데이터셋은 단순한 추론 과정을 필요로 하는 쉬운 질문들로 구성되어 있다는 점은 잘 알려져 있다. 그러나 긴 비디오는 필연적으로 시공간 축과 함께 복잡하고 조합적인 의미 구조를 포함하며, 이는 모델이 비디오에 내재된 조합적 구조를 이해해야 함을 요구한다. 본 논문에서는 복잡한 VideoQA 과제를 해결하기 위해 변형 가능 어텐션 메커니즘을 갖춘 트랜스포머 아키텍처 기반의 새로운 조합형 VideoQA 방법을 제안한다. 변형 가능 어텐션은 조밀한 시각 특징 맵에서 유익한 시각 특징들의 일부를 샘플링하여 프레임이 시간적으로 긴 범위에 걸쳐 효율적으로 커버할 수 있도록 한다. 또한 복잡한 질문 문장 내의 의존성 구조를 언어 임베딩과 함께 결합하여 질문 단어들 간의 관계를 용이하게 이해한다. 광범위한 실험과 절제(ablations) 연구 결과, 제안한 조밀하지만 효율적인 모델이 다른 모든 기준(baseline) 모델보다 성능이 우수함을 보였다.

https://doi.org/10.1109/wacv56688.2023.00117

Computer science

Artificial intelligence

Visual reasoning

Question answering

Dependency (UML)

Feature (linguistics)

Natural language processing

Architecture

preprint

인용수 3

2022

MSTR: Multi-Scale Transformer for End-to-End Human-Object Interaction Detection

Bumsoo Kim, Jonghwan Mun, Kyoung-Woon On, Minchul Shin, Junhyun Lee, Eun‐Sol Kim

arXiv (Cornell University)

인간-사물 상호작용(Human-Object Interaction, HOI) 탐지는 이미지로부터 일련의 삼중항(triplets)을 식별하는 작업이다. 최근 연구에서는 HOI 탐지에서의 많은 수작업 구성 요소(hand-designed components) 필요성을 종단 간(end-to-end) 학습을 통해 성공적으로 제거하는 트랜스포머 인코더-디코더 아키텍처를 제안하였다. 그러나 이들은 단일 스케일의 특징 해상도에 한정되어, 인간, 사물 및 이들의 상호작용이 서로 매우 다른 스케일과 거리로 존재하는 장면에서 최적이 아닌 성능을 보인다. 이러한 문제를 해결하기 위해, 우리는 HOI 탐지를 위한 멀티-스케일 TRansformer(Multi-Scale TRansformer, MSTR)를 제안하며, 이를 위해 Dual-Entity attention 및 Entity-conditioned Context attention이라는 두 가지 새롭고 HOI 인지적인 변형 가능 주의 모듈(HOI-aware deformable attention modules)을 도입한다. 기존의 변형 가능 주의는 HOI 탐지 성능 측면에서 막대한 비용을 요구하는 반면, 본 연구에서 제안하는 MSTR의 주의 모듈은 상호작용을 식별하는 데 필수적인 샘플링 지점에 효과적으로 주의를 기울이는 방법을 학습한다. 실험에서 우리는 두 개의 HOI 탐지 벤치마크에서 새로운 최첨단 성능을 달성하였다.

http://arxiv.org/abs/2203.14709

Transformer

Computer science

Encoder

Artificial intelligence

Object detection

End-to-end principle

Computer vision

Pattern recognition (psychology)

Engineering

Voltage

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

전체 논문

article

인용수 3

2024

Compositional Video Understanding with Spatiotemporal Structure-based Transformers

Hoyeoung Yun, Jinwoo Ahn, Minseo Kim, Eun‐Sol Kim

https://doi.org/10.1109/cvpr52733.2024.01774

Computer science

Transformer

Computer vision

Engineering

Electrical engineering

Voltage

article

인용수 0

2024

A New Graph Transformer Algorithm for Leveraging External Knowledge Graph

Karl An, Eun‐Sol Kim

KIISE Transactions on Computing Practices

https://doi.org/10.5626/ktcp.2024.30.11.588

Computer science

Null graph

Graph

Transformer

Algorithm

Butterfly graph

Voltage graph

Line graph

Theoretical computer science

Electrical engineering

article

인용수 1

2024

Structure-Aware Multimodal Sequential Learning for Visual Dialog

Youngjin Kim, Min-Jun Kim, Kyunghwan An, Jinwoo Ahn, Jaeseok Kim, Yu‐Jung Heo, Du-Seong Chang, Eun‐Sol Kim

Proceedings of the AAAI Conference on Artificial Intelligence

http://dx.doi.org/10.1609/aaai.v38i12.29219

Dialog box

Computer science

Artificial intelligence

Human–computer interaction

Natural language processing

World Wide Web

preprint

인용수 1

2024

Solution for SMART-101 Challenge of CVPR Multi-modal Algorithmic Reasoning Task 2024

Jinwoo Ahn, Jun-Hyeok Park, Min-Jun Kim, K. Kim, So-Yeong Sohn, Yunji Lee, Du-Seong Chang, Yu‐Jung Heo, Eun‐Sol Kim

arXiv (Cornell University)

http://arxiv.org/abs/2406.05963

Task (project management)

Modal

Computer science

Artificial intelligence

Human–computer interaction

Systems engineering

Engineering

Chemistry

article

인용수 68

2023

Organic Memristor‐Based Flexible Neural Networks with Bio‐Realistic Synaptic Plasticity for Complex Combinatorial Optimization

Hyeongwook Kim, Mi‐Seong Kim, Aejin Lee, Hea‐Lim Park, Jaewon Jang, Jin‐Hyuk Bae, In Man Kang, Eun‐Sol Kim, Sin‐Hyung Lee

IF 14.3 (2023)

Advanced Science

https://doi.org/10.1002/advs.202300659

Neuromorphic engineering

Memristor

Synapse

Computer science

Synaptic plasticity

Artificial neural network

Materials science

Homeostatic plasticity

Nanotechnology

Artificial intelligence

preprint

인용수 0

2023

Clustering-based Image-Text Graph Matching for Domain Generalization

Nokyung Park, Daewon Chae, Jeongyong Shim, Sangpil Kim, Eun‐Sol Kim, Jinkyu Kim

arXiv (Cornell University)

http://arxiv.org/abs/2310.02692

Bridging (networking)

Cluster analysis

Computer science

Graph

Matching (statistics)

Information retrieval

Image (mathematics)

Artificial intelligence

Data mining

Pattern recognition (psychology)

book-chapter

인용수 13

2023

BaSSL: Boundary-aware Self-Supervised Learning for Video Scene Segmentation

Jonghwan Mun, Minchul Shin, Gunsoo Han, Sangho Lee, Seongsu Ha, Joonseok Lee, Eun‐Sol Kim

Lecture notes in computer science

https://doi.org/10.1007/978-3-031-26316-3_29

Computer science

Pretext

Artificial intelligence

Segmentation

Leverage (statistics)

Matching (statistics)

Machine learning

Computer vision

article

인용수 21

2023

DeepFold: enhancing protein structure prediction through optimized loss functions, improved template features, and re-optimized energy function

IF 4.4 (2023)

Bioinformatics

https://doi.org/10.1093/bioinformatics/btad712

Protein structure prediction

Computer science

Side chain

Simulated annealing

Algorithm

Protein structure

Artificial intelligence

Materials science

Physics

article

인용수 3

2023

Dense but Efficient VideoQA for Intricate Compositional Reasoning

Jihyeon Lee, Wooyoung Kang, Eun‐Sol Kim

2023 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV)

https://doi.org/10.1109/wacv56688.2023.00117

Computer science

Artificial intelligence

Visual reasoning

Question answering

Dependency (UML)

Feature (linguistics)

Natural language processing

Architecture

preprint

인용수 3

2022

MSTR: Multi-Scale Transformer for End-to-End Human-Object Interaction Detection

Bumsoo Kim, Jonghwan Mun, Kyoung-Woon On, Minchul Shin, Junhyun Lee, Eun‐Sol Kim

arXiv (Cornell University)

http://arxiv.org/abs/2203.14709

Transformer

Computer science

Encoder

Artificial intelligence

Object detection

End-to-end principle

Computer vision

Pattern recognition (psychology)

Engineering

Voltage

주요 논문

*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.

article

인용수 3

2024

Compositional Video Understanding with Spatiotemporal Structure-based Transformers

Hoyeoung Yun, Jinwoo Ahn, Minseo Kim, Eun‐Sol Kim

https://doi.org/10.1109/cvpr52733.2024.01774

Computer science

Transformer

Computer vision

Engineering

Electrical engineering

Voltage

article

인용수 0

2024

A New Graph Transformer Algorithm for Leveraging External Knowledge Graph

Karl An, Eun‐Sol Kim

KIISE Transactions on Computing Practices

https://doi.org/10.5626/ktcp.2024.30.11.588

Computer science

Null graph

Graph

Transformer

Algorithm

Butterfly graph

Voltage graph

Line graph

Theoretical computer science

Electrical engineering

article

인용수 1

2024

Structure-Aware Multimodal Sequential Learning for Visual Dialog

Youngjin Kim, Min-Jun Kim, Kyunghwan An, Jinwoo Ahn, Jaeseok Kim, Yu‐Jung Heo, Du-Seong Chang, Eun‐Sol Kim

Proceedings of the AAAI Conference on Artificial Intelligence

http://dx.doi.org/10.1609/aaai.v38i12.29219

Dialog box

Computer science

Artificial intelligence

Human–computer interaction

Natural language processing

World Wide Web

preprint

인용수 1

2024

Solution for SMART-101 Challenge of CVPR Multi-modal Algorithmic Reasoning Task 2024

Jinwoo Ahn, Jun-Hyeok Park, Min-Jun Kim, K. Kim, So-Yeong Sohn, Yunji Lee, Du-Seong Chang, Yu‐Jung Heo, Eun‐Sol Kim

arXiv (Cornell University)

http://arxiv.org/abs/2406.05963

Task (project management)

Modal

Computer science

Artificial intelligence

Human–computer interaction

Systems engineering

Engineering

Chemistry

article

인용수 68

2023

Organic Memristor‐Based Flexible Neural Networks with Bio‐Realistic Synaptic Plasticity for Complex Combinatorial Optimization

Hyeongwook Kim, Mi‐Seong Kim, Aejin Lee, Hea‐Lim Park, Jaewon Jang, Jin‐Hyuk Bae, In Man Kang, Eun‐Sol Kim, Sin‐Hyung Lee

IF 14.3 (2023)

Advanced Science

https://doi.org/10.1002/advs.202300659

Neuromorphic engineering

Memristor

Synapse

Computer science

Synaptic plasticity

Artificial neural network

Materials science

Homeostatic plasticity

Nanotechnology

Artificial intelligence