주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
Article
|
인용수 0
·
2025Comprehensive Analysis of Masking Techniques in Molecular Graph Representation Learning
Bonyou Koo, Sunyoung Kwon
IF 3.6 (2025)
IEEE Access
분자 표현 학습은 약물 발견 및 분자 물성 예측에서 주요 관심 분야이다. 선행 연구들에서는 분자를 그래프로 모델링하여, 그래프 신경망(GNNs)이 핵심적인 구조 정보를 포착할 수 있도록 하였다. 최근의 접근법들은 노드에서 서브그래프로 과립도(granularity)를 확장하는 것, 마스킹 위치를 전환하는 것, 하위 과제(downstream)에서 마스킹을 적용하는 것과 같은 고도화된 마스킹 전략을 도입함으로써 분자 표현을 개선하였다. 그러나 이러한 전략들에 대한 포괄적인 분석은 여전히 제한적이다. 본 연구에서는 다양한 단계, 과립도, 위치, 특징 유형, 비율 전반에 걸쳐 마스킹 기법을 체계적으로 평가한다. 연구 결과, 사전 학습(pre-training) 동안의 노드 특징(feature) 마스킹이 높은 성능을 달성하는 반면, 풍부한 특징은 이득을 감소시킬 수 있으며, 널리 사용되는 25% 마스킹 비율은 모든 데이터셋에서 보편적으로 최적이 아니고 데이터셋에 따라 다른 비율이 더 나은 성능을 보였다. 본 연구는 분자 그래프에서 마스킹 기법의 이점에 대한 더 깊은 통찰을 제공하며, 그래프 기반 학습에서 의미 이해(semantic understanding)와 예측 정확도를 향상시킬 잠재성을 강조한다.
https://doi.org/10.1109/access.2025.3531302
Computer science
Masking (illustration)
Graph
Representation (politics)
Artificial intelligence
Theoretical computer science
2
Article
|
인용수 1
·
2025CoCL: EEG connectivity-guided contrastive learning for seizure detection
Hyeon-Jin Im, Jiye Kim, Sunyoung Kwon
IF 4.2 (2025)
ICT Express
간질(epilepsy)은 반복적인 발작을 특징으로 하는 신경학적 질환으로, 환자의 안전과 삶의 질을 위해 조기 예측이 매우 중요하다. 전통적인 탐지 방법은 주로 EEG 신호로부터의 시간-주파수(time-frequency) 정보를 기반으로 한다. 그러나 EEG 신호는 상호 연결되어 있으며 비정상적 활동이 뇌의 여러 영역에 걸쳐 확산되므로, 그 연결성(connectivity)을 이해하는 것이 필수적이다. 본 연구는 EEG 연결성에 기반한 지도(supervision)를 결합하여 대조학습(contrastive learning)을 수행하는 새로운 표현 학습 방법인 CoCL을 제안한다. CoCL은 사전학습(pretraining) 시 적용하고 이를 발작 탐지(seizure detection)에 전이(transfer)했을 때, 최신 방법들보다 우수한 성능을 보이며 6개의 EEG 채널만으로도 높은 정확도를 유지함으로써 다수의 전극이 필요하던 요구를 줄인다.
https://doi.org/10.1016/j.icte.2025.06.004
Electroencephalography
Computer science
Psychology
Artificial intelligence
Neuroscience
3
Article
|
인용수 0
·
2025MORE: Molecule Pretraining with Multi-Level Pretext Task
Yeongyeong Son, Dasom Noh, Gyoungyoung Heo, Gyoung Jin Park, Sunyoung Kwon
Proceedings of the AAAI Conference on Artificial Intelligence
다운스트림 작업을 위한 다양한 기반(pretrained fundamental bases)으로서 파운데이션 모델은 미세조정(fine-tuning) 또는 심지어 제로샷(zero-shot) 방식만으로도 특정 응용에 빠르게 적용될 수 있는, 다재다능하고 풍부하며 일반화 가능한 표현을 학습하고자 한다. 분자 표현을 위한 파운데이션 모델 역시 예외가 아니다. 분자 표현의 사전학습을 위해 다양한 자기지도(pretext) 과제가 제안되어 왔지만, 이러한 접근은 단일 또는 일부 특성에만 초점을 맞추는 경향이 있었다. 분자는 복잡하며 목적에 따라 서로 다른 관점이 필요하다. 즉, 국소 또는 전역 수준의 통찰, 2D 토폴로지 또는 3D 공간 배치, 그리고 저수준 또는 고수준 의미론에 대한 관점이 요구된다. 우리는 이러한 분자의 여러 측면을 동시에 고려하는 다층(multi-level) 분자 그래프 사전학습(Multi-level mOlecule gRaph prE-train, MORE)을 제안한다. 실험 결과는 선형 프로빙(linear probing)과 전체 미세조정(full fine-tuning) 모두에서 우수한 성능을 보임으로써, 제안한 방법이 포괄적인 표현을 효과적으로 학습함을 입증한다. 특히, 사전학습된 모델의 망각(forgetting)을 정량화한 실험에서 MORE는 다른 방법들과 달리 일관되게 최소하고 안정적인 매개변수 변화와 더 작은 성능 격차를 보이며, 반면 다른 방법들은 더 큰 격차와 함께 실질적이면서도 일관되지 않은 변동을 보인다. 개별 자기지도 과제의 효과는 해결하는 문제에 따라 달라지며, 이는 다시 한 번 다층적 관점의 필요성을 강조한다. 확장성(scalability) 실험에서는 데이터셋 크기가 증가할수록 MORE가 꾸준히 향상되는 것으로 나타나, 더 큰 데이터셋에서도 잠재적인 이득이 있을 수 있음을 시사한다.
https://doi.org/10.1609/aaai.v39i19.34262
Pretext
Task (project management)
Cognitive psychology
Psychology
Engineering
Political science
4
Article
|
인용수 21
·
2024Systematic Selection of High‐Affinity ssDNA Sequences to Carbon Nanotubes
Dakyeon Lee, J. Y. Lee, Woo Jin Kim, Yeongjoo Suh, Jiwoo Park, Sungjee Kim, YongJoo Kim, Sunyoung Kwon, Sanghwa Jeong
IF 14.1 (2024)
Advanced Science
단일벽 탄소 나노튜브(SWCNTs)는 생의학 및 나노전자공학 분야에서의 잠재력으로 인해 상당한 관심을 받아왔다. 단일가닥 DNA(ssDNA)로 SWCNT를 기능화하면 SWCNT의 정렬을 정밀하게 제어할 수 있으며, 광학 및 전자 바이오센서의 개발로 이어진다. 본 연구는 방대한 무작위 라이브러리에서 고결합 친화도를 갖는 ssDNA 서열을 농축하기 위해 고처리량의 체계적 선별을 적용함으로써 해당 분야의 현재 공백을 다룬다. ssDNA와 SWCNT 사이의 결합 친화도에 관여하는 특정 염기 조성 및 패턴이 확인되었다. 분자 동역학 시뮬레이션은 SWCNT 상에서의 ssDNA 구조의 안정성을 검증하고, 이 상호작용에서 수소 결합이 핵심적 역할을 한다는 점을 밝혀냈다. 또한 기계 학습을 통해 고결합 친화도를 갖는 ssDNA 서열을 정확하게 구별할 수 있으며, 전용 웹페이지(http://service.k-medai.com/ssdna4cnt)에서 접근 가능한 모델을 제공함을 보여주었다. 이러한 결과는 다양한 과학 분야에 걸친 안정적이고 민감한 분자 검출을 위한 고결합 친화도 ssDNA–SWCNT 구성체에 대한 새로운 연구 방향을 열어준다.
https://doi.org/10.1002/advs.202308915
Carbon nanotube
Nanotechnology
Nanoelectronics
DNA
Materials science
Biosensor
Selection (genetic algorithm)
Biomedicine
Chemistry
Computer science
5
Article
|
인용수 24
·
20233D graph contrastive learning for molecular property prediction
Kisung Moon, Hyeon-Jin Im, Sunyoung Kwon
IF 4.4 (2023)
Bioinformatics
동기: 비지도사전학습(self-supervised learning, SSL)은 데이터에 내재된 감독 신호를 활용하여 데이터 표현을 학습하는 방법이다. 이러한 학습 방법은 약물 분야에서 주목받고 있는데, 시간 소요가 크고 비용이 많이 드는 실험으로 인해 주석이 달린 데이터가 부족하기 때문이다. 막대한 규모의 라벨 없는 데이터를 활용한 SSL은 분자 특성 예측에서 우수한 성능을 보였으나, 몇 가지 문제가 존재한다. (i) 기존의 SSL 모델은 대규모이며, 계산 자원이 충분하지 않은 환경에서 SSL을 구현하는 데 한계가 있다. (ii) 대부분의 경우 분자 표현 학습에 3차원 구조 정보를 활용하지 않는다. 약물의 활성은 해당 약물 분자의 구조와 밀접한 관련이 있다. 그럼에도 불구하고 현재의 대부분 모델은 3차원 정보를 사용하지 않거나 부분적으로만 사용한다. (iii) 분자에 대해 대조학습(contrastive learning)을 적용하는 선행 모델들은 원자와 결합을 순열(permuting)하는 데이터 증강을 사용한다. 따라서 서로 다른 특성을 가진 분자들이 동일한 양성 샘플(positive samples)에 포함될 수 있다. 우리는 위의 문제를 해결하기 위해 분자 특성 예측을 위한 소규모 3차원 그래프 대조학습(small-scale 3D Graph Contrastive Learning, 3DGCL)이라는 새로운 대조학습 프레임워크를 제안한다. 결과: 3DGCL은 약물의 의미(semantic)를 변화시키지 않는 사전학습 과정(pretraining)을 통해 분자의 구조를 반영함으로써 분자 표현을 학습한다. 사전학습 데이터로 1128개 샘플만 사용하고, 모델 파라미터는 50만(0.5 million) 개만 사용하여, 6개의 벤치마크 데이터셋에서 최첨단 성능 또는 이에 준하는 성능을 달성하였다. 광범위한 실험을 통해, 화학 지식에 기반한 3차원 구조 정보가 특성 예측을 위한 분자 표현 학습에 필수적임을 확인하였다. 이용 가능성 및 구현: 데이터와 코드는 https://github.com/moonkisung/3DGCL 에서 제공된다.
https://doi.org/10.1093/bioinformatics/btad371
Computer science
Property (philosophy)
Representation (politics)
Graph
Machine learning
Artificial intelligence
Training set
Feature learning
Molecular graph
Natural language processing