주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
preprint
|
인용수 0
·
2025A fine-grained look at causal effects in causal spaces
Jun-Hyung Park, Yuqing Zhou
arXiv (Cornell University)
인과효과(causal effect)라는 개념은 많은 과학 분야 전반에 걸쳐 근본적이다. 전통적으로 양적 연구자들은 변수 수준에서 인과효과를 연구해 왔는데, 예컨대 특정 약물의 용량(W)이 환자의 혈압(Y)에 인과적으로 어떤 영향을 미치는지와 같은 문제를 다루는 방식이다. 그러나 많은 현대 데이터 영역에서는 이미지의 픽셀이나 언어 모델의 토큰(token)처럼 원시 변수(raw variables)가 의미론적 구조를 갖추지 못하므로, 의미 있는 인과 질문을 공식화하기 어렵다. 본 논문에서는 확률론에서 독립(independence)과 같은 핵심 개념이 사건(event)과 시그마-대수(sigma-algebras) 수준에서 먼저 주어지고 그 후에 확률변수(random variables)가 등장한다는 점에서 영감을 받아, 사건 수준에서 인과효과를 연구함으로써 보다 세밀한 관점을 제시한다. 인과 공간(causal spaces)의 계측론적(measure-theoretic) 틀 안에서, 최근에 도입된 인과성의 공리화(axiomatisation)에 기반하여, 우리는 먼저 인과효과의 존재 여부를 결정하는 몇 가지 이원적(binary) 정의를 소개하고, 개입(intervention) 측정에 따라 인과효과를 (비)독립성(in)dependence과 연결하는 몇 가지 성질을 증명한다. 나아가 사건에 대한 인과효과의 강도와 성격을 포착하는 계량 척도들을 제공하고, 그러한 척도들이 치료효과(treatment effect)에 대한 통상적 측정값을 특수한 경우로서 복원할 수 있음을 보인다.
http://arxiv.org/abs/2512.11919
Causal model
Causal structure
Causality (physics)
Perspective (graphical)
Independence (probability theory)
Conditional independence
Causal analysis
Causal inference
2
article
|
인용수 1
·
2024Coconut: Contextualized Commonsense Unified Transformers for Graph-Based Commonsense Augmentation of Language Models
Jun-Hyung Park, Mingyu Lee, Junho Kim, SangKeun Lee
본 논문에서는 대규모 언어 모델을 기반으로 구조화된 상식 지식을 문맥화(contextualization)하는 과정을 효과적으로 안내하기 위한 COCONUT을 제안한다. COCONUT은 문맥화 지시(prompting) 방식을 활용하여 대규모 언어 모델로부터 고품질의 문맥화 예시를 수집한다. 이후 이러한 예시는 소규모 언어 모델로 증류(distill)되어 문맥화 능력을 향상시킨다. 광범위한 평가 결과, CO-CONUT은 다양한 벤치마크, 모델 및 환경 전반에서 상식 추론 성능을 현저히 향상시키며, 문맥화된 상식 지식을 생성하는 데 있어 유연성과 보편성을 보인다. 특히 COCONUT은 평균 5.8%로 기존의 최신 기술(state-of-the-art) 기법을 일관되게 능가한다. Q. 사람들이 만년필(fountain pen)에서 새로 나온 잉크를 흡수하기 위해 사용하는 것은 무엇인가?
http://dx.doi.org/10.18653/v1/2024.findings-acl.346
Commonsense reasoning
Commonsense knowledge
Computer science
Transformer
Graph
Artificial intelligence
Natural language processing
Theoretical computer science
Engineering
Knowledge-based systems
3
article
|
인용수 2
·
2024Moleco: Molecular Contrastive Learning with Chemical Language Models for Molecular Property Prediction
Jun-Hyung Park, Hyuntae Park, Yeachan Kim, Woosang Lim, SangKeun Lee
사전 학습된 화학 언어 모델(Chemical Language Models, CLMs)은 SMILES와 같은 문자열 기반 분자 기술자(descriptor)를 활용하여 범용 표현을 학습함으로써 분자 특성 예측 분야에서 뛰어난 성능을 보인다. 그러나 이러한 문자열 기반 기술자는 분자 특성 예측과 밀접하게 연관된 제한된 구조 정보를 암묵적으로 포함한다. 본 연구에서는 CLM 내에서 분자 구조에 대한 이해를 향상시키기 위한 새로운 대조 학습 프레임워크인 Moleco를 제안한다. 서로 다른 분자 간의 지문(fingerprint) 벡터 유사성을 기반으로, CLM이 대조적 방식으로 구조적으로 유사한 분자와 비유사한 분자를 구별하도록 학습한다. 실험 결과는 Moleco가 CLM의 분자 특성 예측 성능을 유의미하게 향상시키며, 최신(state-of-the-art) 모델을 능가함을 보여준다. 또한 다양한 Moleco 변형에 대한 심층 분석을 통해 지문 벡터가 분자의 구조 정보에 대한 CLM의 이해를 개선하는 데 매우 효과적인 특성임을 검증한다 1.
https://doi.org/10.18653/v1/2024.emnlp-industry.30
Computer science
Natural language processing
Property (philosophy)
Artificial intelligence
Philosophy
4
article
|
인용수 2
·
2024MolTRES: Improving Chemical Language Representation Learning for Molecular Property Prediction
Jun-Hyung Park, Yeachan Kim, Mingyu Lee, Hyuntae Park, SangKeun Lee
화학 표현 학습은 약물 및 소재 설계와 같은 분야에서 지도 학습 데이터의 가용성이 제한적이라는 점 때문에 점차 더 많은 관심을 받고 있다. 이러한 관심은 분자 언어 표현 학습, 즉 SMILES 서열—분자의 텍스트적 기술자—에 대해 트랜스포머를 사전 학습하는 과정으로 특히 확장된다. 분자 특성 예측에서의 성과에도 불구하고, 현재의 관행은 흔히 조기 수렴으로 인해 과적합과 제한된 확장성 문제를 야기한다. 본 논문에서는 이러한 문제를 해결하기 위해 MolTRES라는 새로운 화학 언어 표현 학습 프레임워크를 제안한다. MolTRES는 생성기-판별기 학습을 통합하여, 구조적 이해를 필요로 하는 보다 도전적인 예시들로부터 모델이 학습할 수 있도록 한다. 또한 외부 물질 임베딩을 통합함으로써 과학 문헌으로부터의 지식을 전이하여 분자 표현을 풍부하게 한다. 실험 결과는 우리의 모델이 널리 사용되는 분자 특성 예측 과제들에서 기존의 최첨단 모델들을 능가함을 보여준다.github.
https://doi.org/10.18653/v1/2024.emnlp-main.788
Computer science
Property (philosophy)
Natural language processing
Representation (politics)
Artificial intelligence
Machine learning
5
article
|
·
인용수 21
·
2022Quantized Sparse Training: A Unified Trainable Framework for Joint Pruning and Quantization in DNNs
Jun-Hyung Park, Kang-Min Kim, SangKeun Lee
IF 2 (2022)
ACM Transactions on Embedded Computing Systems
심층 신경망은 일반적으로 방대한 파라미터와 연산을 필요로 한다. 가지치기(pruning)와 양자화(quantization) 기법은 심층 모델의 복잡도를 줄이기 위해 널리 사용되어 왔다. 두 기법은 함께 적용될 때 유의미하게 더 높은 압축률을 구현할 수 있다. 그러나 별도의 최적화 과정과 하이퍼파라미터 선택에 따른 어려움은 두 기법을 동시에 적용하는 데 제약이 된다. 본 연구에서는 가지치기와 양자화를 단일한 학습 과정에서 함께 수행하는 새로운 압축 프레임워크인 ‘양자화 희소 학습(quantized sparse training)’을 제안한다. 우리는 직통 추정기(straight-through estimator)에 기반한 그래디언트 기반 최적화 과정에 가지치기와 양자화를 통합한다. 양자화 희소 학습을 통해, 처음부터(스크래치) 네트워크를 동시에 학습하고 가지치기 및 양자화를 수행할 수 있다. 실험 결과는 제안 방법론이 모델 크기와 정확도 모두에서 최근의 최첨단(state-of-the-art) 기준 모델에 비해 우수함을 검증하였다. 구체적으로, 양자화 희소 학습은 정확도 저하 없이 VGG16의 경우 135 KB의 모델 크기를 달성하며, 이는 최신 가지치기 및 양자화 접근법에서 가능했던 모델 크기의 40%에 해당한다.
https://doi.org/10.1145/3524066
Computer science
Quantization (signal processing)
Hyperparameter
Pruning
Estimator
Deep neural networks
Artificial neural network
Artificial intelligence
Machine learning
Algorithm