주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
Article
|
인용수 0
·
2025Unbiased Isotonic Regression Tree for Discovering Hidden Heterogeneity in Monotonicity Constraints
Doowon Choi
IF 2.5 (2025)
Applied Sciences
도메인 지식을 통합하는 것은 기계 학습 모델의 관련성과 신뢰성을 향상시키는 데 필수적이라는 점이 점차 더 중요하게 인식되고 있다. 이러한 통합은 흔히 현실의 조건이나 이론적 통찰을 반영하는 특정 유형의 제약을 통해 구현된다. 회귀 트리(regression trees) 계열에서는 예측 변수와 반응 변수 사이의 단조성(monotonicity) 제약을 반영하기 위해 등조 회귀 트리(isotonic regression tree)가 사용된다. 그러나 등조 회귀 트리는 분할 변수와 절단점(cutpoint)을 동시에 선택하기 때문에 분할 선택 편향(split selection bias)에 취약할 수 있다. 본 연구는 먼저 등조 회귀 트리에서 분할 변수에 대한 선택 편향의 가능성을 탐색하고, 선택 편향 문제를 완화하는 비편향 등조 회귀 트리를 제안한다. 시뮬레이션과 사례 연구의 결과는 제안된 접근법의 효과성과, 숨겨진 이질적 단조 제약(hidden heterogeneous monotonic constraints)을 발견할 수 있음을 보여준다.
https://doi.org/10.3390/app15020818
Isotonic regression
Statistics
Mathematics
Isotonic
Econometrics
Computer science
Medicine
2
Article
|
·
인용수 1
·
2025Analysis of informatization-related factors for digital transformation in manufacturing small and medium-sized enterprises using machine learning techniques
Doowon Choi, Insu Cho
IF 7.3 (2025)
International Journal of Production Research
https://doi.org/10.1080/00207543.2025.2481182
Informatization
Manufacturing engineering
Digital transformation
Transformation (genetics)
Industrial engineering
Computer science
Engineering
Business
Engineering management
World Wide Web
3
Article
|
·
인용수 2
·
2024A data-driven approach to discover hidden complicated relationships of energy variables and estimate energy consumption in U.S. homes
Doowon Choi, Chul Kim
IF 7.6 (2024)
Building and Environment
https://doi.org/10.1016/j.buildenv.2024.112175
Energy consumption
Energy (signal processing)
Consumption (sociology)
Econometrics
Computer science
Statistics
Engineering
Mathematics
Sociology
Electrical engineering
4
Article
|
·
인용수 10
·
2021Diagnosis of building energy consumption in the 2012 CBECS data using heterogeneous effect of energy variables: A recursive partitioning approach
Doowon Choi, Chul Kim
IF 4.008 (2021)
Building Simulation
https://doi.org/10.1007/s12273-021-0777-8
Interpretability
Energy consumption
Energy (signal processing)
Computer science
Tree (set theory)
Consumption (sociology)
Recursive partitioning
Efficient energy use
Machine learning
Data mining
5
Article
|
·
인용수 0
·
2021Extensions of Regression Trees for Subgroup Identification
Doowon Choi
OakTrust (Texas A&M University Libraries)
효과적인 분석은 데이터 분석 과학의 핵심이다. 데이터 분석과 과학 분야에서는 상당한 발전이 이루어졌다. 그러나 기존의 널리 사용되는 하위집단(서브그룹) 식별 모델들—예를 들어 회귀 트리—이 일부 경우에서 효과적이지 않기 때문에, 추가 연구와 더 많은 연구가 필요하다는 합리성과 타당성은 여전히 존재한다. 본 학위논문은 이러한 경우를 해결하고 더 나은 하위집단 식별 모델을 고안하기 위한 진지한 시도이다.
회귀 트리 모델은 사회과학, 교육, 헬스케어 정보학과 같은 다양한 분야에서 하위집단 식별을 위해 널리 사용되어 왔다. 그러나 회귀 트리를 직접 적용하는 방식은 특정한 요구를 충족시키지 못할 수 있으며, 실제로 존재하는 하위집단을 놓치거나 오도하는 하위집단을 식별할 수 있는데, 이는 현장에서 마주치는 까다로운 상황 때문이다. 본 학위논문은 하위집단 식별을 위해 회귀 트리를 수정하고 확장함으로써, 아직 충분히 탐구되지 않은 상황들—i) 회귀가 아니라 상관관계가 관심 대상인 경우를 위한 상관 트리(correlation trees) 개발, ii) 이상치(outlier) 문제를 다루기 위한 강건(robust) 로지스틱 회귀 트리 개발, iii) 불균형 클래스 데이터의 모델링을 위해 일반화 극값 회귀 트리(generalized extreme value regression trees)와 Firth의 로지스틱 회귀 트리(Firth's logistic regression trees)의 잠재력 탐색—을 포함한 일부 미개척 상황을 해결하는 데 초점을 둔다.
본 연구는 이질적 하위집단을 식별하여 다양한 분야와 실제에서의 도전 과제를 극복하기 위해 고급 통계 모델링과 머신러닝 접근의 상호작용을 다루는 학제간(interdisciplinary) 연구이다. 제안된 모델은 하위집단 식별을 위한 구체적인 통찰, 이론, 탐색적 도구를 제공한다. 본 연구는 하위집단 분석이 주요 관심사인 개인맞춤 의학(personalized medicine)과 최적의 심리적 중재(optimal psychological interventions) 등 다양한 분야에 널리 적용될 것으로 기대된다. 본 연구의 잠재적 영향은 학계, 산업, 그리고 사회 전반을 대상으로 한다.
https://hdl.handle.net/1969.1/193126
Identification (biology)
Regression
Computer science
Mathematics
Artificial intelligence
Statistics
Biology