RnDCircle Logo
박만식 연구실
성신여자대학교 수리통계데이터사이언스학부 박만식 교수
다변량통계
공간통계학
제로인플레이티드 모형
연구 영역
기본 정보
논문·특허
과제
구성원

박만식 연구실

성신여자대학교 수리통계데이터사이언스학부 박만식 교수

박만식 연구실은 다변량통계와 공간통계학을 중심으로, 0이 다수 포함된 반응의 분포 특성을 고려한 두-부분 회귀와 제로-인플레이티드 모형을 연구합니다. 또한 동적 시간 왜곡과 오토인코더 기반 표현학습을 활용하여 지역 단위 시계열의 잠재 군집을 추출하고, 주기도 상관성을 반영한 시계열 군집화 절차를 함께 다룹니다. 공간 데이터에 대해서는 가우시안 마코프 랜덤 필드의 이웃 차수 결정 등 공간 상관 구조를 구성하는 방법론을 통해 공간 추정과 예측을 수행합니다.

다변량통계공간통계학제로인플레이티드 모형두부분 회귀가우시안 마코프 랜덤필드
대표 연구 분야
연구 영역 전체보기
제로-인플레이티드 및 패널나이즈드 두-부분 회귀를 통한 손상·발생 위험 모델링 thumbnail
제로-인플레이티드 및 패널나이즈드 두-부분 회귀를 통한 손상·발생 위험 모델링
Risk and damage modeling using zero-inflated two-part regression with penalized variable selection
연구 분야 상세보기
연구 성과 추이
표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.
주요 논문
5
논문 전체보기
1
Article
|
인용수 1
·
2024
Variable selection and prediction performance of penalized two-part regression with community-based crime data application
Seong‐Tae Kim, Man Sik Park
IF 0.6 (2024)
Communications for Statistical Applications and Methods
반연속(semi-continuous) 자료는 0에서의 점확률 질량과 양의 값에 대한 연속 분포가 혼합된 형태로 특징지어진다. 이러한 유형의 자료는 흔히 2-부분(two-part) 모형으로 모델링되며, 첫 번째 부분은 이분형 결과(0 또는 양의 값)의 확률을 모형화하고, 두 번째 부분은 양의 값의 분포를 모형화한다. 2-부분 모형의 인기가 있음에도 불구하고, 특히 고차원 자료에서 이 모형에 대한 변수 선택은 충분히 다루어지지 않았다. 본 연구의 목적은 2-부분 모형에서 패널화된 회귀(penalized regression) 방법의 변수 선택 및 예측 성능을 조사하는 것이다. 시뮬레이션 연구를 통해 2-부분 모형에서 선택된 기법들의 성능을 평가하였다. 본 연구의 결과는 LASSO와 ENET이 SCAD와 MCP보다 더 많은 예측변수를 모형에 선택하는 경향이 있음을 보여준다. 그 결과, β-특이성(β-specificity)에서는 MCP와 SCAD가 LASSO와 ENET보다 우수하였고, 평균제곱오차(mean squared error) 측면에서는 LASSO와 ENET이 MCP와 SCAD보다 더 나은 성능을 보였다. 지역사회 기반 자료를 이용하여 범죄 발생 건수를 예측할 때 패널화된 회귀 방법을 적용한 경우에도 유사한 결과를 확인하였다.
https://doi.org/10.29220/csam.2024.31.4.441
Lasso (programming language)
Feature selection
Scad
Statistics
Mathematics
Regression analysis
Elastic net regularization
Regression
Model selection
Logistic regression
2
Article
|
·
인용수 0
·
2024
Spatial Neighborhood Order Determination for Gaussian Markov Random Fields
The Korean Data Analysis Society, Jennifer A. Hoeting, Man Sik Park
The Korean Data Analysis Society
https://doi.org/10.37727/jkdas.2024.26.6.1671
Random field
Statistical physics
Markov chain
Gaussian
Gaussian random field
Order (exchange)
Mathematics
Computer science
Gaussian process
Statistics
3
Article
|
·
인용수 0
·
2021
Clustering County-wise COVID-19 Dynamics in North Carolina, USA
Seong‐Tae Kim, Man Sik Park
The Korean Data Analysis Society
COVID-19 팬데믹은 미국에서 전례 없는 영향과 함께 막대한 수의 확진자와 사망자를 초래하였다. 본 연구의 목적은 COVID-19 데이터를 이용하여 노스캐롤라이나의 카운티들 사이에 숨은 군집이 존재하는지 확인하는 것이다. 개별 주에서는 COVID-19 팬데믹에 대처하기 위한 자체 정책을 시행하므로, 본 연구는 단일 주인 노스캐롤라이나로 한정하였다. 우리는 두 가지 군집화 기법인 동적 시간 왜곡(dynamic time warping)과 딥러닝 오토인코더(deep learning autoencoder)를 통합하였다. 본 연구는 Johns Hopkins University Center for Systems Science and Engineering의 COVID-19 Visual Dashboard를 위한 데이터 저장소인 GitHub COVID-19 Data Set의 노스캐롤라이나 카운티별 COVID-19 데이터를 사용하였다. 이 저장소에서 2020년 3월 3일부터 2020년 9월 19일까지의 COVID-19 일별 확진자 수와 사망자 수를 선택하였다. 이러한 군집화 기법들은 COVID-19 감염과 치명률(fatality) 자료 모두에서 세 개의 대도시권을 나머지 지역과 구분하는 유사한 계층적 군집을 확인하였으며, 이는 인구 규모 및 노인 인구 비율과 같은 인구통계학적 변수들과 유의하게 상관된다. 본 연구의 결과는 COVID-19 유행에서 인구 밀도와 연결성의 중요성을 시사한다.
https://doi.org/10.37727/jkdas.2021.23.6.2535
Pandemic
Geography
Coronavirus disease 2019 (COVID-19)
Cluster analysis
Population
Demography
Cluster (spacecraft)
Cartography
Computer science
Medicine
최신 정부 과제
2
과제 전체보기
1
주관|
2012년 4월-2015년 4월
|46,030,000
환경관측자료에 있어서 비대칭 시공간 공분산구조의 검정과 모형화
시공간 상에서 측정되는 변수를 공간지리정보 뿐만 아니라 관측시점의 정보를 통합한 시공간 공분산함수 모형으로 구축하고자 한다. 즉, 시간효과와 공간효과의 결합으로 이루어지는 비대칭성 및 비분리성을 구현할 수 있는 모형을 적용하고자 한다. 그리고 비대칭적인 시공간 공분산함수 모형을 실증분석에 적용하고, 생성된 예측지도를 기반으로 대칭성의 위배 정도를 검정하는 새로운 방법을 개발하며, 모수적 붓스트랩방법을 통해 비대칭적인 시공간 공분산함수 모형을 추론하는 것이 이 연구과제의 최종 연구목표이다. 이를 통해 비대칭성의 정보를 지니고 있는 시공간 공분산함수의 모수들을 추정하고 붓스트랩 방법에 의한 신뢰구간을 생성함으로써 모수 각각에 대한 가설검정을 용이하게 하고자 한다. 또한 구체적으로 어떠한 대칭성이 충족, 위배되는지를 쉽게 알아보고자 한다.
정상성
대칭성
공분산함수
분리성
모수적 붓스트랩
분산분석
예측지도
퓨리에 변환
스펙트럼
2
주관|
2012년 4월-2015년 4월
|45,718,000
환경관측자료에 있어서 비대칭 시공간 공분산구조의 검정과 모형화
첫째, 시공간자료의 신뢰성 있는 예측을 도출하기 위해 관측지점들로부터 측정되는 변수를 공간지리정보와 관측시점의 정보를 통합한 비대칭적 시공간 공분산함수 모형으로 적합하고자 한다. 그리고 비대칭적인 시공간 공분산함수 모형을 이용해 공간 예측(prediction)과 시간 예측(forecasting)을 수행할 것이다. 이를 위해 다음 사항이 중점 연구될 것이다: 1) 시공간자료의 분석에 대한 기존 연구 고찰; 2) 비대칭성(asymmetric)이나 비분리성(non-separable) 모형의 이론 연구; 3) 환경관측 자료의 실증분석. 둘째, 도출된 예측지도(prediction map)를 바탕으로 자료에 내재된 속성들 중 대칭성의 위배를 탐지하는 검정방법을 적용하고자 한다. 이를 위해 스펙트럼(spectrum)과 페이즈(phase)를 이용한 일원분류 분산분석방법을 사용할 것이다. 또한 특정한 대칭성의 위배를 검정하기 위한 새로운 방법을 개발하고자 한다. 1) ‘axial symmetry in time’, ‘axial symmetry in space’의 위배 검정법의 적용; 2) ‘diagonal symmetry in space’의 위배 검정법 개발; 3) 환경관측 자료의 실증분석. 셋째, 이러한 두 연구결과물들을 융합하여 비대칭적인 시공간 공분산함수 모형을 추론하고자 한다. 이를 위해 모수적 붓스트랩 방법을 시공간 자료로 확장할 수 있도록 응용할 것이다. 그 결과로 비대칭성의 정보를 지니고 있는 시공간 공분산함수의 모수들을 추정하고 붓스트랩 방법에 의한 신뢰구간을 생성함으로써 모수 각각에 대한 가설검정을 용이하게 하고자 한다. 이를 통해 구체적으로 어떤 대칭성이 충족되거나 위배되는 지를 쉽게 알아보고자 한다. 1) 모수적 붓스트랩 방법의 이론적 배경 연구 2) 시공간 공분산 함수모형에의 응용.
정상성
대칭성
분리성
공분산함수
모수적 붓스트랩
스펙트럼
퓨리에 변환
예측지도
분산분석