JaeOh Kim - Academia.edu (original) (raw)
Papers by JaeOh Kim
IEEE Access
Sparse partial correlation estimation is a popular topic in high-dimensional data analysis, where... more Sparse partial correlation estimation is a popular topic in high-dimensional data analysis, where nonzero partial correlation represents the conditional dependency between two corresponding variables given the other variables. In the Gaussian graphical model, many methods have been developed using the ℓ 1 regularization to achieve sparsity on conditional dependency. Most of the existing methods impose ℓ 1 penalty on the off-diagonal entries of the precision matrix. This approach may fail to identify the conditional dependencies with partial correlations of moderate magnitudes when the corresponding elements of the precision matrix are relatively small. In this study, we propose a two-stage procedure to estimate sparse partial correlations using scaled Lasso. The proposed procedure resolves the non-convexity of partial correlation estimation by using a consistent estimator of the diagonal elements of the precision matrix from scaled Lasso. Moreover, we develop an efficient algorithm for the proposed method using graphics processing units based on the iterative shrinkage algorithm. Our numerical study shows that the proposed method performs better than the existing methods in terms of edge recovery and the estimation of the partial correlations under the Frobenius norm. INDEX TERMS Gaussian graphical model, graphics processing unit, parallel computation, precision matrix, scaled lasso, sparse partial correlation.
Journal of Society of Korea Industrial and Systems Engineering
With rapid urbanization, the importance of urban warfare is increasing, and it is also required t... more With rapid urbanization, the importance of urban warfare is increasing, and it is also required to reflect the characteristics of cities in wargame models. However, in the military's wargame models, the urbanization factor was calculated and used without theoretical basis. In this study, we investigate techniques for estimating the urbanization factor using Fractal dimension theory. The urbanization factor we propose can suggest a logical and valid representative value when used in conjunction with Agent Based Model and other methodologies.
IEEE Access
We present a nonparametric Bayesian hierarchical (NBH) model and develop a variational approximat... more We present a nonparametric Bayesian hierarchical (NBH) model and develop a variational approximation (VA) algorithm for the curve fitting of the functional radiation response data. The NBH model is based on a Bayesian hierarchical (BH) model with a Gaussian-Inverse Wishart process (G-IWP) prior, which simultaneously smooths multiple functional observations and estimates mean-covariance functions. We use the automatic differentiation variational inference (ADVI) algorithm with a Gaussian distribution as the variational distribution for approximating the posterior distribution of parameters of interest, which is applicable to a wide class of probabilistic models and can also be implemented in Stan (a probabilistic programming system). Using the NBH model and the Gaussian ADVI algorithm, we fit a dataset for the semiconductor obtained from the radiation response map (RRM) of South Korea. INDEX TERMS Bayesian hierarchical model, curve fitting, functional radiation data, Gaussian-inverse Wishart process, Gaussian variational approximation algorithm.
Military Operations Research Society Of Korea, Jun 1, 2020
The Korean Data Analysis Society, Apr 1, 2020
Journal of the Korean data analysis society, 2016
분위수 회귀모형은 반응변수의 조건부 분포에 대하여 포괄적이고 유용한 통계적 정보를 제공한다. 그러나 많은 실제 자료는 설명변수와 반응변수가 비선형의 관계를 갖고 있어 전통적인... more 분위수 회귀모형은 반응변수의 조건부 분포에 대하여 포괄적이고 유용한 통계적 정보를 제공한다. 그러나 많은 실제 자료는 설명변수와 반응변수가 비선형의 관계를 갖고 있어 전통적인 선형 분위수 회귀모형은 왜곡되고 잘못된 결과를 초래할 수 있다. 또한 자료의 복잡성이 증가하여 반응변수가 여러개인 다변량 자료의 분석에 대한 보다 정확한 예측과 더불어 풍부한 해석에 대한 요구가 증가하고 있다. 이러한 이유로 본 연구에서는 다변량 분위수 회귀나무 모형을 제안하였다. 본 연구에서는 기존의 다변량 회귀나무 모형의 분할변수 선택 알고리즘의 문제점을 지적하고 향상된 분할변수 선택 알고리즘을 제안하였다. 제안한 알고리즘은 합리적인 계산시간으로 적용 가능하며 분할변수 선택에서 편향발생의 문제를 갖지 않는 동시에 기존 방법보다 더 정확하게 분할변수를 선택할 수 있있다. 본 연구에서는 모의실험과 실증 예제를 통해 제안한 방법의 우수한 성능과 유용성을 확인하였다.
본 연구에서는 증강된 보병대대의 과학화 전투훈련 데이터 중 공격작전에 관한 장병들의 생존분석을 실시하였다. 과학화 전투훈련은 KCTC(Korea Combat Training ... more 본 연구에서는 증강된 보병대대의 과학화 전투훈련 데이터 중 공격작전에 관한 장병들의 생존분석을 실시하였다. 과학화 전투훈련은 KCTC(Korea Combat Training Center)로 불리는 전투훈련장에서 MILES(Multiple Integrated Lazer Engagement System)와 중앙통제장비체계 등 과학화된 훈련장비와 체계 운용하 훈련부대가 적 전술 및 무기체계를 사용하는 전문 대항군과 실시하는 쌍방 자유기동훈련이다. 이는 훈련기간 동안 훈련지역의 모든 데이터가 저장되어 훈련통제 뿐 아니라 분석 및 사후검토를 할 수 있는 첨단화된 군사 훈련으로 통계적 분석이 가능한 데이터를 제공한다. 분석방법은 모수적 분포 가정이 필요하지 않은 Cox의 비례위험모형을 적용하였으며, 보다 풍부하고 용이한 해석을 위해 의사결정나무모형(CART(Classification and Regression Trees), GUIDE(Generalized, Unbiased, Interaction Detection and Estimation), CTREE(Conditional Inference Trees))을 활용하였다. Cox 비례위험모형의 비례성 가정을 확인하여 이를 위배하는 변수에 대해서 층화하여 분석하고, Cox 비례위험모형 결과복무기간에 관한 해석이 용이하지 않아 단변량으로 local 회귀분석을 통해 추가적인 해석을 시도하였다. CART, GUIDE, CTREE는 모형의 특성별로 나무모형을 형성하며 이를 통하여 다양한 해석이 가능하다.
The Korean Statistical Society, Dec 1, 2020
The Korean Statistical Society, Dec 1, 2016
Journal of the Korea Academia-Industrial cooperation Society, 2021
The Korean Statistical Society, Oct 1, 2020
The Korean Data Analysis Society, Dec 1, 2016
Communications in Statistics - Simulation and Computation, 2021
Quantile functions of the response variable provide a tool for practitioners to analyze both the ... more Quantile functions of the response variable provide a tool for practitioners to analyze both the central tendency and statistical dispersion of data. As a counterpart to the regression tree models,...
Journal of the Military Operations Research Society of Korea, 2020
IEEE Access
Sparse partial correlation estimation is a popular topic in high-dimensional data analysis, where... more Sparse partial correlation estimation is a popular topic in high-dimensional data analysis, where nonzero partial correlation represents the conditional dependency between two corresponding variables given the other variables. In the Gaussian graphical model, many methods have been developed using the ℓ 1 regularization to achieve sparsity on conditional dependency. Most of the existing methods impose ℓ 1 penalty on the off-diagonal entries of the precision matrix. This approach may fail to identify the conditional dependencies with partial correlations of moderate magnitudes when the corresponding elements of the precision matrix are relatively small. In this study, we propose a two-stage procedure to estimate sparse partial correlations using scaled Lasso. The proposed procedure resolves the non-convexity of partial correlation estimation by using a consistent estimator of the diagonal elements of the precision matrix from scaled Lasso. Moreover, we develop an efficient algorithm for the proposed method using graphics processing units based on the iterative shrinkage algorithm. Our numerical study shows that the proposed method performs better than the existing methods in terms of edge recovery and the estimation of the partial correlations under the Frobenius norm. INDEX TERMS Gaussian graphical model, graphics processing unit, parallel computation, precision matrix, scaled lasso, sparse partial correlation.
Journal of Society of Korea Industrial and Systems Engineering
With rapid urbanization, the importance of urban warfare is increasing, and it is also required t... more With rapid urbanization, the importance of urban warfare is increasing, and it is also required to reflect the characteristics of cities in wargame models. However, in the military's wargame models, the urbanization factor was calculated and used without theoretical basis. In this study, we investigate techniques for estimating the urbanization factor using Fractal dimension theory. The urbanization factor we propose can suggest a logical and valid representative value when used in conjunction with Agent Based Model and other methodologies.
IEEE Access
We present a nonparametric Bayesian hierarchical (NBH) model and develop a variational approximat... more We present a nonparametric Bayesian hierarchical (NBH) model and develop a variational approximation (VA) algorithm for the curve fitting of the functional radiation response data. The NBH model is based on a Bayesian hierarchical (BH) model with a Gaussian-Inverse Wishart process (G-IWP) prior, which simultaneously smooths multiple functional observations and estimates mean-covariance functions. We use the automatic differentiation variational inference (ADVI) algorithm with a Gaussian distribution as the variational distribution for approximating the posterior distribution of parameters of interest, which is applicable to a wide class of probabilistic models and can also be implemented in Stan (a probabilistic programming system). Using the NBH model and the Gaussian ADVI algorithm, we fit a dataset for the semiconductor obtained from the radiation response map (RRM) of South Korea. INDEX TERMS Bayesian hierarchical model, curve fitting, functional radiation data, Gaussian-inverse Wishart process, Gaussian variational approximation algorithm.
Military Operations Research Society Of Korea, Jun 1, 2020
The Korean Data Analysis Society, Apr 1, 2020
Journal of the Korean data analysis society, 2016
분위수 회귀모형은 반응변수의 조건부 분포에 대하여 포괄적이고 유용한 통계적 정보를 제공한다. 그러나 많은 실제 자료는 설명변수와 반응변수가 비선형의 관계를 갖고 있어 전통적인... more 분위수 회귀모형은 반응변수의 조건부 분포에 대하여 포괄적이고 유용한 통계적 정보를 제공한다. 그러나 많은 실제 자료는 설명변수와 반응변수가 비선형의 관계를 갖고 있어 전통적인 선형 분위수 회귀모형은 왜곡되고 잘못된 결과를 초래할 수 있다. 또한 자료의 복잡성이 증가하여 반응변수가 여러개인 다변량 자료의 분석에 대한 보다 정확한 예측과 더불어 풍부한 해석에 대한 요구가 증가하고 있다. 이러한 이유로 본 연구에서는 다변량 분위수 회귀나무 모형을 제안하였다. 본 연구에서는 기존의 다변량 회귀나무 모형의 분할변수 선택 알고리즘의 문제점을 지적하고 향상된 분할변수 선택 알고리즘을 제안하였다. 제안한 알고리즘은 합리적인 계산시간으로 적용 가능하며 분할변수 선택에서 편향발생의 문제를 갖지 않는 동시에 기존 방법보다 더 정확하게 분할변수를 선택할 수 있있다. 본 연구에서는 모의실험과 실증 예제를 통해 제안한 방법의 우수한 성능과 유용성을 확인하였다.
본 연구에서는 증강된 보병대대의 과학화 전투훈련 데이터 중 공격작전에 관한 장병들의 생존분석을 실시하였다. 과학화 전투훈련은 KCTC(Korea Combat Training ... more 본 연구에서는 증강된 보병대대의 과학화 전투훈련 데이터 중 공격작전에 관한 장병들의 생존분석을 실시하였다. 과학화 전투훈련은 KCTC(Korea Combat Training Center)로 불리는 전투훈련장에서 MILES(Multiple Integrated Lazer Engagement System)와 중앙통제장비체계 등 과학화된 훈련장비와 체계 운용하 훈련부대가 적 전술 및 무기체계를 사용하는 전문 대항군과 실시하는 쌍방 자유기동훈련이다. 이는 훈련기간 동안 훈련지역의 모든 데이터가 저장되어 훈련통제 뿐 아니라 분석 및 사후검토를 할 수 있는 첨단화된 군사 훈련으로 통계적 분석이 가능한 데이터를 제공한다. 분석방법은 모수적 분포 가정이 필요하지 않은 Cox의 비례위험모형을 적용하였으며, 보다 풍부하고 용이한 해석을 위해 의사결정나무모형(CART(Classification and Regression Trees), GUIDE(Generalized, Unbiased, Interaction Detection and Estimation), CTREE(Conditional Inference Trees))을 활용하였다. Cox 비례위험모형의 비례성 가정을 확인하여 이를 위배하는 변수에 대해서 층화하여 분석하고, Cox 비례위험모형 결과복무기간에 관한 해석이 용이하지 않아 단변량으로 local 회귀분석을 통해 추가적인 해석을 시도하였다. CART, GUIDE, CTREE는 모형의 특성별로 나무모형을 형성하며 이를 통하여 다양한 해석이 가능하다.
The Korean Statistical Society, Dec 1, 2020
The Korean Statistical Society, Dec 1, 2016
Journal of the Korea Academia-Industrial cooperation Society, 2021
The Korean Statistical Society, Oct 1, 2020
The Korean Data Analysis Society, Dec 1, 2016
Communications in Statistics - Simulation and Computation, 2021
Quantile functions of the response variable provide a tool for practitioners to analyze both the ... more Quantile functions of the response variable provide a tool for practitioners to analyze both the central tendency and statistical dispersion of data. As a counterpart to the regression tree models,...
Journal of the Military Operations Research Society of Korea, 2020