Caramel LabCaramel Lab
#

xgboost

2의 한국어 분석 — 최신순으로 정렬했어요

컴퓨터 과학발표 2025.02· 161최근 1년 160

불균형 데이터 분류: 랜덤 포레스트 및 XGBoost 성능 분석

본 연구는 통신 분야의 고객 이탈 예측과 같은 불균형 데이터 분류 문제에서 Random Forest와 XGBoost 분류기의 성능을 SMOTE, ADASYN, GNUS 세 가지 업샘플링 기법과 결합하여 평가했습니다. 보통 수준(이탈률 15%)부터 극심한 수준(이탈률 1%)까지 다양한 불균형 레벨의 데이터셋을 활용하여 F1 점수, ROC AUC, PR AUC, MCC, Cohen’s Kappa 등의 지표로 성능을 종합적으로 분석했습니다. 연구 결과, 튜닝된 XGBoost와 SMOTE를 결합한 모델(Tuned_XGB_SMOTE)이 모든 불균형 레벨에서 가장 높은 F1 점수와 견고한 성능을 일관되게 보였습니다. 특히 SMOTE는 XGBoost와 함께 사용될 때 가장 효과적인 업샘플링 방법으로 나타났습니다. 반면 Random Forest는 심각한 불균형 조건에서 성능이 저조했습니다. ADASYN은 XGBoost와 함께 사용 시 중간 정도의 효과를 보였으나 Random Forest와는 성능이 좋지 않았고, GNUS는 일관성 없는 결과를 보였습니다. 데이터 불균형은 MCC, Kappa, F1 점수에 상당한 영향을 미쳤지만, ROC AUC와 PR AUC는 비교적 안정적이었습니다. 프리드먼 테스트와 네메니 사후 검정을 통한 통계 분석 결과, Tuned_XGB_SMOTE가 Tuned_RF_GNUS보다 F1 점수, PR-AUC, Kappa, MCC에서 통계적으로 유의미하게 우수한 성능을 보였습니다(p < 0.05). 이러한 결과는 불균형 분류 시나리오에서 모델 선택을 위한 신뢰할 수 있는 프레임워크를 제공합니다.

기계공학발표 2025.02· 66최근 1년 66

폐주물사 친환경 콘크리트 물성 예측

전 세계 건설 프로젝트에서 콘크리트는 필수적인 건축 재료이지만, 그 생산은 상당한 환경 영향을 미칩니다. 급격한 도시 및 산업 성장은 생태계를 압박하고 자원을 고갈시키므로, 전통적인 콘크리트 재료를 대체할 친환경적 대안이 요구됩니다. 폐주물사는 천연 모래를 대체할 잠재적인 지속 가능한 재료로 부상하고 있습니다. 본 연구는 폐주물사를 활용한 콘크리트의 기계적 특성(압축 강도, 인장 강도, 탄성 계수)을 예측하기 위해 CatBoost, XGBoost, HistGBRT, NGBoost, LightGBM, Adaboost, MLR 등 6가지 앙상블 부스팅 알고리즘을 사용했습니다. SHapley additive exPlanations (SHAP) 방법을 활용하여 각 특성 간의 상호 의존성을 파악하고 중요도 계층을 설정했습니다. 모델 성능은 MAE, RMSE, R, NSE, KGE, WI 등 다양한 지표로 평가되었습니다. 그 결과, XGBoost 모델은 압축 강도 예측에서 RMSE 2.845 MPa, R값 0.958로 가장 우수했으며, CatBoost가 그 뒤를 이었습니다. 탄성 계수 예측에서도 XGBoost는 RMSE 0.992 GPa, R값 0.990으로 최고의 성능을 보였고, NGBoost가 두 번째로 우수했습니다. 인장 강도 예측에서도 XGBoost가 뛰어난 성능을 보였습니다. 이 연구는 폐주물사 기반 친환경 콘크리트의 기계적 특성을 효율적으로 예측하는 머신러닝 모델을 제시함으로써, 자원 집약적인 실험실 평가의 필요성을 줄이고 지속 가능한 건설 재료 개발에 기여할 수 있습니다.

연구 트렌드로 돌아가기