표제지
논문개요
목차
제1장 서론 11
1. 연구 배경 및 목적 11
2. 관련 연구 검토 22
가. OUSD 및 GAO 성과 보고서 22
나. IDA, RAND 등 연구 결과 28
다. 일반 학계 연구 결과 30
제2장 분석자료 및 분석방법 34
1. 분석 자료 및 변수 설명 34
2. 데이터의 탐색 및 전처리 37
3. 분석 방법론 46
가. 일반화 선형 모형과 로지스틱 회귀 모형 46
나. 벌점화 회귀 모형과 GLMNET 49
다. 랜덤 포레스트(Random Forest) 54
제3장 분석 수행 결과 56
1. 모형별 분석 결과 57
가. 일반화 선형 모형(GLM): 로지스틱 회귀 모형 57
나. GLMNET: LASSO, Elastic-net, Ridge 63
다. 랜덤 포레스트(Random Forest) 70
2. 종합 분석 결과 74
가. 변수 유의성/중요도 분석 결과 종합 74
나. 모형 예측 성능 평가 결과 76
제4장 결론 78
참고 문헌 81
ABSTRACT 87
〈표 1-1〉 Nunn-McCurdy Act - 위반(Breach) 기준 14
〈표 1-2〉 목표비용관리(CAIV)와 목표양산단가 관리 기준 비교 18
〈표 1-3〉 미 국방부(DoD) 공식 Nunn-McCurdy 위반 목록 24
〈표 2-1〉 분석 자료 입력 변수 식별 35
〈표 2-2〉 분석 자료 반응변수(종속변수) 식별 36
〈표 2-3〉 반응변수(종속변수) 변환에 따른 신규 변수 생성 39
〈표 2-4〉 변수 간 상관관계 분석 결과 요약 (1) 누적 변동(To Date) 39
〈표 2-5〉 변수 간 상관관계 분석 결과 요약 (2) 분기 변동(This Quarter) 40
〈표 2-6〉 누적 변동 및 분기 변동 주요 변수 VIF 확인 결과 42
〈표 2-7〉 Y_new 변수 상관관계 분석 결과 44
〈표 3-1〉 로지스틱 회귀 모형 적합 결과 60
〈표 3-2〉 로지스틱 회귀 모형 설명변수 가능도비 검정 및 프로파일 신뢰 구간 61
〈표 3-3〉 로지스틱 회귀 모형 예측 성능 및 정확도 평가 62
〈표 3-4〉 Nunn-McCurdy 반응변수 항목별 변수 유의성(LASSO) 63
〈표 3-5〉 glmnet LASSO 모형 유의한 변수 Coefficient 66
〈표 3-6〉 glmnet Elastic-net 모형 유의한 변수 Coefficient 67
〈표 3-7〉 glmnet 모형별 예측 성능 및 정확도 평가 69
〈표 3-8〉 랜덤 포레스트 모형 변수 중요도 - 평균 지니지수 감소량 71
〈표 3-9〉 Random Forest 모형 예측 성능 및 정확도 평가 73
〈표 3-10〉 모형별 주요 설명변수 중요도 분석 결과 종합 74
〈표 3-11〉 모형별 예측 성능 종합 비교(AUC/이항 편차) 76
〈그림 1-1〉 Nunn-McCurdy 위반 현황 (SAR 기준 1997-2019) 16
〈그림 1-2〉 소요군에 따른 Nunn-McCurdy 위반 연도별 현황 26
〈그림 2-1〉 분기 비용 변동요인 간 산점도 행렬 (고정가 기준) 41
〈그림 2-2〉 누적 변동요인과 예산 관련 변수 간 산점도 행렬 (경상가 기준) 43
〈그림 2-3〉 분기 수량 변동과 위반의 산점도와 병렬상자그림 45
〈그림 3-1〉 분석 프로세스 수립 56
〈그림 3-2〉 glmnet LASSO 모형 적합 결과(plot) 66
〈그림 3-3〉 glmnet Elastic-net 모형 적합 결과(plot) 67
〈그림 3-4〉 glmnet Ridge 모형 적합 결과(plot) 68
〈그림 3-5〉 나무 수에 따른 OOB 오차율 71
〈그림 3-6〉 랜덤 포레스트 모형 변수 중요도 플롯(varimpPlot) 72
〈그림 3-7〉 모형별 예측 성능 비교(ROC Curve) 76