생몰정보
소속
직위
직업
활동분야
주기
서지
국회도서관 서비스 이용에 대한 안내를 해드립니다.
검색결과 (전체 1건)
원문 있는 자료 (1) 열기
원문 아이콘이 없는 경우 국회도서관 방문 시 책자로 이용 가능
목차보기더보기
표제지
목차
국문요지 8
I. 서론 9
1. 연구의 필요성 9
2. 연구의 목적 12
3. 연구의 모형 12
4. 연구의 가설 13
II. 이론적 배경 14
1. 세이버메트릭스(Sabermetrics) 14
1) 세이버메트릭스 개관 14
2) 타자 성적 관련 지표 14
3) 투수 성적 관련 지표 17
4) WAR(Wins Above Replacement, 대체 선수 대비 승리 기여) 18
2. 데이터마이닝 및 분류 기법 21
1) 데이터마이닝 개관 21
2) 선형회귀분석 21
3) 의사결정나무 22
4) 로지스틱 회귀분석 25
5) 인공신경망 26
6) 베이지안 네트워크 27
7) K-평균 군집분석 27
III. 연구방법 29
1. 연구대상 29
2. 표집방법 33
3. 자료분석 33
IV. 연구결과 37
1. 선형회귀분석 37
2. 분류기법 시행 38
1) C5.0 알고리즘 38
2) CART 알고리즘 39
3) CHAID 알고리즘 40
4) 인공신경망 모형 41
5) 로지스틱 회귀분석 45
6) 베이지안 네트워크 46
7) 각 모형 평가 53
3. K-평균 군집분석 55
1) 분석 개관 55
2) 군집별 분석 56
V. 결론 66
1. 시사점 및 제언 66
2. 제한점 68
참고문헌 69
ABSTRACT 74
표 1. '전통적인 타자 성적 관련 지표' 정의 및 계산법 15
표 2. '세이버메트릭스 타자 성적 관련 지표' 정의 및 계산법 16
표 3. '전통적인 투수 성적 관련 지표' 정의 및 계산법 17
표 4. '세이버메트릭스 투수 성적 관련 지표' 정의 및 계산법 18
표 5. fWAR에 따른 개략적 선수평가 19
표 6. '인구통계학적 정보' 정의 30
표 7. '기존 성적 지표' 데이터 정보 31
표 8. '세이버메트릭스 지표' 계산법 32
표 9. '세이버메트릭스 지표' 데이터 정보 32
표 10. 선형회귀분석 최종 결과 37
표 11. 다층 퍼셉트론(MLP) 신경망 모형 변수, 뉴런 간 가중치 42
표 12. 다층 퍼셉트론(MLP) 신경망 뉴런, 목표변수 간 가중치 43
표 13. 방사형 기저 함수(RBF) 신경망 모형 변수, 뉴런 간 가중치 44
표 14. 방사형 기저 함수(RBF) 신경망 뉴런, 목표변수 간 가중치 45
표 15. 로지스틱 회귀분석 모수 추정값 45
표 16. 베이지안 네트워크(TAN) 입력변수 중 '연령'의 조건부 확률 48
표 17. 베이지안 네트워크(TAN) 입력변수 중 '선발'의 조건부 확률 48
표 18. 베이지안 네트워크(TAN) 입력변수 중 'FIP'의 조건부 확률 49
표 19. 베이지안 네트워크(TAN) 입력변수 중 '삼진'의 조건부 확률 50
표 20. 베이지안 네트워크(Markov Blanket) 입력변수 중 '연령'의 조건부 확률 52
표 21. 베이지안 네트워크(Markov Blanket) 입력변수 중 '삼진'의 조건부 확률 52
표 22. 베이지안 네트워크(Markov Blanket) 목표변수 '연봉인상여부'의 조건부 확률 52
표 23. 각 분석모델 간 AUC Curve, Gini 계수 비교 54
표 24. 군집 수에 따른 K-평균 군집분석 평균 실루엣, 집합 수, 크기 비율 비교 55
표 25. 군집 전체 대상 입력변수별 평균, 상위 및 하위 25% 해당 수치 비교 56
표 26. 군집 내 크기, 연봉인상비율 및 각 입력변수 평균 비교분석 57
표 27. 2016시즌 연봉 계약 대상자 중 군집-1 분류 선수 59
표 28. 2016시즌 연봉 계약 대상자 중 군집-2 분류 선수 60
표 29. 2016시즌 연봉 계약 대상자 중 군집-3 분류 선수 61
표 30. 2016시즌 연봉 계약 대상자 중 군집-4 분류 선수 61
표 31. 2016시즌 연봉 계약 대상자 중 군집-5 분류 선수 63
표 32. 2016시즌 연봉 계약 대상자 중 군집-6 분류 선수 64
표 33. 2016시즌 연봉 계약 대상자 중 군집-7 분류 선수 65
그림 1. 연구모형 13
그림 2. 2010년 메이저 리그 선수 fWAR 분포도 20
그림 3. CART 알고리즘 보정오차비율 공식 23
그림 4. 로지스틱 회귀분석의 기본 등식 25
그림 5. 로지스틱 회귀분석의 로지스틱 모형 26
그림 6. CRISP-DM 방법론 도식화 34
그림 7. CRISP-DM 방법론 단계별 설명 35
그림 8. 본 연구 분석에 사용된 SPSS Modeler 스트림 36
그림 9. 선형회귀분석 예측자 중요도 분석 결과 37
그림 10. C5.0 알고리즘 예측자 중요도 분석 결과 38
그림 11. C5.0 알고리즘 의사결정나무 분석 결과 38
그림 12. CART 알고리즘 예측자 중요도 분석 결과 39
그림 13. CART 알고리즘 의사결정나무 분석 결과 39
그림 14. CHAID 알고리즘 예측자 중요도 분석 결과 40
그림 15. CHAID 알고리즘 의사결정나무 분석 결과 40
그림 16. 다층 퍼셉트론(MLP) 신경망 모형 예측자 중요도 분석 결과 41
그림 17. 다층 퍼셉트론(MLP) 신경망 모형 네트워크 도식화 42
그림 18. 방사형 기저 함수(RBF) 신경망 모형 예측자 중요도 분석 결과 43
그림 19. 방사형 기저 함수(RBF) 신경망 모형 네트워크 도식화 44
그림 20. 로지스틱 회귀분석 도출식 46
그림 21. 베이지안 네트워크(TAN) 분석에 대한 예측자 중요도 47
그림 22. 베이지안 네트워크(TAN) 분석에 따른 과정 도식화 47
그림 23. 베이지안 네트워크(Markov Blanket) 분석에 대한 예측자 중요도 51
그림 24. 베이지안 네트워크(Markov Blanket) 분석에 따른 과정 도식화 51
그림 25. 군집-2(에이스급 선발 투수), 군집-7(핵심 불펜 투수) 간 군집 비교 57
초록보기 더보기
본 연구는 프로야구의 핵심 상품인 선수의 경기력을 입증하는 척도 중 하나인 연봉 산정에 관련하여, 선수의 인구통계학적 지표, 입단 및 이적 정보, 그리고 전통적인 성적 지표 및 세이버메트릭스 지표 중 연봉인상여부와 유의미한 연관성을 지닌 변수를 각종 분석기법을 통해 분석했다. 1997~2015년에 1군 기록이 있는 투수 중 차기년도, 군입대자의 경우 군제대 후 시즌에 재계약한 2,792개의 데이터를 대상으로 삼았다.
일차적으로, 선형회귀분석을 통해 예측자 중요도가 0.05이상이고 유의확률이 .05이하인 FIP, 삼진, 연령, 선발 변수를 유의한 예측자로 분석하였다. 다음으로 C5.0, CART, CHAID 등 의사결정나무 기법, 다층 퍼셉트론(MLP)와 방사형 기본함수(RBF)를 각각의 모델로 한 인공신경망 기법, 로지스틱 회귀 분석 기법, TAN, Markov Blanket을 각각의 구조 유형으로 채택한 베이지안 네트워크 기법 등 각 분류기법을 실행하여 AUC Value와 Gini 계수를 비교 분석했다. 그 결과, 다층 퍼셉트론을 모델로 한 인공신경망의 AUC Value 및 Gini 계수가 가장 높아 해당 모델이 예측자로 분석한 FIP, 삼진, 연령, 선발 변수를 다음 단계인 K-평균 군집분석(K-means clustering)의 입력변수로 채택했다.
K-평균 군집분석을 통해 총 7개의 군집을 형성할 수 있었으며, 그 중 평균 26.4회 의 선발 등판, 평균 121.17개의 탈삼진, 평균 4.08의 FIP(수비 무관 추정 평균자책점)를 기록하며 각 지표에서 모두 평균 이상, 즉, 에이스급 선발투수의 특성을 지니고 있는 군집-2(전체의 8.2%, 228개)의 연봉인상비율이 84.649%, 평균 3.78의 FIP, 68.46개의 탈삼진을 기록했으나, 평균 1.69개의 선발 등판을 기록하며 핵심 불펜투수의 특성을 지니고 있는 군집-7의 연봉인상비율이 81.646%를 기록하며 연봉인상이 가능한 성적에 대한 기준을 제시하는 역할을 했다.
본 연구를 진행한 결과, 선발투수 및 불펜투수는 평균 이상의 탈삼진과 FIP를 기록할 경우 연봉이 인상된다는 사실을 입증할 수 있었다. 특히 전통적인 지표였던 평균자책점(ERA)보다 FIP가 연봉인상에 유의미하게 적용된다는 점으로 보았을 때, 향후 세이버메트릭스 관련 척도가 국내 프로야구 실정에 맞게 기존 지표가 조정되거나, 새로운 지표가 도출될 경우 연봉인상과 관련되어 더욱 유의미한 결과를 도출할 것으로 전망된다.
원문구축 및 2018년 이후 자료는 524호에서 직접 열람하십시요.
도서위치안내: / 서가번호:
우편복사 목록담기를 완료하였습니다.
* 표시는 필수사항 입니다.
* 주의: 국회도서관 이용자 모두에게 공유서재로 서비스 됩니다.
저장 되었습니다.
로그인을 하시려면 아이디와 비밀번호를 입력해주세요. 모바일 간편 열람증으로 입실한 경우 회원가입을 해야합니다.
공용 PC이므로 한번 더 로그인 해 주시기 바랍니다.
아이디 또는 비밀번호를 확인해주세요