본문바로가기

자료 카테고리

전체 1
도서자료 0
학위논문 1
연속간행물·학술기사 0
멀티미디어 0
동영상 0
국회자료 0
특화자료 0

도서 앰블럼

전체 (0)
일반도서 (0)
E-BOOK (0)
고서 (0)
세미나자료 (0)
웹자료 (0)
전체 (1)
학위논문 (1)
전체 (0)
국내기사 (0)
국외기사 (0)
학술지·잡지 (0)
신문 (0)
전자저널 (0)
전체 (0)
오디오자료 (0)
전자매체 (0)
마이크로폼자료 (0)
지도/기타자료 (0)
전체 (0)
동영상자료 (0)
전체 (0)
외국법률번역DB (0)
국회회의록 (0)
국회의안정보 (0)
전체 (0)
표·그림DB (0)
지식공유 (0)

도서 앰블럼

전체 1
국내공공정책정보
국외공공정책정보
국회자료
전체 ()
정부기관 ()
지방자치단체 ()
공공기관 ()
싱크탱크 ()
국제기구 ()
전체 ()
정부기관 ()
의회기관 ()
싱크탱크 ()
국제기구 ()
전체 ()
국회의원정책자료 ()
입법기관자료 ()

검색결과

검색결과 (전체 1건)

검색결과제한

열기
논문명/저자명
한국프로야구 투수 연봉 평가 척도에 영향을 미치는 경기력 변수 분석 = Analysis of critical factors affecting market value of baseball players (pitchers) in Korea / 전홍권 인기도
발행사항
서울 : 한양대학교 대학원, 2017.2
청구기호
TM 796.069 -17-26
형태사항
v, 69 p. ; 26 cm
자료실
전자자료
제어번호
KDMT1201703380
주기사항
학위논문(석사) -- 한양대학교 대학원, 글로벌스포츠산업학과, 2017.2. 지도교수: 박성배
원문

목차보기더보기

표제지

목차

국문요지 8

I. 서론 9

1. 연구의 필요성 9

2. 연구의 목적 12

3. 연구의 모형 12

4. 연구의 가설 13

II. 이론적 배경 14

1. 세이버메트릭스(Sabermetrics) 14

1) 세이버메트릭스 개관 14

2) 타자 성적 관련 지표 14

3) 투수 성적 관련 지표 17

4) WAR(Wins Above Replacement, 대체 선수 대비 승리 기여) 18

2. 데이터마이닝 및 분류 기법 21

1) 데이터마이닝 개관 21

2) 선형회귀분석 21

3) 의사결정나무 22

4) 로지스틱 회귀분석 25

5) 인공신경망 26

6) 베이지안 네트워크 27

7) K-평균 군집분석 27

III. 연구방법 29

1. 연구대상 29

2. 표집방법 33

3. 자료분석 33

IV. 연구결과 37

1. 선형회귀분석 37

2. 분류기법 시행 38

1) C5.0 알고리즘 38

2) CART 알고리즘 39

3) CHAID 알고리즘 40

4) 인공신경망 모형 41

5) 로지스틱 회귀분석 45

6) 베이지안 네트워크 46

7) 각 모형 평가 53

3. K-평균 군집분석 55

1) 분석 개관 55

2) 군집별 분석 56

V. 결론 66

1. 시사점 및 제언 66

2. 제한점 68

참고문헌 69

ABSTRACT 74

표 1. '전통적인 타자 성적 관련 지표' 정의 및 계산법 15

표 2. '세이버메트릭스 타자 성적 관련 지표' 정의 및 계산법 16

표 3. '전통적인 투수 성적 관련 지표' 정의 및 계산법 17

표 4. '세이버메트릭스 투수 성적 관련 지표' 정의 및 계산법 18

표 5. fWAR에 따른 개략적 선수평가 19

표 6. '인구통계학적 정보' 정의 30

표 7. '기존 성적 지표' 데이터 정보 31

표 8. '세이버메트릭스 지표' 계산법 32

표 9. '세이버메트릭스 지표' 데이터 정보 32

표 10. 선형회귀분석 최종 결과 37

표 11. 다층 퍼셉트론(MLP) 신경망 모형 변수, 뉴런 간 가중치 42

표 12. 다층 퍼셉트론(MLP) 신경망 뉴런, 목표변수 간 가중치 43

표 13. 방사형 기저 함수(RBF) 신경망 모형 변수, 뉴런 간 가중치 44

표 14. 방사형 기저 함수(RBF) 신경망 뉴런, 목표변수 간 가중치 45

표 15. 로지스틱 회귀분석 모수 추정값 45

표 16. 베이지안 네트워크(TAN) 입력변수 중 '연령'의 조건부 확률 48

표 17. 베이지안 네트워크(TAN) 입력변수 중 '선발'의 조건부 확률 48

표 18. 베이지안 네트워크(TAN) 입력변수 중 'FIP'의 조건부 확률 49

표 19. 베이지안 네트워크(TAN) 입력변수 중 '삼진'의 조건부 확률 50

표 20. 베이지안 네트워크(Markov Blanket) 입력변수 중 '연령'의 조건부 확률 52

표 21. 베이지안 네트워크(Markov Blanket) 입력변수 중 '삼진'의 조건부 확률 52

표 22. 베이지안 네트워크(Markov Blanket) 목표변수 '연봉인상여부'의 조건부 확률 52

표 23. 각 분석모델 간 AUC Curve, Gini 계수 비교 54

표 24. 군집 수에 따른 K-평균 군집분석 평균 실루엣, 집합 수, 크기 비율 비교 55

표 25. 군집 전체 대상 입력변수별 평균, 상위 및 하위 25% 해당 수치 비교 56

표 26. 군집 내 크기, 연봉인상비율 및 각 입력변수 평균 비교분석 57

표 27. 2016시즌 연봉 계약 대상자 중 군집-1 분류 선수 59

표 28. 2016시즌 연봉 계약 대상자 중 군집-2 분류 선수 60

표 29. 2016시즌 연봉 계약 대상자 중 군집-3 분류 선수 61

표 30. 2016시즌 연봉 계약 대상자 중 군집-4 분류 선수 61

표 31. 2016시즌 연봉 계약 대상자 중 군집-5 분류 선수 63

표 32. 2016시즌 연봉 계약 대상자 중 군집-6 분류 선수 64

표 33. 2016시즌 연봉 계약 대상자 중 군집-7 분류 선수 65

그림 1. 연구모형 13

그림 2. 2010년 메이저 리그 선수 fWAR 분포도 20

그림 3. CART 알고리즘 보정오차비율 공식 23

그림 4. 로지스틱 회귀분석의 기본 등식 25

그림 5. 로지스틱 회귀분석의 로지스틱 모형 26

그림 6. CRISP-DM 방법론 도식화 34

그림 7. CRISP-DM 방법론 단계별 설명 35

그림 8. 본 연구 분석에 사용된 SPSS Modeler 스트림 36

그림 9. 선형회귀분석 예측자 중요도 분석 결과 37

그림 10. C5.0 알고리즘 예측자 중요도 분석 결과 38

그림 11. C5.0 알고리즘 의사결정나무 분석 결과 38

그림 12. CART 알고리즘 예측자 중요도 분석 결과 39

그림 13. CART 알고리즘 의사결정나무 분석 결과 39

그림 14. CHAID 알고리즘 예측자 중요도 분석 결과 40

그림 15. CHAID 알고리즘 의사결정나무 분석 결과 40

그림 16. 다층 퍼셉트론(MLP) 신경망 모형 예측자 중요도 분석 결과 41

그림 17. 다층 퍼셉트론(MLP) 신경망 모형 네트워크 도식화 42

그림 18. 방사형 기저 함수(RBF) 신경망 모형 예측자 중요도 분석 결과 43

그림 19. 방사형 기저 함수(RBF) 신경망 모형 네트워크 도식화 44

그림 20. 로지스틱 회귀분석 도출식 46

그림 21. 베이지안 네트워크(TAN) 분석에 대한 예측자 중요도 47

그림 22. 베이지안 네트워크(TAN) 분석에 따른 과정 도식화 47

그림 23. 베이지안 네트워크(Markov Blanket) 분석에 대한 예측자 중요도 51

그림 24. 베이지안 네트워크(Markov Blanket) 분석에 따른 과정 도식화 51

그림 25. 군집-2(에이스급 선발 투수), 군집-7(핵심 불펜 투수) 간 군집 비교 57

초록보기 더보기

 본 연구는 프로야구의 핵심 상품인 선수의 경기력을 입증하는 척도 중 하나인 연봉 산정에 관련하여, 선수의 인구통계학적 지표, 입단 및 이적 정보, 그리고 전통적인 성적 지표 및 세이버메트릭스 지표 중 연봉인상여부와 유의미한 연관성을 지닌 변수를 각종 분석기법을 통해 분석했다. 1997~2015년에 1군 기록이 있는 투수 중 차기년도, 군입대자의 경우 군제대 후 시즌에 재계약한 2,792개의 데이터를 대상으로 삼았다.

일차적으로, 선형회귀분석을 통해 예측자 중요도가 0.05이상이고 유의확률이 .05이하인 FIP, 삼진, 연령, 선발 변수를 유의한 예측자로 분석하였다. 다음으로 C5.0, CART, CHAID 등 의사결정나무 기법, 다층 퍼셉트론(MLP)와 방사형 기본함수(RBF)를 각각의 모델로 한 인공신경망 기법, 로지스틱 회귀 분석 기법, TAN, Markov Blanket을 각각의 구조 유형으로 채택한 베이지안 네트워크 기법 등 각 분류기법을 실행하여 AUC Value와 Gini 계수를 비교 분석했다. 그 결과, 다층 퍼셉트론을 모델로 한 인공신경망의 AUC Value 및 Gini 계수가 가장 높아 해당 모델이 예측자로 분석한 FIP, 삼진, 연령, 선발 변수를 다음 단계인 K-평균 군집분석(K-means clustering)의 입력변수로 채택했다.

K-평균 군집분석을 통해 총 7개의 군집을 형성할 수 있었으며, 그 중 평균 26.4회 의 선발 등판, 평균 121.17개의 탈삼진, 평균 4.08의 FIP(수비 무관 추정 평균자책점)를 기록하며 각 지표에서 모두 평균 이상, 즉, 에이스급 선발투수의 특성을 지니고 있는 군집-2(전체의 8.2%, 228개)의 연봉인상비율이 84.649%, 평균 3.78의 FIP, 68.46개의 탈삼진을 기록했으나, 평균 1.69개의 선발 등판을 기록하며 핵심 불펜투수의 특성을 지니고 있는 군집-7의 연봉인상비율이 81.646%를 기록하며 연봉인상이 가능한 성적에 대한 기준을 제시하는 역할을 했다.

본 연구를 진행한 결과, 선발투수 및 불펜투수는 평균 이상의 탈삼진과 FIP를 기록할 경우 연봉이 인상된다는 사실을 입증할 수 있었다. 특히 전통적인 지표였던 평균자책점(ERA)보다 FIP가 연봉인상에 유의미하게 적용된다는 점으로 보았을 때, 향후 세이버메트릭스 관련 척도가 국내 프로야구 실정에 맞게 기존 지표가 조정되거나, 새로운 지표가 도출될 경우 연봉인상과 관련되어 더욱 유의미한 결과를 도출할 것으로 전망된다.

권호기사보기

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 기사목차
연속간행물 팝업 열기 연속간행물 팝업 열기