국내의 전체 교통사고 발생 건수는 감소추세이며 이는 정부 및 관련 기관에서 교통사고의 심각성을 무겁게 인식하고 교통안전의 체계적인 계획과 개선대책을 수립하는 등 다각적인 노력을 추진함에 따른 긍정적인 결과로 판단된다. 그러나 우리나라 도로 교통망의 중요한 축(軸)을 이루며 주요 도시를 연결하는 고속도로의 교통사고는 사고추세의 증감을 반복하고 있고, 도로 종류 중 고속도로에서의 교통사고 치사율은 최고치를 나타내고 있다.
2021년 기준, OECD 국가별 교통사고 건수 부문에서 우리나라는 OECD 평균보다 약 2.5배 많은 사고가 발생했고 OECD 국가별 인구 10만 명당 교통사고 건수는 회원국 평균 27.0건인데 비해 우리나라의 수치는 74.2건으로 OECD 회원국 평균보다 약 2.8배 많은 교통사고가 발생하고 있어 현재까지도 높은 수치를 나타내고 있음을 알 수 있다. 따라서 국내 고속도로의 사고 감소를 위한 개선의 여지가 분명히 남아있으며 국가의 교통안전 정책을 우선으로 검토하고 국내의 실정을 반영한 다양한 개선대책 수립에 대한 고민이 필요하다.
본 연구에서는 전국 고속도로 노선 중 사고 다발 10개의 노선을 채택하여 고속도로 교통사고 심각도와 사고 심각도에 영향을 미치는 요인을 분석하였다.
이때, 빅 데이터 분석 기법인 머신러닝을 활용하여 기존의 전통적 통계 방법으로는 분석이 곤란했던 영역을 분석하여 분석의 정밀도를 높일 수 있도록 하였다.
또한, 교통사고 자료뿐 아니라 고속도로의 주요 분석단위인 콘 존과 도로의 기하구조 요소를 결합한 자료를 활용하였으며, 머신러닝의 PyCaret 라이브러리로 사고 심각도 모형분석에 가장 최적한 모델을 선정해 고속도로 교통사고 심각도를 분석하고 이에 미치는 영향요인을 규명하고자 하였다.
그리하여 2019년부터 2021년까지 전국 10개 노선에서 발생한 고속도로 교통사고를 분석한 결과 RandomForestRegressor 기법의 성능이 가장 좋았다. 따라서, 해당 기법을 채택하여 고속도로 교통사고 심각도 분석 및 사고 심각도에 미치는 영향요인을 도출하였다.
SHAP 패키지를 활용해 상위 10개의 변수 중요도를 분석한 결과, 고속도로에서 발생한 교통사고 중 사고 심각도에 높은 영향을 미치는 변수는 가해자의 연령대가 20세 이상 39세 미만, 시간대가 주간(06:00-18:00)일 경우, 주말(토~일)의 경우, 계절이 여름과 겨울인 경우, 기상 상태가 흐림일 경우, 가해 운전자 차종이 승합차일 경우, 법규위반이 안전운전 불이행일 경우, 도로 형태가 터널일 경우, 기하구조상 차로 수가 많고 제한속도가 높은 경우로 총 10개의 독립변수에서 고 속도로 교통사고 심각도와 양(+)의 상관관계를 가지는 것으로 나타났다.
본 연구는 전통적인 통계기법이 아닌 머신러닝을 기법을 이용하여 고속도로 교통사고 심각도 모형을 분석하였다는 점에 의의가 있다. 또한, 고속도로에서의 교통사고는 매우 다양한 요인들의 복합적인 작용으로 인해 발생하기 때문에 사고를 정확히 예측하는 데에는 많은 어려움이 따른다. 하지만 분석된 결과를 토대로 본 연구에서 채택한 고속도로 사고 다발 10개의 노선이 아닌 전국의 고속도로 노선의 사고 심각도 분석으로 연구의 범위를 넓혀 고속도로 사고 심각도에 영향을 미치는 요인을 분석하고 개선방안을 제시한다면 향후 고속도로 교통사고 감소를 위한 기초적인 자료로써 활용이 가능할 것으로 기대한다.