2020년은 평년과 비교하여 가파른 부동산 가격상승이 발생한 시기였다. 전세보증금을 이용한 매수 형태인 갭투자가 크게 증가하였고 갭투자는 매매유형의 하나로 자리 잡았다. 공동주택 가격 또는 가격형성요인에 관한 선행연구는 매매시장과 전세시장을 분리해서 고려하거나 매매시장과 전세시장의 지수분석을 통한 선후관계 입증이 주를 이루었다. 본 연구는 공동주택 가격추정에 있어 가격형성 요인으로 전세특성을 고려하여 과연 어떤 요인들이 공동주택 매매가격에 영향을 미치는지를 회귀분석과 기계학습 기법을 통해 살펴보고, 그에 대한 분석과 함께 도출된 결과를 바탕으로 정책적 대안을 제시하는 데 목적을 두고 있다.
본 연구는 대전광역시 유성구 노은지구의 아파트 35개 단지를 대상으로 실거래가격 및 전세가격 분석을 통해 진행하였다. 연구의 방법으로는 이론적 배경으로 매매시장과 전세시장의 개념과 특성, 매매시장과 전세시장을 바라보는 두 가지 이론에 대해 알아보고 방법론으로서 기계학습 기법에 대한 개념 및 이론을 살펴보았다. 관련 이론을 바탕으로 기존 선행연구들에서 밝혀진 한계점과 문제점들을 고려하여 변수를 설정하였다. 이후 분석의 방법 및 연구모형을 정하고 가설을 설정하였으며, 실증분석을 위해 먼저 기초통계량 및 각 변수 분석을 실시하였고 통계기반 회귀분석 기법인 헤도닉 모형 분석과 기계학습 모형 분석을 병행하였다. 회귀분석의 헤도닉 모형 분석을 통해 독립변수 중 전세특성 변수의 방향성에 대해 검증하였고 기계학습 모형 분석을 통해 각 모형별 예측 정확도를 도출하였다. 이후 순열특성중요도(Permutation feature importance) 분석을 통해 공동주택 가격형성요인의 중요도 분석을 실시하였다.
분석 결과, 공동주택 가격형성요인에서 전세특성 변수인 전세거래량과 전세금액이 모두 매매가격에 정(+)의 영향력을 미치는 것으로 나타났다. 각 모형별 예측 정확도는 기계학습 기법인 랜덤포레스트 모형이 가장 높게 나왔고 그다음으로 딥러닝 모형, 회귀분석 모형 순으로 예측 정확도가 높게 나왔다. 각 모형에서 전세특성을 고려 한 경우, 전세특성을 고려하지 않은 경우에 비해 예측 정확도가 모두 상승하여 전세특성이 가격 예측에 있어 중요한 요인으로 작용함이 입증되었다. 가격형성요인 중요도 분석 결과 랜덤포레스트와 회귀분석에서 전세특성 중 전세가격이 가장 중요한 요인으로 도출되었으며 MLP 모형에서도 상대적으로 중요한 요인으로 도출되었다.
본 연구를 통한 정책적 시사점 및 제언은 다음과 같다. 첫째, 시장 참여자 및 부동산 관련 이해 당사자에게 가격형성요인의 개념의 확장을 통한 공동주택 가격형성요인의 올바른 이해를 가능하게 하고자 한다. 둘째, 주택 안정화 정책의 수립에 있어 전세시장과 매매시장을 연계시켜 고려하는 것에 대한 시사점을 제공하여 이를 바탕으로 주택 안정화 정책에 있어서 매매시장에 관한 동시적이고 효율성 있는 정책 방향을 제시한다. 마지막으로, 부동산 관련 데이터를 종합적으로 고려할 수 있는 기계학습 모형을 바탕으로 주택시장을 분석하고, 공시제도 및 주택 통계지표 작성 및 정책 수립에 있어 적용하는 경우 보다 효율적이고 예측정확도 높은 주택 정책 수행이 가능할 것이다.
본 연구는 대전광역시 노은지구라는 세부시장을 대상으로 연구를 진행하여, 이를 다른 지역에 적용하는 경우 지역의 특성 및 시장의 특성이 상이하여 분석 결과가 다르게 나타날 수 있다는 한계점이 있다. 또한 본 연구에서 사용한 회귀분석과 기계학습 기법에 따른 순열특성중요도 분석결과는 분석 방법의 차이로 인해 각 순서의 비교 및 우열의 판단이 어려워 이에 대한 종합적 결론을 내리기가 어렵다는 한계점이 존재한다. 다만 기계학습 기법의 높은 예측력과 적용의 용이성에도 불구하고 존재하는 '블랙박스' 모형이라는 한계점은 기계학습 기법의 발전과 더불어 추후 해결될 것으로 기대되며, 주택 시장 분석 및 주택 정책 활용에 있어 변수 간의 관계를 직접적으로 해석할 수 있는 헤도닉 모형도 상호보완적으로 함께 분석하여 활용할 필요가 있다.