본고는 거시적 관점에서 대형 당시 총집인 《전당시》의 상용 어휘를 탐색하고자 하였다. 이를 위한 방안으로 자연어 처리에서 주로 다루는 바이그램 분석을 활용했다. 《전당시》의 모든 작품에서 연속된 2음절로 이루어진 바이그램을 추출하고, 이를 빈도순으로 정리해 어휘로 사용되었을 가능성이 적은 것을 제거하였다. 이러한 작업의 결과로 볼 때, 당나라의 시는 주로 시인들이 멀리 강남 지역으로 가서 장기간 머무르며 지은 시가 많았을 것이라고 추론할 수 있다. 또한 본고에서는 《전당시》에서 추출한 바이그램의 종류와 그 빈도가 다양한 분야에 응용 가능함을 보여주고자 하였다. 5언구와 7언구에 나타나는 바이그램 빈도의 편향성, 첩자의 빈도, 시인들 간의 코사인 유사도 분석, TF-IDF 수치 산출의 기본 요소, 당시 어휘 사전 편찬의 기초 자료 등이 그것이다.