이미지 기하학적 변환의 블라인드 추정은 디지털 이미지 포렌식에서 중요한 문제이다. 본 논문에서는 이미지의 기하학적 변환 매개변수를 예측할 수 있는 end-to-end transformer-based estimator를 제안한다. 기존의 분류 기반 공식에서 벗어나 우리는 변환 행렬을 직접 추정함으로써 보다 일반화된 방법을 제공했다. 내재된 resampling artifact의 frequency peak 위치가 기하학적 변환에 명시적인 단서를 제공한다는 점에 주목한다. 이 기능을 활용하기 위해 공간 주파수의 직접적인 분석을 위해 fast Fourier transform 및 multi-head self-attention의 positional encoding을 사용한다. Regression layer를 transformer 이후에 결합함으로써 이미지의 기하학적 변환 매개변수를 효과적으로 분석한다. 공개된 데이터베이스를 사용한 광범위한 비교 실험을 통해 제안된 방법은 기존 방법보다 더 높은 예측 성능을 나타내며 JPEG 압축에 대한 견고성도 입증한다.