초고속 통신망, 컴퓨터 및 응용소프트웨어 등 정보기술의 발전으로, 자료의 디지털화 작업이 모든 분야에 보편화되어 문자, 도형, 음성 및 영상 등 정보의 양이 급격히 증가하고 있는 추세에 있다. 이에 따라 정보의 저장, 관리, 운영 및 전송을 효율적으로 처리하기 위한 기술이 증가하고 있고, 멀티미디어 데이터 압축의 중요성이 커지고 있으며, 압축에 관한 연구도 갈수록 활발하게 진행되고 있다.
본 논문에서는 데이터 압축에 관한 개념과 압축 기법의 이론적 체계를 정리하고, 텍스트와 정지영상 데이터의 압축 환경을 구현하여 성능을 측정, 분석 및 평가하고, 각각의 데이터 유형에 적합한 압축 기법을 제시한다.
텍스트 데이터는 무손실 압축 기법인 허프만 부호화, 연속길이 부호화, 산술 부호화 및 LZW 부호화 기법을 구현하여 몇 가지 텍스트 유형별로 압축률 변화를 측정 및 분석 하였다. 정지영상 데이터는 상기 네 가지 무손실 압축 기법과 DCT 기반의 JPEG 손실 압축 기법을 이용하여 JPEG, TIFF, JBIG 및 GIF 형식의 흑백 정지영상과 컬러 정지영상의 압축률 변화를 측정 및 분석 하였다. 흑백 정지영상은 영상 밝기에 따라 사진 영상과 도형 영상 데이터를 유형별로 구분하여 선정 하였고, 컬러 정지영상은 적색, 초록색, 청색, RGB가 균등하게 분포한 영상, 자연영상 데이터를 유형별로 구분하여 선정하였다.
본 논문에서 압축 기법별 데이터 유형별 압축 성능을 측정한 결과, 텍스트 데이터는 사전적 모댈인 LZW 부호화 기법, 흑백 및 컬러 정지영상 데이터는 DCT 기반의 산술 부호화 JPEG 기법이 가장 우수한 압축률을 나타냈다. 데이터 유형에 있어서 텍스트 데이터는 통계적 중복성이 높은 화일이 우수한 압축률을 나타냈고, 흑백 및 컬러 정지영상 데이터는 통계적, 공간적 및 시각적 중복성이 높은 데이터가 우수한 압축률을 나타냈다.