표제지
국문초록
목차
약어표 16
제1장 서론 18
1.1. 연구배경 및 목적 18
1.2. 연구내용 21
1.3. 논문의 구성 21
제2장 관련 연구 22
2.1. 데이터 통합 22
2.1.1. 물리적 통합 22
2.1.2. 논리적 통합 23
2.2. 데이터 표준화 24
2.2.1. 데이터 표준화 개념 24
2.2.2. 데이터 표준화의 원칙과 목적 26
2.2.3. 정부의 공공데이터 표준화 정책 28
2.2.4. 데이터 표준화 사례 29
2.3. 메타데이터 관리 30
2.3.1. 메타데이터 개념 30
2.3.2. 메타데이터 분류 31
2.3.3. ISO/IEC 11179 국제표준 32
2.3.4. 메타데이터 관리 33
2.3.5. 공공데이터의 메타데이터 정책 34
2.4. 데이터 품질관리 36
2.4.1. 데이터 품질관리 개요 36
2.4.2. 데이터 품질관리체계 37
2.4.3. 데이터 품질관리 절차 38
2.4.4. 공공데이터 품질관리 41
2.4.5. 빅데이터 품질관리 영향 42
2.5. 데이터 공유 및 활용 42
2.5.1. 데이터 카탈로그 42
2.5.2. CKAN 개념 45
2.5.3. 데이터 활용을 저해하는 요소 46
2.5.4. 공공데이터 개방과 활용 46
2.5.5. 데이터 활용 연구 49
2.5.6. 데이터 활용 성공사례 51
제3장 데이터관리포털 설계 53
3.1. 데이터 표준관리 53
3.1.1. 데이터 표준화 대상 및 구성요소 54
3.1.2. 데이터 표준화 원칙 55
3.1.3. 데이터 표준관리 프로세스 설계 57
3.1.4. 데이터 표준관리 전산화 요구사항 59
3.1.5. 데이터 표준관리 애플리케이션 개념 60
3.2. 메타데이터관리 설계 62
3.2.1. 오브젝트별 메타데이터 정의 62
3.2.2. 메타데이터 관리 요구사항 65
3.2.3. 메타데이터 수집 66
3.2.4. 메타데이터 관리 절차 67
3.3. 데이터 흐름 및 변경영향분석 설계 67
3.3.1. 데이터 흐름 관리의 중요성 67
3.3.2. 데이터 흐름 관리 요구사항 및 프로세스 설계 68
3.4. 데이터 품질관리 설계 70
3.4.1. 품질관리 프로세스 정의 70
3.4.2. 품질진단 지표 개발 72
3.4.3. 품질진단 규칙 정의 73
3.5. 데이터 업무 전산화 74
제4장 데이터 활용 플랫폼 설계 76
4.1. 데이터 활용 플랫폼 개념 76
4.1.1. 플랫폼 개념도 76
4.1.2. 플랫폼 아키텍처 설계 78
4.2. 요구사항 분석 79
4.2.1. 데이터 이용자 그룹 정의 79
4.2.2. 사용자 요구사항 80
4.3. 데이터 통합 설계 83
4.3.1. 가상화 기반 데이터 통합 83
4.3.2. 데이터 통합 요구사항 85
4.3.3. 데이터 전처리 기법 86
4.3.4. 데이터 세트 생성 환경 88
4.4. 데이터 활용환경 90
4.4.1. 개인화 분석환경 설계 90
4.4.2. AI 분석환경 92
4.4.3. 고급사용자 분석환경 93
4.4.4. 데이터 시각화 94
4.5. 데이터 리소스 공유 환경 95
제5장 운영결과 분석 97
5.1. 운영환경 98
5.2. 데이터관리포털 99
5.2.1. 데이터 표준관리 101
5.2.2. 메타데이터 관리 103
5.2.3. 데이터 품질관리 103
5.2.4. 데이터 흐름 관리 104
5.2.5. 데이터 관련 업무 전산화 105
5.3. 데이터 활용 플랫폼 106
5.3.1. 종합 기능 106
5.3.2. 데이터 리소스 활용 106
5.3.3. 간편 분석기능 109
5.3.4. 고급 분석기능 110
5.3.5. 시범운영 결과 111
제6장 결론 112
참고문헌 115
영문초록 120
표 1. 데이터 표준화 목적 27
표 2. 국가표준 분류 28
표 3. 데이터 표준화 구성요소 29
표 4. 사진을 비유로 한 메타데이터 설명 31
표 5. 메타데이터의 이용 용도 관점에 의한 분류 32
표 6. ISO/IEC 11179의 구성 33
표 7. 데이터 품질관리체계 요소 38
표 8. 데이터 품질진단 5단계 40
표 9. 공공데이터 개방 및 활용 현황 46
표 10. 정부의 공공데이터 개방 주요정책 47
표 11. 데이터 활용을 위한 관리 요소별 중요도 51
표 12. 공공데이터 활용 사례 51
표 13. 데이터 표준화 대상 및 항목 54
표 14. 데이터 표준 구성요소 정의 55
표 15. 도메인 그룹별 정의 56
표 16. 데이터 표준관리 조직 거버넌스 임무 60
표 17. 메타데이터 관리항목 정의 62
표 18. 메타데이터 현행화 절차 정의 67
표 19. 데이터 품질관리 진단지표 72
표 20. 데이터 작업과 작업 주체 간의 기능 정의 75
표 21. 인프라 구성요소 현황 78
표 22. 전문가 그룹 주요 요구사항 80
표 23. 개인화 분석환경 SW 규격 정의 91
표 24. 데이터 표준화 운용현황 101
표 25. 2022년도 품질진단 결과 104
표 26. 데이터 활용 플랫폼 시범운영 후 요구사항 111
그림 1. UBM Survey의 데이터 거버넌스 개념 조사결과 18
그림 2. 데이터 거버넌스 구성요소 19
그림 3. 통합데이터 표준화 절차 30
그림 4. 중앙 메타데이터 관리시스템의 관리항목 35
그림 5. 데이터 품질관리 체계 37
그림 6. 데이터 품질진단 절차 39
그림 7. 2022년도 공공데이터 품질관리 수준 진단 및 평가체계 41
그림 8. DCAT Class 구조 44
그림 9. CKAN 코드 아키텍처 45
그림 10. 데이터콘 제공 사례 49
그림 11. 데이터콘 발행 절차 50
그림 12. 이음동의어 데이터 표준화 예시 57
그림 13. 데이터 표준관리 절차 57
그림 14. 데이터 표준 등록관리 프로세스 58
그림 15. 데이터 표준 변경관리 프로세스 59
그림 16. 데이터 표준관리 흐름도 61
그림 17. 데이터 표준관리 기능 목록 61
그림 18. 메타데이터 수집관리 엑셀 프로그램 66
그림 19. 데이터 신규 연계 프로세스 69
그림 20. 데이터 연계 현황 모식도 69
그림 21. 소스 변경영향도 분석결과 확인 방법 70
그림 22. 데이터 품질관리 프로세스 71
그림 23. 데이터 작업관리 프로세스 75
그림 24. 데이터 활용 플랫폼 개념도 77
그림 25. 사용자 관점의 플랫폼 개념도 77
그림 26. 데이터 활용 플랫폼 SW 구성도 78
그림 27. 사용자 그룹 정의와 그룹별 업무수행 형태 79
그림 28. 데이터 활용 사용자 요구사항 현황 80
그림 29. 데이터 가상화 개념도 84
그림 30. 데이터 전처리 제공 화면 87
그림 31. 데이터 세트 생성기능 화면 89
그림 32. 융합데이터 세트 생성기능 화면 89
그림 33. 개인화 분석환경 개념도 90
그림 34. EAI를 활용한 Python 환경구성 92
그림 35. ML Pipeline 기능 93
그림 36. 고급사용자 분석환경 기술 구조 94
그림 37. 시각화 차트 기능 94
그림 38. DCAT 카탈로그 개념 95
그림 39. 데이터 카탈로그 표준 95
그림 40. 데이터 플랫폼 시스템구성도 98
그림 41. 데이터 플랫폼 운영환경 99
그림 42. 일반사용자용 메인화면 100
그림 43. 전문가용 메인화면 100
그림 44. 데이터 표준 신규 발생 현황 101
그림 45. 실시간 데이터 표준화 현황 대시보드 102
그림 46. 정보시스템 컬럼별 비표준 현황 102
그림 47. 메타데이터 등록 화면 103
그림 48. 실시간 데이터 품질 수준 현황 104
그림 49. 데이터 흐름 관리 화면 105
그림 50. 데이터 모델 변경 이력 화면 105
그림 51. 데이터 활용 플랫폼 메인화면 106
그림 52. 데이터 활용 플랫폼 검색 화면 107
그림 53. 데이터 리소스 검색결과 화면 107
그림 54. 분석모델 리소스 검색결과 화면 108
그림 55. 데이터 시각화 검색결과 화면 108
그림 56. 간편 분석 준비 화면 109
그림 57. 간편 분석 시 알고리즘 선택 화면 109
그림 58. 알고리즘 파라미터 설정 110
그림 59. JupyterLab 화면 110