22
컴퓨터와 경영 Introduction to Information Management Introduction to Information Management 서병민 [email protected] 한국외국어대학교 Introduction to Information Management 5데이터베이스 제 1 절 파일구조 제 2 절 데이터베이스

Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

컴퓨터와 경영

Introduction to Information ManagementIntroduction to Information Management

서 병 민

[email protected]

한국외국어대학교

Introduction to Information Management

제5장

데이터베이스

제 1 절 파일구조

제 2 절 데이터베이스

Page 2: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

제 1 절 파일구조

1.1 파일의 종류

마스터 파일(master file)

ㅇ 자료처리 대상에 대해 비교적 영구적인 데이터를 보관하는 파일

ㅇ 참고용 데이터

ㅇ 자료처리 내용들의 누적된 통계적 정보를 포함

트랜잭션 파일(transaction file)

ㅇ 일정한 기간에 발생한 거래들을 레코드 별로 모아서 파일화 한 것

ㅇ 거래처리 결과 데이터

ㅇ 마스터 파일의 관련 부분을 갱신하는데 사용

보고서 파일(report file)

ㅇ 보고서 작성의 목적으로 사용

ㅇ 필요한 정보를 추출하여 전체 레코드에 걸쳐 종합된 형태로 구성한 파일

예 : 부서별 영업실적, 수강 학생명단, 매출실적

백업파일(back-up file), 정렬 파일(sorting file)

Introduction to Information Management

제5장

1.2 파일의 구성방식

파일조직

엔트리순차파일

순차 방식

ISAME

키순차파일

인덱스된 파일

색인 순차 방식

다중 키 파일

순차 방식

직접 파일

VSAME 역 파일다중리슽

제 1 절 파일구조

Page 3: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

순차 파일(sequential file)

ㅇ 논리적/물리적 순서가 특정키를 기준으로 일치하도록 정렬된 파일

ㅇ 디스크, 자기 테이프(batch processing)

ㅇ 장점

- 기억 장치를 효율적으로 이용

- 대량의 업무처리 및 일괄처리에 많이 이용

- 데이터 처리가 용이하며 프로그램이 쉬움.

ㅇ 단점

- 파일 중간에 레코드를 삽입, 삭제 시 파일을 재구성 해야 함.

- 순차적으로 검색하기 때문에 레코드를 검색하는데 많은 시간이 소요.

1.2 파일의 구성방식

제 1 절 파일구조

Introduction to Information Management

제5장

색인 순차 파일 (index sequential file) [1]

ㅇ 순차 검색 과 직접 검색 모두가 가능

ㅇ 레코드의 추가, 삭제 및 갱신이 용이함

ㅇ prime data area, index area, overflow area

ㅇ prime data area

- 파일을 구성하는 레코드가 키 순서대로 저장되는 영역

ㅇ index area

- master index : 실린더 색인을 몇 개로 구분하여 저장

- cylinder index : 처리해야 할 키 값을 갖는 레코드 정보를 기록

- track index : 데이터 레코드중의 최대 키 값과 해당 주소 등의 정보 기억

ㅇ overflow area

- 임시 저장장소로 이용

- 새로 추가되는 데이터가 기본 데이터 영역에 저장되지 않을 경우 사용

1.2 파일의 구성방식

제 1 절 파일구조

Page 4: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

색인 순차 파일 (index sequential file) [2]

ㅇ 장점

- 순차 처리와 직접 처리(direct process)를 병행

- 파일 전체를 복사할 필요가 없으므로 레코드의 추가나 삭제가 용이

ㅇ 단점

- 기억 장소(index, overflow area)가 별도로 필요함.

- overflow area에 데이터가 많이 저장되면 검색속도가 느려짐

- 파일 저장 구조를 재구성(reorganization)

- 크기가 다른 레코드를 처리하기가 어려움.

1.2 파일의 구성방식

제 1 절 파일구조

Introduction to Information Management

제5장

색인 순차 파일 [3]

0800

12

레코드 키마스터

100400800

123

레코드 키실린더

2341557898

12345

레코드 키트랙

156248325359399

12345

레코드 키트랙

421525550625786

12345

레코드 키트랙

트랙 색인

실린더 3실린더 2

실린더 색인

마스터 1

마스터 2

마스터색인

실린더 1

제 1 절 파일구조

Page 5: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

다중 키 파일 (multi key file)

ㅇ 여러 개의 키를 이용하여 데이터 레코드를 접근

① 다중 리스트 파일(multi-list file)

ㅇ 하나의 레코드 집합에 대한 여러 개의 상이한 접근 방법을 제공

ㅇ 장점

- 색인의 각 항의 길이가 고정

- 연속적이고 전체적인 검색에 효율적임.

- 파일의 갱신이나 추가 작업이 용이

ㅇ 단점

- 데이터 레코드를 직접 접근해야만 응답이 가능

1.2 파일의 구성방식

제 1 절 파일구조

Introduction to Information Management

제5장

다중 키 파일 (multi key file)

ㅇ 여러 개의 키를 이용하여 데이터 레코드를 접근

② 역 파일(inverted file)

ㅇ 특정한 필드를 여러 개의 색인을 만들어 필드 별 특성에 맞게 작업을 할 수있도록 결합하여 레코드의 주소를 결정하는 파일 시스템

ㅇ 장점

- 질의를 만족하는 레코드를 검색할 때 한번씩 만 접근하면 된다.

- 레코드 삽입과 삭제가 비교적 용이

- 강력한 파일 탐색 능력

- 사용자에게 레코드 검색 자료를 빠른 속도로 제공

ㅇ 단점

- 색인의 각 항의 길이가 가변적이며, 색인을 제어하기가 복잡

- 실시간 데이터 갱신 시 많은 기억 공간이 필요

1.2 파일의 구성방식

제 1 절 파일구조

Page 6: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

수작업 처리의 문제점

ㅇ 오랜 처리시간

ㅇ 데이터중복으로 인한 일관성 유지의 어려움

ㅇ 통합된 정보취득의 어려움

ㅇ 요약된 정보 취득의 어려움

수작업 처리의 문제점

Introduction to Information Management

제5장

파일 처리 시스템

ㅇ 각각의 데이터 파일에 의존하여 개발된 프로그램들

- 업무별로 데이터 처리용 프로그램을 개발하면서 쌓여감

- 독립적인 프로그램 별로 데이터 입출력, 검색 기능

- 데이터 파일마다 형식이 다름

파일 처리 시스템

교수 데이터교수 데이터

학생 데이터학생 데이터

강좌 데이터강좌 데이터

연구 처리 업무연구 처리 업무

학적 관리 업무학적 관리 업무

강의 계획 업무강의 계획 업무

교수 연구 업적명세서

성적표

강의 시간표

Page 7: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

파일 처리 시스템 특징

ㅇ 업무별 데이터 처리를 위한 프로그램 개발

ㅇ 특정 언어 선택(COBOL,FORTRAN, C 등)

ㅇ 프로그래머가 결정한 자료구조 형식의 데이터 파일

ㅇ 시간이 지나면서 업무가 변하면→ 프로그램 수정이 쉬운가?

ㅇ 시간이 지나면서 새로운 업무가 발생하면→ 새로운 프로그램 개발이 쉬운가?

ㅇ 왜 쉽지 않은가?→ 컴퓨터 언어마다 다른 데이터 접근 방법→ 다양한 데이터 파일 구조→ 프로그래머들 사이의 지식 공유가 어려움

파일 처리 시스템 당면과제

파일 처리 시스템

Introduction to Information Management

제5장

파일 처리 시스템의 문제점

ㅇ 데이터 중복 저장 (Redundancy)과 비일관성(inconsistency)

ㅇ 데이터 액세스 문제- 데이터 파일에 접근하기 위하여 파일 형식을 알아야 함- 시간이 지나면서 프로그램 개발자가 달라지고 사용하는 언어도 달라짐

ㅇ 데이터 추가 및 검색의 어려움- 파일의 적당한 위치에 자료를 추가하기 위한 별도의 프로그램 개발 필요- 형식이 서로 다른 데이터 파일이 산재하여 검색 프로그램 작성이 어려움

ㅇ 자료 의존성(Data Dependence)

ㅇ 자료의 통합성(Integration) 부족

ㅇ 자료의 비호환성(incompatibility)이 존재

ㅇ 자료의 공유성(Sharing) 결여

파일 처리 시스템

Page 8: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

파일 처리 시스템의 운영환경

파일 처리 시스템

강좌번호학번이름학과전화번호우편번호주소점수성적

등록 파일

학번이름학과학년전화번호우편번호주소지도교수생년월일

학생 파일

학생 파일 처리응용 프로그램

등록 파일 처리응용 프로그램

중복

Introduction to Information Management

제5장

파일 처리 방식과 데이터베이스 방식 비교

파일방식 vs 데이터베이스

파일 1

ABC

파일 2

BDE

파일 3

BDF

응용시스템 X

응용시스템 Y

응용시스템 Z

파일방식 데이터베이스 방식

데이터베이스

ABCDEF

DBMS

응용시스템 X

응용시스템 Y

응용시스템 Z

Page 9: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

2.1 데이터베이스(DB : DataBase) 의 개념

ㅇ 파일 관리 시스템의 단점을 개선하여 데이터를 통합적으로 관리하는 소프트웨어

시스템을 말함.

ㅇ 조직의 여러 사용자들이 요구한 다양한 정보를 제공하기 위한 데이터들의 집합

ㅇ 특정 조직의 응용 업무에 공동 사용하기 위하여 운영에 필요한 데이터 중복을

최소화하여 대용량 기억 장치 내에 저장된 데이터들의 집합

ㅇ 상호 연관된 자료를 집중화 하여 체계적으로 조직한 자료의 집합

ㅇ 특정 조직 내에서 다수의 사용자들이 공유(share)할 수 있도록 통합(integrate)

시키고 컴퓨터 저장 장치에 저장(store)시킨 운영(operation) 데이터의 집합

ㅇ 데이터베이스의 정의가 의미하는 바는….?

제 2 절 데이터베이스

☞ integration (통합된 자료저장소로의 의미)

☞ sharing (자료의 공유를 전제)

Introduction to Information Management

제5장

제 2 절 데이터베이스

데이터베이스의 필요성

ㅇ 파일 처리 시스템의 단점을 해결하기 위한 방안 [그림 5-6]

- 데이터의 중복(data redundancy)이 심각하게 발생

- 자료 통합성 결여(integration)

- 응용성의 결여 : 응용 프로그램이 파일의 형식에 종속

- 데이터의 불일치(data inconsistency)가 발생

- 프로그래밍 언어마다 파일의 형식이 다름

데이터베이스의 목적과 특성

ㅇ 자료 중복의 최소화 (data minimal redundancy) [그림 5-7]

ㅇ 자료 일치성 확보

ㅇ 자료 독립성 (data independency) 확보

ㅇ 자료 공유성 확보 (data sharing), 동시공유(concurrent sharing)

ㅇ 자료 보안성 확보 (data security, data privacy)

ㅇ 실시간 접근 (real-time accessibility)

ㅇ 계속적인 변화 (continuous evolution)

Page 10: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

제 2 절 데이터베이스

데이터베이스의 장점

ㅇ 데이터의 다중 이용 (concurrent sharing)

ㅇ 파일 수정의 융통성

ㅇ 용이한 데이터 관리

ㅇ 내용에 의한 데이터 접근 (content reference)

ㅇ 자료 중복의 최소화

데이터베이스의 단점

ㅇ 전산화 비용의 증가

ㅇ 시스템 복잡화

ㅇ 시스템의 취약성

Introduction to Information Management

제5장

제 2 절 데이터베이스

데이터베이스의 단점

ㅇ 비용의 증대

- 구축을 위한 인력 및 시간 비용 수반

- 구축된 데이터베이스 관리 비용 유발

ㅇ 시스템 복잡성

- 서로 다른 유형의 관련된 데이터 집합으로써 특정 조건에서는 성능저하로인한 문제점 유발

ㅇ 복구의 복잡성

- 통합된 공유 구조로써 장애 원인 파악 및 조치의 어려움

- 복구 절차의 수립

ㅇ 시스템 취약성

- 중앙 집중식 데이터베이스에 대한 의존도가 증대

- 고장 및 실패로 인한 위험도가 큼 (가용성 및 신뢰성)

참고)분산 데이터베이스의 특징

Page 11: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

제 2 절 데이터베이스

데이터베이스의 운영환경

학번이름지도교수생년월일

학생 파일

강좌번호학번점수성적

등록 파일

학생 파일 처리응용 프로그램

등록 파일 처리응용 프로그램

학과학년전화번호우편번호주소

DBMS

공유

Introduction to Information Management

제5장

제 2 절 데이터베이스

2.2 데이터베이스 시스템 구성도

DBMS(소프트웨어)

데이터베이스컴퓨터

(하드웨어)

데이터베이스언어

A

B

C

D

데이터베이스

3층스키마

ㅇ 스키마

ㅇ DBMS(Data Base Management System)

ㅇ 데이터베이스 언어(DDL, DML, query langaunge

ㅇ 데이터베이스 사용자

ㅇ 데이터베이스

ㅇ 데이터베이스 컴퓨터

Page 12: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

제 2 절 데이터베이스

스키마

ㅇ 데이터베이스를 관점(view)에 따라 3개의 계층으로 분리하여 데이터베이스사용자에게 내부적으로 복잡한 데이터베이스 구조를 단순화시킨 관점을 제공하는 것.

ㅇ 외부단계 (external level)

- 각각의 데이터베이스 사용자관점 또는 사용자 뷰(user view)를 표현하는 단계

ㅇ 개념단계 (conceptual level)

- 데이터베이스에 저장되는 데이터화 그것들 간의 관계(relationship)를 표현하는 단계

ㅇ 내부단계 (internal level)

- 물리적인 저장장치에서 데이터가 실제적으로 저장되는 방법을 표현하는 단계

Introduction to Information Management

제5장

제 2 절 데이터베이스

스키마의 관계 구조

외부 스키마 1(External Schema)

(부스키마 : Subschema)외부 스키마 2 외부 스키마 n

개념 스키마(Conceptual Schema)

내부 스키마(Internal Schema)

저장DB

외부 계층(DB 이용자 관점)

개념 계층(기관의 관점)

내부 계층(저장장치 관점)

외부/개념 매핑(응용 인터페이스)

개념/내부 매핑(저장 인터페이스)

Page 13: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

제 2 절 데이터베이스

DBMS의 기능

데이터 요구요구사항

접수 및 번역개념 스키마

검색

DB

내부스키마검색

외부 스키마검색

사용자

응용 프로그램

DBMS

ㅇ 응용 프로그램이 데이터 접근 가능하도록 데이테베이스의 이용과 관리를 용이하게

해주는 시스템 소프트웨어

ㅇ 데이터베이스를 생성, 삭제, 수정 등의 작업으로 관리하는 시스템

ㅇ 컴퓨터와 사람과의 통역 담당(Interpreter)

- 컴퓨터에 물리적으로 저장된 데이터베이스: 직접 이해불가

DBMS의 여러 도구를 이용하여 쉽게 관리할 수 있음

ㅇ DBMS의 종류

- MS Access, Oracle, Informix, Sybase, MySQL, MS SQL, …

Introduction to Information Management

제5장

제 2 절 데이터베이스

데이터베이스 언어

ㅇ 데이터 정의어(DDL : Data Definition Language)- 데이터베이스를 구축하거나 수정하는 목적으로 사용하는 언어- 개념적 스키마 명세를 위해 사용되는 언어

CREATE, DROP, ALTER

ㅇ 데이터 조작어(DML : Data Manipulation Language)- 데이터베이스 서버에 저장된 정보를 질의 하고 변경 하기 위해 사용되는 언어

INSERT, DELETE, UPDATE, SELECT

ㅇ 데이터 제어어(DCL : Data Control Language) 데이터 정확성, 보안성 관리

ㅇ 질의어 (Query Language)- 파일 구성과 범용 프로그래밍 언어를 정확히 알지 못하는 단말 사용자들이 이용하는

언어- 비절차 언어의 일종인 이 언어는 자연어로 되어 있기 때문에 대화식으로 데이터베이스를쉽게 이용하도록 되어 있음.

데이터 검색 <SQL 검색문의 기본적인 구조>SELECT 열_리스트FROM 테이블_리스트WHERE 조건

Page 14: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

제 2 절 데이터베이스

데이터베이스 사용자

ㅇ 단말 사용자(end user)

- 단말기를 이용하여 데이터베이스를 사용하는 사람.

- 컴퓨터에 관한 전문적인 지식 없이 질의어(query language)를 사용.

ㅇ 응용 프로그래머

- 데이터 조작어를 이용해서 데이터베이스를 응용하고 파일을 처리하는 일을 수행.

ㅇ 데이터베이스 관리자(DBA)

- 데이터베이스 전체를 관리하며, 고장에 대한 복구 기능, 성능 평가, 그리고 데이터의보안 등을 담당.

- 데이터베이스 표준화, 데이터의 검색, 갱신 및 수정 작업을 수행.

- 데이터베이스의 파괴 시 복구 작업을 수립.

- 데이터베이스의 사용자들의 교육과 문서화를 담당.

- 데이터 사전(data dictionary)을 유지 관리.

- 데이터베이스의 물리적 구조를 결정하고 유지.

Introduction to Information Management

제5장

제 2 절 데이터베이스

데이터베이스 시스템 구조도

저장DB

메타데이터

DDL 컴파일러

질의어 처리기

예비 컴파일러DML 컴파일러

실행시간DB

처리기

저장데이터관리자

DDL

질의어

DML응용 프로그램

데이터 관리자(DBA)

일반 관리자(end user)

응용프로그래머

DBMS

데이터 정의어 (DDL : Data Definition Language)데이터 조작어 (DML : Data Manipulation Language)질의어 처리기 (Query Processor)예비 컴파일러 (Precompiler)실행시간 데이터베이스 처리기 (Run-time Database Processor)저장 데이터 관리자 (Stored Data Manager)

Page 15: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

제 2 절 데이터베이스

2.3 데이터베이스 모델

ㅇ 데이터 베이스에 사용된 데이터 모형

– 관계 모형

– 망 모형

– 계층 모형

– 객체 지향 모형 => 1980년대 후반부터 현재까지 계속 응용 범위를 넓혀가는 추세

ㅇ 데이터 모형이란 ?

– 조직내의 실체, 사건, 활동 및 그들 관계에 관한 자료를 추상적으로 기술한 것

ㅇ 데이터 모형화

– 자료 항목을 결정하고 이들 간의 관계를 구조화하는 과정

ㅇ 초기 DBMS 형태 ==> IBM에서 계층형 DBMS 개발 (1965-1970년대 초기)

ㅇ 1980년대 DB 기술 ==> 관계형 DB 가 상용화되어 사용

ㅇ 1980년대 후반 ==> 객체 지향형 DBMS 개발에 총력

1980 년대 후반 까지 널리 사용데이터 모형을 만드는 가장 근본이 되는 것

Introduction to Information Management

제5장

제 2 절 데이터베이스

계층 데이터베이스 모형 [1]

성 명 번 호 전 공

직 급 근무연수 학 위 강좌번호 과 목 학 점

성 명 학 과 학 번

계층 1

계층 2

계층 3

학 생

강 좌경 력

교 수

Page 16: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

제 2 절 데이터베이스

계층 데이터베이스 모형

ㅇ 계층구조는 인간 사회와 매우 친숙하고 자연스러운 모형

ㅇ 데이터 베이스는 인간의 실사회를 표현한 것이므로 계층적으로 구성된 실사회를계층적 데이터 모형으로 표현하는 것은 당연하다

ㅇ 계층 데이터 모형을 이용한 DBMS

- IMS : IBM 이 Apollo 우주선 계획에 참여하면서 개발한 계층 DB의 시조인MARK IV를 개선하여 만든 DBMS

- SYSTEM 2000

ㅇ 장점

- 사용자가 이해하기 쉬운 단순한 데이터 모형

- 제한 사항이 많기 때문에 사용하기가 다른 모형보다도 간단함.

ㅇ 단점

- 자료구조가 복잡, 제한에 따른 레코드 추가, 삭제가 복잡

- 삭제시 자손 세그먼트에 속하는 정보의 손실이 발생

- 선형 검색 방법으로 탐색하므로 동시에 양방향에서 대칭적 탐색이 어려움.

Introduction to Information Management

제5장

제 2 절 데이터베이스

네트워크 데이터베이스 모형

학 과

교 수

학 생

강의

지도

전공

항공사

좌 석

예 약

운 임

항공기

Page 17: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

제 2 절 데이터베이스

네트워크 데이터베이스 모형

ㅇ 네트워크 모형은 DB를 전문으로 연구하는 DBTG 에서 개발하고 표준형으로 제안

ㅇ 계층 모형에서 획일적인 트리 구조 형성을 위하여 제시한 제약 사항을 탈피한 모형

- 서로 관련 있는 세그먼트들이 그물처럼 얽히어 전체 구조는 하나의 망처럼 구성

ㅇ IDMS, DMS 1100, TOTAL

ㅇ 장점

- 구조는 복잡한 대신에 이용하는 데이터 언어가 간단하여 계층 모형과 대조를 이룸

- 특정 하드웨어에 종속되지 않은 DBMS 개발(TOTAL)로 인하여 계층 DBMS보다훨씬 널리 사용

- 다양한 검색이 가능

ㅇ 단점

- 프로그램 작성이 복잡

- 제어가 복잡하여 데이터의 독립성을 유지하기 어려움.

Introduction to Information Management

제5장

제 2 절 데이터베이스

관계 데이터베이스 모델

ㅇ 1969년 IBM의 연구원으로 있던 E.F.Codd가 수학적 기초에 근거를 두고 고안

ㅇ 데이터베이스는 최소한의 의미를 가지는 테이블들로 구성되며 그 테이블들에 있는필드들로 연결한 것

ㅇ 관계형 데이터베이스는 수학적 논리 관계를 테이블 형태로 구성한 구조로테이블 내의 필드 중 일부를 다른 테이블과 중복함으로 해서 각 테이블간의 상관 관계를 정의

ㅇ 장 점- 업무 변화에 대한 적응능력- 유지 보수 편리성- 높은 생산성- 응용 프로그램의 개발 용이

ㅇ 단 점- 시스템의 부하가 상대적으로 높음.

Page 18: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

제 2 절 데이터베이스

관계 데이터베이스 모델

속성(attribute)

80남서기철10403

95여한승현10402

85남최세현10401

성 적성 별성 명학 번

투플(tuple)

도메인(domain)

기본 키(primary key)

릴레이션

Introduction to Information Management

제5장

제 2 절 데이터베이스

관계 데이터베이스 모델

ㅇ 관 계- 2차원의 테이블- 테이블에 포함되는 성질

각 엔트리(entry)들은 단일 값을 가지게 된다

그룹 항목이나 배열(array)을 허용하지 않음

각 열은 유일한 이름을 가지며 열의 순서는 무의미하다

테이블의 모든 행(row)도 동일하지 않으며 행의 순서는 중요한 의미를 갖지 않음

ㅇ 애트리뷰트 (attribute)

- 테이블의 열을 나타내며 데이터의 항목과 유사

ㅇ 튜 플 (tuple)

- 테이블의 행을 나타내며 레코드와 유사한 개념

ㅇ 도메인 (domain)

- 속성들이 나타날 수 있는 값의 범위

Page 19: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

제 2 절 데이터베이스

정규화 (normalization)

ㅇ 데이터베이스(테이블)의 설계를 잘못한 경우 발생하는 문제들

- 삽입 오류(Insert Error)

- 삭제 오류(Delete Error)

- 수정 오류(Update Error)

해결방안(정규화 : Normalization)

- 테이블의 분할, 관계의 설정 등으로 해결

- 관계형 데이터베이스 설계(Relational DBMS)

ㅇ 정규화(normalization)

- 복잡한 데이터의 구조를 단순하고 안정적인 구조로 변환하는 과정

ㅇ 정규화의 종류

- 제 1, 2, 3 정규형, 보이스-코드 정규형, 제 4, 5 정규형

보편적으로 제 3정규형을 만족하면 안정적 구조로 간주

중복중복 테이블테이블 1NF1NF1NF 2NF2NF2NF 3NF3NF3NF ………

중복제거 부분종속제거

전이종속제거

Introduction to Information Management

제5장

제 2 절 데이터베이스

관계 데이터 연산

ㅇ 관계대수(relational algebra)

- 데이터베이스에 주어진 릴레이션으로 부터 어떤 요구되는 릴레이션을 만들기

위해 실제로 사용할 수 있는 조인, 합집합, 프로젝션 같은 명백한 연산집합 제공

- 프로젝션(projection): 주어진 관계 테이블에서 필요한 속성만을 뽑아 새로운 테이블을 형성하는 연산

- 선택(selection): 주어진 관계에서 필요한 투플 일부를 선택하는 데 사용하는 연산자로 관계의 수평적부분 집합을 생성

- 조인(join): 두 개의 관계 테이블을 결합하여 새로운 테이블을 형성하는 연산을 의미.

- 디비전(division): 두 개의 속성으로 된 테이블과 하나의 속성의 테이블 간에 연산에 의해 새로운 테이블을형성하는 연산

ㅇ 관계해석(relational algebra)

- 데이터베이스에 주어진 릴레이션으로 부터 어떤 요구되는 릴레이션을 만들기

Page 20: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

제 2 절 데이터베이스

2.4 분산 데이터베이스 시스템

운영시스템

운영프로그램

데이터베이스관리시스템

데이터베이스

A

B

C

D

사용자

중앙컴퓨터

ㅇ 중앙 집중(centralized) 시스템

- 모든 처리기와 기억 장치가 한 곳에 모여서

- 모든 데이터 처리를 중앙 컴퓨터 시스템에서 처리하는 시스템

Introduction to Information Management

제5장

제 2 절 데이터베이스

2.4 분산 데이터베이스 시스템

ㅇ 분산 데이터베이스 시스템(distributed database system)

- 지리적으로 분산된 여러 노드들을 연결해서 협동으로 처리하는 시스템

- 분산처리기, 통신망, 분산 데이터베이스, 분산 데이터베이스 관리 시스템 구성

운영시스템

운영프로그램

지역데이터베이스관리시스템

지역데이터베이스

A

B

M

사용자

컴퓨터 1(분산 처리기)

분산데이터베이스관리 시스템

:::

운영시스템

운영프로그램

지역데이터베이스관리시스템

지역데이터베이스

A

B

M

사용자

컴퓨터 N(분산 처리기)

분산데이터베이스관리 시스템

:::

::

통신망

Page 21: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

제 2 절 데이터베이스

2.4 분산 데이터베이스 시스템

ㅇ 분산 데이터베이스 시스템의 목적

- 멀리 떨어져 있는 자원과 데이터를 사용함

- 생산성을 향상 및 시스템의 가용성 증대

- 각 노드는 어느 정도의 자치권을 획득

- 지역적인 정보처리의 효율을 증진시키는 것

- 시스템의 확장이나 변경을 용이

- 가용성과 신뢰도를 증진

※ 일부 노드가 고장이 발생하여도 전체 시스템은 계속 가동

- 경제적 환경 변화에 따라 활용이 보편화되어짐.

Introduction to Information Management

제5장

제 2 절 데이터베이스

2.4 분산 데이터베이스 시스템

ㅇ 분산 데이터베이스 장점

- 빠른 응답 속도와 통신비용 절감

- 데이터의 가용성(availability)과 신뢰성의 증가

- 시스템 규모의 적절한 조절

- 각 지역 또는 사용자의 요구 수용 증대

ㅇ 분산 데이터베이스 문제점

- 질의 처리

- 갱신 트랜잭션들의 상호 간섭과 모순된 판독

- 데드록(dead lock)

- 프로토콜의 부하

- 감시와 보호

- 고장 시 복구 작업

Page 22: Introduction to Information Managementpds7.egloos.com/pds/200710/04/89/CM03y(Ch5).pdf · 제5장 제2 절데이터베이스 데이터베이스의필요성 ㅇ파일처리시스템의단점을해결하기위한방안[그림5-6]-데이터의중복(data

Introduction to Information Management

제5장

제 2 절 데이터베이스

2.5 데이터베이스의 응용

ㅇ 객체지향 데이터베이스(object-oriented database)

ㅇ 멀티미디어 데이터베이스

ㅇ 데이터웨어 하우징

ㅇ 데이터 마이닝(data mining)

ㅇ 데이터베이스와 웹