본문 바로가기
학교 전공/데이터베이스

데이터베이스 개론 - 1장 데이터베이스 기본 개념

by 응가1414 2023. 9. 16.

1장 데이터베이스 기본 개념.pdf
4.19MB

1. 데이터베이스의 필요성

학습 목표

  1. 데이터와 정보의 차이를 이해한다.
  2. 데이터베이스의 필요성을 알아본다.
  3. 데이터베이스의 정의에 숨겨진 의미와 주요 특징을 이해한다.
  4. 형태와 특성에 따른 데이터 분류 방법을 알아본다.

1-1 데이터베이스의 필요성

1-1-1 데이터와 정보

  1. 테이터는 현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실이나 값으로, 자료라고한다.
  2. 정보는 데이터를 의사 결정에 유용하게 활용할 수 있도록 처리하여 체계적으로 조직한 결과물이다.

  1. 데이터에서 정보를 추출하는 과정 또는 방법을 정보 처리라 한다
    1. 정보처리는 데이터를 상황에 맞게 분석하거나 해석하여 데이터 간의 의미 관계를 파악하는 것이다.
  2. 현재성과 정확성을 보장하는 가치있는 정보를 얻으려면
    1. 정확히 관찰하고 측정하고 효율적으로 저장
  3. 정보 시스템
    1. 조직 운영에 필요한 데이터를 수집항 저장해두었다가 필요할 때 유용한 정보를 만들어주는 수단
  4. 데이터 베이스
    1. 정보 시스템 안에서 데이터를 저장하고 있다가 필요할 때 제공하는 역활담당

1-1-2 정보 시스템과 데이터베이스

  1. 정보시스템 안의 DB의 역활 : 저장, 제공
  2. 정보 시스템( Information System)
    1. 데이터를 수집하여 저장, 필요할 때 처리하여 유용한 정보를 만들어주는 정보 시스템
    2. 사용 목적에 따라 저장되는 데이터의 내용도 다르고 부르는 이름도 다르다
    3. 정보 시스템은 의사 결정 지원 시스템( DSS: Decision Support System) dlfk gksek.
    4. 정보 시스템의 핵심 요서인 데이터베이스가 중요

1-2 데이터베이스의 정의와 특징

1-2-1 데이터베이스의 정의

  1. 컴퓨터 중심의 데이터베이스 개발과 관리( Development and Management of a Computer-centered Data Base)
  2. 테이터 베이스는
    1. 특정 조직의 여러 사용자가 '공유'하여 사용할 수 있도록 '통합'해서 '저장'한 운영 데이터의 집합

1. 데이터베이스는 공유데이터

특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있는 공용 데이터

2. 데이터베이스는 통합 데이터

데이터의 중복성, 데이터가 중복되면 관리하기 어려운 문제가 발생할 수 있기 때문

통제가 가능한 중복만 허용한다.

3. 데이터베이스는 저장 데이터

컴퓨터가 접근할 수 있는 메체에 데이터베이스를 저장해야 한다.

4. 데이터베이스는 운영 데이터

조직의 주요 기능을 수행하기 위해 필요한 지속적으로 유지해야 하는 데이터

1-2-2 데이터베이스의 특징

1. 데이터베이스는 실시간 접근( real-time a accessibility)이 가능하다.

사용자의 데이터 요구에 실시간으로 응답가능

2. 데이터베이스는 계속 변화(continuous evolution)한다.

동적인 특징인 삽입(insert), 삭제(delete), 수정(update)하여 현재의 정확한 데이터를 유지

3. 데이터베이스는 동시 공유(concurrent sharing)가 가능하다

사용자뿐만 아니라 다른 유저가 같은, 다른 데이터를 사용가능하다

동시 공유는 여러 사용자가 서로 다른 데이터를 동시에 사용하는 것뿐 아니라, 같은 데이터를 동시에 사용하는 것도 모두 지원한다.

4. 데이터베이스는 내용으로 참조(content reference)가 가능하다

데이터베이스는 저장된 주소나 위치가 아닌 데이터의 내용(content), 즉 값(value)dㅡ로 참조할 수 있다.

데이터가 서로 다른 위치에 저장되어 있어도 모두 검색할 수있다.

1-3 데이터 과학 시대의 데이터

데이터베이스의 가장 중요한 목적은 데이터를 모아두는 것이다.

형태와 특성을 중심으로 데이터를 분류해보자

1-3-1 형태에 따른 데이터 분류

정형 데이터

정형 데이터(structured data)는 구조화된 데이터, 즉 미리 정해진 구조에 따라 저장된 데이터다.

데이터 구조에 대한 설명과 데이터 내용은 별도로 유지된다.

반정형 데이터

반정형 데이터 (semi-structured data)는 구조에 따라 저장된 데이터지만 정형 데이터와 달리 데이터 내용 안에 구조에 대한 설명이 함께 존재

구조를 파악하는 파싱(parsing)이 필요

내용과 함께 설명된 데이터 구조를 스키마라고 하지만 메타 데이터(metadata) 라고도 한다.

비정형 데이터

정해진 구조가 없이 저장된 데이터

* NOTE : XML 데이터베이스 VS 멀티미디어 데이터베이스

XML 데이터베이스는 웹에서 시스템 간의 데이터 교환을 위해 작성된 XML문서를 효율적으로 저장, 검색할 수 있도록 개발

  1. 웹 시스템
  2. 기존 DB에 XML 문서 자체를 하나의 단위 저장
  3. XML문서 계층적 구조를 그대로 유지, 효율적 관리 -> XML -> XQuery

멀티미디어 데이터베이스는 문자나 숫자뿐 아니라 이미지, 영상 등이 조합된 멀티미디어 데이터를 효율적으로 저장, 검색가능

  1. 문자, 숫자, 이미지, 영상을 효율적으로 저장 검색

1-3-2 특성에 따른 데이터 분류

특성에 따른 데이터의 분류

  1. 범주형 데이터 (categorical data) :양적 측면에서 크기 비교와 산술적인 연산이 가능하지 않기 때문에 질적 테이터(Qualitative Data)라고 한다.
    1. 명목형 데이터 (nominal data) :
    2. 순서 즉 서열이 없는 값을 가지는 데이터, 남자와 여자로 구분되는 성별
    3. 순서형 데이터 (ordinal data) :
    4. 순서, 즉 서열이 있는 값을 가지는 데이터로, 1학년 2학년 등으로 구분되는 학년이나 학점
  2. 범주로 구분할 수 있는 값, 즉 종류를 나타내는 값을 가진 데이터
  1. 수치형 데이터 (numerical data) :그래서 양적 데이터(Quantitative Data)라고 한다.
    1. 이산형 데이터(discrete data) :개수를 셀 수 있는 띄엄띄엄 단절된 숫자 값을 가지는 데이터
    2. 개수를 셀 수 있는 고객 수, 판매량,
    3. 연속형 데이터 (continuous data)
    4. 측정을 통해 얻어지는 키, 몸무게, 와 같은 연속적으로 이어진 숫자 값을 가지는 데이터
  2. 크기 비교와 산술적인 연상이 가능한 숫자 값을 가진 데이터, 양적 측면에서 크기 비교와 산술적인 연산이 가능한 숫자 값을 가진 데이터를 의미

* 정석적 데이터 VS 정량적 데이터

  • 정성적 데이터 (qualitative data)사랑의 주관적인 생각과 평가를 기술한 비정형 데이터
  • 좁은 의미로는 범주형 데이터
  • 정량적 데이터 (quantitative data)객관적인 측정을 통해 수치나 도형, 기호 등으로 표현한 정형 data
  • 좁은 의미로는 수치형 데이터

요약

1. 데이터와 정보

  • 데이터 : 현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실이나 값이다.
  • 정보 : 의사 결정에 유용하게 활용할 수 있도록 데이터를 처리한 결과물이다.

2. 정보 처리, 정보 시스템, 데이터베이스

  • 정보 처리 : 데티어에서 정보를 추출하는 과정 또는 방법이다.
  • 정보 시스템 : 조직을 운영하기 위해 필요한 데이터를 수집하여 저장해두었다가 필요할때 유용한 정보를 만들어주는 수단
  • 데이터 베이스 : 정보 시스템 안에서 데이터를 저장하고 있다가 필요할 때 제공하는 역할

3. 데이터베이스의 정의

특정 조직의 여러 사용자가 공유해서 사용할 수 있도록 통합해서 저장한 운영 데이터의 집합이다.

  • 여러 사용자가 함께 소유하고 사용할 수 잇는 공유데이터
  • 중복을 최소화한 통합 데이터
  • 컴퓨터가 접근할 수 있는 매체에 들어 있는 저장 데이터
  • 조직의 주요 기능을 수행하기 위해 반드시 필요한 운영 데이터

4. 데이터베이스의 특징

  • 실시간 접근이 가능하다
  • 동시 공유가 가능하다.
  • 계속 변화한다.
  • 내용으로 참조가 가능하다.

5. 형태에 따른 데이터 분류

  • 정형 데이터 : 미리 정해진 구조에 따라 저장된 데이터
  • 반정형 데이터 : 내용 안에 구조에 대한 설명이 함께 존재하는 데이터
  • 비정형 데이터 : 정해진 구조가 없이 저장된 데이터

6. 특성에 따른 데이터 분류

  • 범주형 데이터 : 범주로 구분할 수 있는 값, 종류를 나타내는 값을 가진 데이터
  • 수치형 데이터 : 크기 비교와 산술적인 연산이 가능한 숫자 값을 가진 데이터