10장 회복과 병행 제어
10-1 트랜잭션
10-1-1 트랜잭션의 개념
- 데이터베이스는 다수의 사용자가 동시에 사용하더라도 항상 모순이 없는 정확한 데이터를 유지해야한다.
- 데이터베이스에 장애가 발생하더라도 빠른 시간 내에 원래의 상태로 복구 할 수 있어야한다.
- 트랜잭션을 관리함으로써 데이터베이스의 회복과 병행 제어가 가능해져
- 결과적으로 데이터베이스가 일관된 상태를 유지할 수 있게 된다.
- 트랜잭션(transaction)은 작업 하나를 수행하는 데 필요한 데이터베이스의 연산들을 모아놓은 것으로
- 데이터베이스에서 논리적인 작업의 단위가 된다.
- 트랜잭션은 데이터베이스에 장애가 발생했을 때 데이터를 복구하는 작업의 단위도 된다.
- 트랜잭션을 작업 수행에 필요한 SQL 문들의 모임으로 이해해도 좋다.
모순 발생
- 성호가 은경에게 5.000원을 이체할 때 이작업을 수행하는 데 필요한 SQL 문들로 구성된 계좌이체 트랜잭션의 예다.
- 계좌이체 트랜잭션은 2개의 UPDATE문으로 구성되어 있다.
- 성호의 계좌에서 5.000원을 인출하려면 계좌번호가 100번인 성호의 잔액에서 5.000을 감소시키는 UPDATE 문이 필요하고
- 은경의 계좌로 5.000원을 입금하려면 계좌번호가 200번인 은경의 잔액을 5.000원증가시키는 UPDATE 문이 필요하다.
- 만약 첫 번째 UPDATE 문이 실행된 후 시스템에 장애가 발생하여 두번째 UPDATE 문이 실행되지 않으면
- 성호가 5.000원을 이체했으나 은경은 이 돈을 받지 못해 5.00원이 사라지는 모순된 상황이 발생
모순 발생 예방
그림10-1
그림10-2
- 시스템이 정상적으로 작동하게 되었을 때
- 두번째 UPDATE문을 실행하여 트랜잭션의 모든 UPDATE 문이 정상적으로 실행되도록 하거나
- 첫 번째 UPDATE 문의 실행을 취소하여 데이터베이스를 트랜잭션 작업 전 상태로 되돌아가에 해야 한다.
- 1 : 모은 UPDATE 문이 정상적으로 실행
- 2 : 첫 번째 UPDATE 취소하여 트랜잭션 작업 전 상태로 되돌아 간다.
- 상품 주문 트랜잭션은 INSERT 문과 UPDATE 문으로 구성되어 있다.
- 트랜잭션의 모든 명령문이 완벽하게 처리되거나
- 하나도 처리되지 않아야 데이터베이스가 모순이 없는 일관된 상태를 유지할 수 있다.
- 그러므로 데이터베이스의 무결성과 일관성을 보장하려면 작업을 수행하는 데 필요한 연산들을
- 하나의 트랜잭션으로 제대로 정의하고 관리해야 한다.
- INSERT 문, DELETE 문, UPDATE 문의 실행을 트랜잭션으로 관리한다.
10-1-2 트랜잭션의 특성
- 트랜잭션이 성공적으로 처리되어 데이터베이스의 무결성과 일관성이 보장되려면
- 네가지 특성을 꼭 만족해야 한다. 트랜잭션의 네 가지 특성을 각 특성에 해당하는 영어 단어의 첫글자를 따서
- ACID 특성이라고 한다.
- 원자성(Atomicity), 일관성(Consistency), 격리성(Isolation), 지속성(Durability)
10-1-2-1 원자성(Atomicity)
- 트랜잭션의 원자성 (All-or-Nothing)은 트랜잭션을 구성하는 연산들이 모두 정상적으로 실행하거나 하나도 실행되지 않아야 한다는 all-or-nothing 방식
- 만약 트랜잭션을 수행하다가 잘애가 발생하여 작업을 완료하지 못했다면.
- 지금까지 실행한 연산 처리를 모두 취소하고,
- 데이터베이스를 트랜잭션 작업 전의 상태로 되돌려
- 트랜잭션의 원자성을 보장해야 한다.
그림 10-4 트랜잭션의 수행 성공 예
그림 10-5 트랜잭션의 수행 실패
- 수행되는 도중에 시스템에 장애가 발생하여
- 현재까지 처리한 연산의 결과를 취소하여 데이터베이스를 트랜잭션 수행 전의 상태로 되돌리는 모습이다.
10-1-2-2 일관성(Consistency)
- 트랜잭션의 일관성은 트랜잭션이 성공적으로 수행된 후에도 데이터베이스가 일관된 상태를 유지해야 함을 의미한다.
- 트랜잭션이 수행되기 전에 데이터베이스가 일관된 상태 였다면
- 트랜잭션의 수행이 완료된 후 결과를 반영한 데이터베이스도 또 다른 일관된 상태가 되어야 한다는 의미다.
- 수행전 일관성, 수행후 일관성을 유지해야 한다.
- 트랜잭션의 일관성을 보자.
- 계좌이체 트랜잭션을 수행하기 전에 성호의 계좌 잔액은 10.000원이고 은경의 계좌 잔액은 0원이다.
- 트랜잭션이 수행된후 성호와 은경의 계좌 잔액은 모두 5.000원으로 트랜잭션이 수행되기 전과 달라졌지만
- 계좌 잔액이 합계는 여전히 10.000원이다.
- 데이터베이스가 모순되지 않고 일관성 있는 상태를 유지하고 있다.
그림 10-6 트랜잭션의 일관성을 만족하는 예
그램 10-7 트랜잭션의 일관성을 만족하지 않는 예
10-1-2-3 격리성(isolation)
- 트랜잭션의 격리성(isolation)은 고립성이라고도 한다.
- 현재 수행 중인 트랜잭션이 완료 될 때까지 트랜잭션이 생성한 중간 연산 결과에 다른 트랜잭션들이 접근할 수 없음을 의미
- 데이터베이스 시스템에서는 여러 트랜잭션이 동시에 수행되지만
- 각 트랜잭션이 독립적으로 수행될 수 있도록 다른 트랜잭션의 중간 연산 결과에 서로 접근하지 못하게 한다.
그림 10-8 트랜잭션의 격리성이 만족되지 않는 예
- 그림 10-8 성호의 계좌에서 은경의 계좌로 5.000원을 이체하는 계좌이체 트랜잭션과
- 은경의 계좌에서 1.000원을 입금하는 계좌 입금 트랜잭션이 동시에 수행되는 상황을 나타낸다.
- 성호와 은경의 계좌 잔액은 각가가 10.000원과 0원이라고 가정한다.
- 계좌에서 5.000원을 감소시키는 첫 번째 연산이 실행된 후,
- 은경의 계좌 잔액을 증가시키는 두 번째 연산이 실행되기 전에 데이터베이스는 일시적으로 일관되지 못한 상태가 된다.
- 트랜잭션이 은경의 계좌에 1.000원을 입금하고
- 은경의 계좌 잔액을 여전히 0원으로 알고 있는 계좌이체 트랜잭션이 두 번째 연산을 실행하면
- 은경의 계좌 잔액이 각각 1.000원과 5.000원이 된다.
- 트랜잭션이 완료되기 전에 계좌 입금 트랜잭션이 은경의 계좌 잔액에 접근하여
- 변경을 시도하면 모순된 데이터를 변경해 잔액을 정확히 예측하기 어려워 데이터베이스의 일관성을 보장할 수 없다.
- 트랜잭션의 수행 과정에서 생성되는 중간 연산의 결과에 다른 트랜잭션이 접근할 수 없도록
- 트랜잭션의 격리성을 보장해야한다.
그림 10-9 트랜잭션의 격리성이 만족되는 예
10-1-2-4 지속성(Durability)
- 트랜잭션의 지속성(durability)은 영속성이라고도 하는데
- 시스템에 장애가 발생하더라도 트랜잭션 작업 결과는 없어지지 않고 데이터베이스에 그대로 남아 있어야 한다는 의미다.
- 트랜잭션의 지속성을 보장하려면
- 시스템에 장애가 발생했을 때 데이터베이스를 원래 상태로 복구하는 회복 기능이 필요하다.
10-1-2-5 트랜잭션의 특성을 지원하는 DBMS의 기능
그림 10-10 트랜잭션의 트성과 DBMS의 기능
10-1-3 트랜잭션의 연산
- 연산에는 작업 완료를 의미하는 commit 연산과 작업 취소를 의미하는 rollback 연산이 있다.
그림 10-11 트랜잭션의 연산
그림 10-12 commit 연산을 실행한 예
그림 10-13 rollback 연산을 실행한 예
- commit은 트랜잭션의 수행이 성공적으로 완료되었음을 선언하는 연산이다.
- commit 연산이 실행된 후에야 트랜잭션의 수행 결과가 데이터베이스에 반영되어
- 데이터베이스가 일관된 상태를 지속적으로 유지하게 된다.
- commit 연산의 실행을 통해 트랜잭션의 수행이 성공적으로 완료되었음을 선언하고 트랜잭션이 수행한 최종 결과를 데이터베이스에 반경한다.
- rollback은 트랜잭션의 수행이 실패했음을 선언하는 연산이다.
- 실패한 연산의 결과가 취소되고 트랜잭션이 수행되기 전의 상태로 돌아간다.
- 그림10-13과 같이 트랜잭션이 수행되는 도중에 장애가 발생하여
- rollback 연산을 실행하여 트랜잭션의 수행이 실패했음을 선언한다.
- 데이터베이스를 트랜잭션 수행 전의 일관된 상태로 되돌려 모순이 발생하지 않게 한다.
10-1-4 트랜잭션의 상태
- 트랜잭션이 수행되기 시작하면 활동 상태가 되고
- 활동 상태의 트랜잭션이 마지막 연산을 처리하고 나면
- 부분 완료 상태의 트랜잭션이 commit 연산을 실행하면 완료 상태가 된다.
- 활동상태나 부분 완료 상태에서 여러 원인으로 인해 더는 정상적인 수행이 불가능하게 되면 트랜잭션은 실패 상태가 된다.
- 실패 상태의 트랜잭션은 rollback 연산의 실행으로 철회 상태가 된다.
10-1-4-1 활동 상태 (active)
- 트랜잭션이 수행되기 시작하여 현재 수행 중인 상태를 활동(active)상태라고 한다.
10-1-4-2 부분 완료 상태(partially committed)
- 트랜잭션 마지막 연산이 실행된 직후, 아직 방영하지 않은 상태
- 트랜잭션의 마지막 연산이 실행된 직후의 상태를 부분 완료(partially committed)상태
- 트랜잭션의 모든 연산을 처리한 상태다.
- 부분 완료 상태인 트랜잭션은 모든 연산의 처리가 끝났지만
- 트랜잭션이 수행된 최종 결과를 데이터베이스에 아직 반영하지 않은 상태다.
10-1-4-3 완료 상태 (committed)
- 트랜잭션이 성공적으로 완료되어 commit 연산을 실행한 상태를 완료(commited)상태라고 한다.
- 데이터베이스가 새로운 일관된 상태가 되면서 트랜잭션이 종료된다.
10-1-4-4 실패 상태 (failed)
- 하드웨어나 소프트웨어의 문제, 트랜잭션 내부의 오류 등 여러 이유로 인해 장애가 발생하여
- 트랜잭션의 수행이 중단된 상태를 실패(failed)상태라고 한다.
10-1-4-5 철회 상태 (aborted)
- 수행하는 데 실패한 생태를 철회(aborted)상태라고 한다.
- 데이터가 데이터에 존재하지 않거나, 논리적인 오류가 원인인 경우에는 철회된 트랜잭션을 폐기
- 트랜잭션을 수행하는 데 실패하여 rollback 연산을 실행한 상태를 철회(aborted)상태라고 한다.
- 트랜잭션이 철회 상태가 되면 지금가지 실행한 트랜잭션의 연산을 모두 취소하고
- 트랜잭션이 수행되기 전의 데이터베이스 상태로 되돌리면서 트랜잭션이 종료된다.
- 하지만 트랜잭션이 처리하려는 데이터가 데이터베이스에 존재하지 않거나
- 트랜잭션의 논리적인 오류가 원인인 경우에는 철회된 트랜잭션을 폐기
10-2 장애와 회복
- 트랜잭션의 특성을 보장하고, 데이터베이스를 모순이 없는 일관된 상태로 유지하기 위해
- 테이터베이스 관리 시스템은 회복 기능을 제공한다.
- 회복은(recovery)은 장애가 발생했을 때 데이터베이스를 장애가 발생하기 전의 일관된 상태로 복구 시키는 것이다.
- 회복 : 장애가 발생하기 전의 일관된 상태로 복구
10-2-1 장애의 유형
- 장애상태(failure) : 시스템이 제대로 동작하지 않는 상태를 장애(failure)상태라고 한다.
유형상태
트랜잭션 장해 | 의미 | 트랜잭션 수행 중 오류가 발행하여 정상적으로 수행을 계속할 수 없는 상태 |
원인 | 트랜잭션의 논리적 오류, 잘못된 데이터 입력, 시스템 자원의 과다 사용 요구, 처리 대상 데이터의 부재 등 | |
시스템 장애 | 의미 | 하드웨어의 결함으로 정상적으로 수행을 계속할 수 없는 상태 |
원인 | 하드웨어 이상으로 메인 메모리에 저장된 정보가 손실되거나 교착 상태가 발생하는 경우 | |
미디어 장애 | 의미 | 디스크장치의 결함으로 디스크에 저장된 데이터베이스의 일부 혹은 전체가 손상된 상태 |
원인 | 디스크 헤드의 손상이나 고장등 |
10-2-2 데이터베이스의 저장 연산
저장 장치설명
휘발성(volatile)저장 장치 (소멸성) | 의미 | 장애가 발생하면 저장된 데이터가 손실됨 |
예 | 메인 메모리 등 | |
비휘발성(nonvolatile)저장 장치 (비소멸성) | 의미 | 장애가 발생해도 저장된 데이터가 손실되지 않음, 단 디스크 헤더 손상은 데이터 손실 가능 |
예 | 디스크, 자기 테이프, CD/DVD 등 | |
안정(stable)저장 장치 | 의미 | 비휘발성 저장 장치를 이용해 데이터 복사본 여러 개를 만드는 방법, 어떤 장애가 발생해도 데이터가 손실되지 않고 데이터를 영구적으로 저장할 수 있음 |
그림 10-15 디스크와 메인 메모리 간의 데이터 이동
- 디스크와 메인 메모리 간의 데이터 이동은 대개 블록(block) 단위로 수행된다.
- 디스크에 있는 블록을 디스크 블록이라 하고
- 메인 메모리에 있는 블록은 버퍼 블록이라 한다.
Input(X)디스크 블록 데이터X를 =>메인 메모리 버퍼 블록으로 이동
outPut(X) | 메인 메모리 버퍼 블록 데이터 X를 => 디스크 블록으로 이동 |
그림 10-16 디스크와 메인 메모리 간의 데이터 이동 연산
- 메인 메모리 버퍼 블록에 있는 데이터를 프로그램의 변수로 가져오고,
- 데이터 처리 결과를 저장한 변수 값을 메인 메모리 버퍼 블록으로 옮기는 작업이 추가로 필요하다.
Read(X)메인 메모리 버퍼 블록 데이터X => 프로그램의 변수
Write(X) | 프로그램의 변수 값을 => 메인 메모리 버퍼 블록의 데이터 X에 기록 |
그림 10-17 메인 메모리의 버퍼 블록과 프로그램 변수 간의 데이터 이동 연산
- Read(X) : 응용 프로그램에 의해 수행된 트랜잭션이 데이터베이스에 접근하여 처리할 데이터를 가져올때 그런데 read(X) 연산이 정상적으로 실행되려면 먼저 데이터베이스가 상주하고 있는 디스크에서 메인 메모리 버퍼 블록으로 데이터를 가져와야한다.
- 그래서 input(X) 연산의 실행이 요구된다.
- 데이터베이스 => 응용 프로그램의 변수
- Read(X) 연산이 실행되어 디스크에 존재하는 데이터베이스의 데이터가 프로그램 변수에 저장되면
- 해당 데이터에 대한 모든 연산은 프로그램 변수를 대상으로 처리된다.
- 트랜잭션이 성공적으로 완료되려면 트랜잭션의 모든 연산을 처리한 후 결과 값을 디스크의 데이터베이스에 반영해야 하는데
- 트랜잭션 성공 => 결과값을 디스크 데이터베이스에 반영
- 이를 위해 write(X) 연산이 실행 된후 output(X) 연산이 실행된다.
- DB에 반영 => write(X) => output(X) 연산이 실행
그림 10-18 응용 프로그램이 실행한 트랜잭션의 수행을 위해 필요한 데이터 이동 연산
그림 10-19 데이터 이동 연산을 포함한 계좌 이체 트랜잭션 표현의 예
10-2-3 회복 기법 (복구)
- 회복은 데이터베이스에 장애가 발생했을 때 장애가 발생하기 전의 모순이 없고
- 인관된 상태로 복구시키는 것으로 데이터베이스 관리 시스템에 있는 회복 관리자(recovery manager)가 담당
10-2-3-1 회복을 위한 연산
- 데이터 베이스 회복의 핵심 원리는 데이터 중복이다.
- 데이터를 별도의 장소에 미리 복사해두고, 장애로 문제가 발생했을 때 복사본을 이용해 원래의 상태로 복원
- 덤프 또는 로그 방법을 사용해 데이터를 복사해두었다가 회복시킬 때 복사본을 사용
덤프(dump)데이터베이스 전체를 다른 저장 장치에 주기적으로 복사하는 방법 (백업)
로그(log) | 데이터베이스에서 변경 연산이 실행될 때마다 데이터를 변경하기 전 값과 변경한 이후의 값을 별도의 파일에 기록하는 방법 (기록) |
그림 10-20 데이터베이스 회복을 위해 복사본을 만드는 방법
- 덤프나 로그 방법으로 중복 저장한 데이터를 이용해 데이터 베이스를 복구하는 가장 기본적인 방법은
- redo나 undo 연산을 실행
- redo 연산 : 로그에 기록된 변경 연산 후의 값을 이용하여 변경 연산을 재실행하는 방법으로
- undo 연산 : 로그에 기록된 변경 연산 이전의 값을 이용하여 변경 연산을 취소하는 방법
Redo(재실행)가장 최근 저장한 DB 복사본을 가져와, 실행된 모든 변경 연산을 재실행하여 장애가 발생하기 직전의 DB 상태로 복구
Undo(취소) | 로그를 이용해 실행된 모든 변경 연산을 취소하여 데이터 베이스를 원래의 상태로 복구 |
그림 10-21 회복 연산
- 로그는 데이터를 변경하기 이전의 값과 변경한 이후의 값을 기록한것이다.
- 로그를 저장한 파일을 로그 파일이라고 하는데
- 로그 파일은 레코드 단위로 기록된다.
- 데이터 베이스에 대한 변경 연산은 트랜잭션 단위로 실행
- 로그 레코드도 트랜잭션의 수행과 함께 기록된다.
- 로그는 데이터베이스 회복 작업을 수행하기 위해 필요한 중요한 정보를 가지고 있으므로
- 데이터 손실이 발생하지 않는 저장 장치에 저장
로그 레코드설명
<T1, start> | 의미 | 트랜잭션 T1가 수행을 시작했음을 기록 |
예 | <T1, start> | |
<T1, X, old_value, new_value> | 의미 | 트랜잭션 T1가 데이터 X를 이전 값(old_value)에서 새로운(new_value)으로 변경 |
예 | <T1, X, 10000, 5000> | |
<T1, commit> | 의미 | 트랜잭션 T1가 성공적으로 완료 |
예 | <T1, commit> | |
<T1, abort> | 의미 | 트랜잭션 T1가 철회되었음 |
예 | <T1, abort> |
그림 10-22 계좌이체 트랜잭션이 수행되면서 기록된 로그의 예
- 효율적인 회복 기법들을 사용한다.
- redo와 undo는 데이터베이스 관리 시스템이 실제로 적용하는
- 그램 10-23 과 같은 회복 기법에서 주요 연산으로 사용된다.
그램10-23 데이터베이스 회복 기법의 분류
10-2-3-2 로그 회복 기법
- 데이터를 변경한 연산 결과를 데이터 베이스에 반영하는 시점에서
- 즉시 갱신 회복 기법과 지연 갱신 회복 기법으로 나뉜다.
10-2-3-2-1 즉시 갱신 회복 기법 - 오류 발생시점에서 redo, undo
- 즉시 갱신(immediate update)회봅 기법은 트랜잭션 수행 중에 데이터를 변경한 연산의 결과를 데이터 베이스에 즉시 반영한다.
- 장애 발생에 대비하기 위해 데이터 변경에 대한 내용을 로그 파일에도 기록한다.
- 데이터베이스 회복 시 로그를 정상적으로 사용하려면
- 트랜잭션에서 데이터 변경 연산이 실행되었을때
- 로그 파일에 로그 레코드를 먼저 기록한후
- 데이터 베이스에 변경 연산이 실행되었을 때 로그 파일에 로그 레코드를 먼저 기록한 후 데이터 베이스에 변경 연산을 반영해야 한다.
- 그림 10-24는 계좌 잔액이 10.000원이 성호가 계좌 잔액이 0원인 은경이에게 5.000원을 이체하는 계좌 이체 트랜잭션이 순차적으로 수행되는 과정을 나타낸다.
- 즉, 트랜잭션이 수행되면서 로그 파일에 기록되는 로그 레코드와
- 데이터베이스에 드랜잭션의 수행 결과를 반영하는 모습을 순서대로 보여준다.
그림 10-24 계좌이체 트랜잭션 수행 중 로그 작성 및 데이터베이스 반영 순서
트랜잭션이 완료되기 전에 장애가 발생연산 실행
커밋이 없을때 | undo 연산 실행 |
커밋이 존재하는 상태 | redo 연산 실행 |
그림 10-26 순차적으로 수행되는 두 트랜잭션의 예
- A계좌에서 B계좌로 1.000원을 이체하는 계좌이체 트랜잭션 T1과, C계좌에서 D 계좌로 2.000원을 이체하는 계좌 이치 트랜잭션 T2가 순차적으로 수행
그림 10-26 순차적으로 수행되는 두 트랜잭션의 예
그림 10-27 순차적으로 수행되는 두 트랜잭션의 로그 파일 내용과 데이터베이스 반영 결과
그림의 즉시 갱신 회복 기법을 적용하는 방법을 보자
1시점
- 1시점에서는 T1 트랜잭션의 수행이 아직 완료되기 전, <T1, start> 로그 레코드만 존재
- <T1, commit> 로그는 존재하지 않는다.
- 그러므로 T1 트랜잭션에 undo(T1) 연산을 실행해야 한다.
- 즉 로그 내용을 이용하여 지금까지 변경한 데이터의 값을 변경 연산 이전의 값으로 되돌려야한다.
- 로그에 기록된 순서의 반대로 undo 연산을 실행한다.
2시점
- 2시점에서는 T1 트랜잭션의 수행이 이미 완료되었으므로 로그 파일에 <T1, start> 로그 레코드와 <T1, commit> 로그 레코드가 모두 존재한다.
- T2 트랜잭션은 아직 완료되기 전이므로 <T2, start> 로그 레코드만 존재하고
- <T2, commit> 로그 레코드는 존재하지 않는다.
- T1 트랜잭션에 redo(T1) 연산을 T2 트랜잭션에 undo(T2)연산을 실행한다.
- redo와 undo 연산이 모두 필요할 때는. undo 연산을 먼저 실행한후 redo 연산을 실행한다.
- 즉, A계좌의 잔액을 4.000원으로 지정 한후 B계좌의 잔액을 1.000원으로 지정한다.
10-2-3-2-2 지연 갱신 회복 기법
- 지연 갱신(deferred update) 회복 기법은 트랜잭션이 수행되는 동안에는 데이터 변경 연산의 결과를 데이터베이스에 즉 반영 하지 않고 로그 파일에만 기록해두었다가.
- 트랜잭션이 부분 완료된 후에 로그에 기록된 내용을 이용해 데이터베이스에 한 번에 반영한다.
- 즉시X, 로그파일에 기록
- 부분 완료된 후에 => 로그에 기록된 내용을 이용해 DB에 한번에 반영
- 로그에 기록된 내용을 버리기만 하면 데이터베이스가 원래 상태를 그대로 유지하게 된다.
- 로그에 기록된 내용을 버리기만 하면 데이터베이스가 원래 상태를 그래로 유지하게 된다.
- undo 연산은 필요 없고, redo 연산만 필요하므로 로그 레코드에 변경 이전 값을 기록할 필요가 없다.
- 로그 레코드는 <Tn, X, new_value>형식으로 기록
그림 10-28 지연 갱신 회복 기법의 데이터베이스 회복 전략
그림 10-29 순차적으로 수행되는 두 트랜잭션의 로그 파일 내용과 데이터베이스 반영 결과
1시점
- T1 트랜잭션의 수행이 아직 완료되기 전이므로 로그 파일에 <T1, start> 로그 레코드만 존재하고
- <T1, commit> 로그 레코드는 존재하지 않는다.
- 트랜잭션이 실행한 데이터 변경 연산의 결과를 아직 데이터베이스에 반영하기 전이므로
- 로그에 기록된 내용만 버리면 다른 회복 조치를 하지 않아도 된다.
2시점
- T2 트랜잭션은 아직 완료되기 전이므로 <T2, start> 로그 레코드만 존재하고
- <T2, commit> 로그 레코드는 존재하지 않는다.
- 그러므로 아직 완료되지 않는 T2 트랜잭션에 대한 로그 레코드를 무시하고 T2 트랜잭션에는 별른 회복 조치를 하지 않아도 된다.
- 하지만 수행이 완료된 T1 트랜잭션에는 redo(T1) 연산을 실행하여
- 데이터베이스에서 A계좌의 잔액이 변경 연산 이후의 값인 4.000원
- B계좌의 잔액이 변경 연산 이후의 값인 1.000원이 되도록 한다.
- 즉 T1만 redo을 한다.
10-2-3-2-3 검사 시점 회복 기법 (로그 일정 시간 간격으로 검사(checkpoint)) 만들기
- 검사 시점 회복 기법은 로그 회복기법과 같은 방법으로 로그 기록을 이용하되
- 일정 시간 간격으로 검사시점(checkpoint)을 만들어 둔다.
- 장애가 발생하면 가장 최근 검사 시점 이전의 트랜잭션에는 회복 작업을 수행하지 않고
- 이후의 트랜잭션에만 회복 작업을 수행한다.
- 검사 시점 회복 기법을 이용하면 회복 작업의 범위가 검사 시점으로 정해지므로 불필요한 회복작업을 수행하지 않아
- 데이터베이스 회복 시간이 단축
- 즉 일정 시간 간격 <checkpoint>이후 에만 검사
10-2-3-2-4 미디어 회복 기법 (일정주기 데이터 백업)
- 디스크에 발생할 수 있는 장애에 대비한 회복 기법은 미디어 회복 기법이다.
- 복사해두는 덤프를 이용한다.
- 디스크 장애가 발생하면 가장 최근에 복사해둔 덤프를 이용해 장에 발생 이전의 일관된 데이터베이스 상태로 복구한다.
- 그런 다음 필요에 따라 로그의 내용을 토대로 redo 연산을 실행한다.
- 단점은 미디어 회복 기법은 CPU가 낭비된다.
10-3 병행 제어 (인터리빙, 동시성 제어)
- 갱신분실 : 덮어쓰기
- 모순성 : xy 다른 상태 db 가져오기
- 동시에 수행 : 병행 수행 -> 번가라 수행, 인터 리빙
10-3-1 병행 수행과 병행 제어
- 데이터베이스 관리 시스템은 여러 사용자가 데이터베이스를 동시에 공유할 수 있도록
- 여러개의 트랜잭션이 동시에 수행되는 병행 수행(concurrency)을 지원한다.
- 병행 수행은 실제로 여러 트랜잭션이 차례로 번갈아 수행되는 인터리빙(interleaving)방식으로 진행
- 동시에 같은 데이터에 접근하여 변경 연산을 실행하려고 하면 예상치 못한 결과가 나타날 수도 있다.
- 동시에 같은 데이터에 접근하여 변경 연산을 실행하려고 하면
- 예상치 못한 결과가 나타날 수도 있다.
- 여러 개의 트랜잭션이 병행 수행되면서 같은 데이터에 접근하여 연산을 실행하더라도
- 문제가 발생하지 않고 정확한 수행 결과를 얻을 수 있도록 트랜젝션의 수행을 제어하는 것을
- 병행제어(concurrency control) 또는 동시성 제어라고 한다.
- 결과 얻도록 트렌젝션 수행 제어 병행, 동시성 제어
10-3-2 병행 수행의 문제
- 병행 수행을 특별한 제어 없이 진행하면 여러 문제가 발생 -> 갱신 분실, 모순성, 연쇄 복귀
10-3-2-1 갱신 분실
- 갱신 분실(lost update)은 하나의 트랜잭션이 수행한 데이터 변경 연산의 결과를 다른 트랜잭션이 덮어서 변경 연산이 무효화 되는 것이다.
- 트랜잭션 결과를, 다른 트랜잭션으로 덮기
그림 10-30 두 트랜잭션의 병행 수행으로 발생한 갱신 분실의 예
- 트랜잭션 T1의 변경 연산이 데이터베이스에 실제로 반영되지 않고 무효화 되어
- 트랜잭션 T1이 수행되지 않은 것처럼 된다.
- 트랜잭션 T1에 대해 갱신 분실이 발생한 것이다.
그림 10-31 트랜잭션 T1을 수행한 후 트랜잭션 T2을 수행한 결과
- 두 트랜잭션을 동시에 수행하더라도 갱신 분실 문제가 발행 안하고
- 정확인 병행 수행
- 순차적으로 수행, 정확한 병행 수행
10-3-2-2 모순성
- 모순성(inconsistency)은 하나의 트랜잭션이 여러 개의 데이터 변경 연산을 실행 할때 일관성 없는 상태의 데이터베이스에서 데이터를 가져와
- 연산을 실행함으로써 모순된 결과가 발생하는 것이다.
- 또 다른 연산은 다른 트랜잭션이 변경한 데이터베이스에서 데이터를 가져와 실행하면
- 모순성의 문제가 발행
- 일관성 없는 data 가져와, 연산 실행, 모순된 결과
그림 10-32 두 트랜잭션의 병행 수행으로 발생한 모순성의 예
- T1은 자신이 수행하기 전 상태의 Y값 3000원이 아닌 T2에서 변경이 된 1500원을 가지고 연산을 수행하는
- 모순 발생
그림 10-33 트랜잭션 T1을 수행한 후 트랜잭션 T2를 수행한 결과
- 트랜잭션 T1의 수행이 완료된 다음 다음에 트랜잭션 T2를 수행
10-3-2-3 연쇄 복귀
- 연쇄 복귀(cascading rollback)는 트랜잭션이 완료되기 전에 장애가 발생하여 rollback 연산을 수행
- 장애가 발생하기 전에 변경한 데이터를 가져가 변경 연산을 실행한 또 다른 트랜잭션에도 rollback 연산을
- 연쇄적으로 실행해야 한다는 것이다.
- 변경한 데이터를 가져가 사용하는 다른 트랜잭션이 수행을 완료해버리면 rollback 연산을 실행 할수 없으 큰 문제 발행
그림 10-34 두 트랜잭션의 병행 수행으로 발생한 연쇄 복귀 발생
- 트랜잭션 T2가 이미 모든 연산을 실행하고 완료된 상태라 rollback 연산을 실행할 수 없으므로 문제가 발생
그림 10-35 트랜잭션 T1을 수행한 후 트랜잭션 T2를 수행한 결과
- 이처럼 두 트랜잭션을 동시에 수행하더라도 연쇄 복귀의 문제가 발생하지 않고 순차적으로
- 수행한 것과 같은 결과 값을 얻을 수 있어야 정확한 병행 수행이라 할 수 있다.
10-3-3 트랜잭션 스케줄
- 병행 수행에서는 트랜잭션들이 차례로 번갈아 가면서 수행되는 인터리빙 방식으로 진행
- 여러 트랜잭션을 병행 수행할 때는 트랜잭션들의 연산을 실행하는 순서가 중요하다.
- 트랜잭션 스케줄은 트랜잭션에 포함되어 있는 연산들을 수행하는 순서다.
트랜잭션 스케줄의미
직렬 스케줄 | 인터리빙 방식을 이용하지 않고 트랜잭션별로 연산들을 순차적으로 실행시키는 것 |
비직렬 스케줄 | 인터리빙 상식을 이용하여 트랜잭션들을 병행해서 수행시키는 것 |
직렬 가능 스케줄 | 직렬 스케줄과 같이 정확한 결과를 생성하는 비직렬 스케줄 |
10-3-3-1 직렬 스케줄
- 직렬 스케줄 (serial schedule)은 인터리빙 방식을 이용하지 않고 트랜잭션별로 연산들을 순차적으로 실행
- 트랜잭션이 직렬 스케줄에 따라 수행되면
- 모든 트랜잭션이 완료될 때가지 다른 트랜잭션의 방해를 받지 않고 독립적으로 수행된다.
그림 10-36 트랜잭션 T1을 수행한 후에 트랜잭션 T2를 수행하는 직렬 스케줄의 예
그림 10-37 트랜잭션 T2를 수행한 후에 트랜잭션 T1을 수행하는 직렬 스케줄의 예
10-3-3-2 비직렬 스케줄
- 비직렬 스케줄(nonserial schedule)
- 비직렬 스케줄에 따라 여러 트랜잭션을 병행 수행하면 갱신 분실, 모순성, 연쇄 복귀 드으이 문제가 발생
그림 10-38 트랜잭션 T1과T2에 대한 비직렬 스케줄의 예 1 : 정확한 결과 생성
그림 10-39 트랜잭션 T1과 T2에 대한 비직렬 스케줄의 예 2: 잘못된 결과 생성
10-3-3-3 직렬 가능 스케줄
- 직렬 스케줄과 같이 정확한 결과 생성하는 것
- 정확한 결과를 생성하는 비직렬 스케줄
- 직렬 가능 스케줄 (serializable schedule)은 직렬 스케줄에 따라 수행한 것과 같이 정확한 결과를 생성하는 비직렬 스케줄이다.
- 비직렬 스케줄중에서 수행 결과가 동일한 직렬 스케줄이 없는 것들은
- 결과의 정확성으 보장할 수 없으므로 직렬 가능 스케줄이 아니다.
- 직렬 가능 스케줄은 인터리빙 방식(병행 수행)을 이용하여 여러 트랜잭션을 병행 수행하면 서도 정확한 결과를 얻을 수 있다.
- 그래서 대부분의 데이터베이스 관리 시스템에서는 직렬 가능 스케줄인지를 검사하기보다는 직렬 가능성을 보장하는 병행 제어 기법을 사용한다.
10-4 병행 제어 기법
- 병행 제어 기법은 여러 트랜잭션을 병행 수행하면서도 정확한 결과를 얻을 수 있는 직렬 가능 성을 보장 받기 위해 사용한다.
- 병행 제어 기법의 기본 원리는
- 모든 트랜잭션이 따르면 직렬 가능성이 보장되는 나름의 규약을 정의하고
- 트랜잭션들이 이 규약을 정의하고
- 트랜잭션들이 이 규약을 따르도록하는 것이다.
10-4-1 로킹 기법의 개념 (lock or unlock)
- 로킹(locking) 기법은 병행 수행되는 트랜잭션들이 동일한 데이터에 동시에 접근하지 못하도록
- lock과 unlock이라는 2개의 연산을 이용해 제어한다.
- 해당 데이터에 다른 트랜잭션이 접근하지 못하도록 상호 배제(mutual exclusion)하여 직렬 가능성을 보장하는 것이다.
- Lock 연산은 트랜잭션이 사용할 데이터에 대한 독점권을 가지기 위해사용
- unlock 연산은 트랜잭션이 데이터에 대한 독럽권을 반납하기 위해 사용한다.
- 데이터를 읽어오는 read와 데이터를 기록하는 write다.
- 트랜젝션이 데이터에 read 또는 write 연산을 시행하기 전에 반드시 lock dustksdmf tlfgod
- lock 연산을 통해 독점권을 획득한 데이터에 대한 모든 연산을 수해앟면
- unlock 연산을 실행해서 독점권을 반납해야 한다.
- 가장 작은 단위인 속성에 lock 연산을 하면 독점하는 범위가 좁아 많은 수의 트랜잭션을 병행 수행할 수 있다는 장점이 있지만, 제어가 복잡하다는 단점이 있다.
- 즉, 로킹 단위가 커질수록 병행성은 낮아지지만 제어가 쉽고,
- 로킹 단위가 작아질수록 제어가 어렵지만 병행성은 높아진다.
- 로킹 단위가 크다 : 병행성 낮고, 제어가 쉽다.
- 로킹 단위가 작다 : 제어가 어렵지만 병행성은 높아진다.
- 기본 로킹 기법은 write 연산을 실행 할때는 독점권을 가진다.
연산설명
공용(shared) lock | read 연산을 실행할 수 있지만 write 연산은 실행할 수 없다.(데이터에 대한 사용권을 여러 트랜잭션이 함께 가질 수 있음) read(O), write(X) |
전용(exclusive) lock | 해당 데이터에 다른 트랜잭션은 공용이든 전용이든 어떤 lock 연산도 실행 할 수 없다.(전용 lock 연산을 실행한 트랜잭션만 해당 데이터에 대한 독점권을 가질 수 있음), 다른 트랜젝션 사용 X |
공용 lock과 전용 lock 연산 사이의 양립성
공용 lock전용 lock
공용 lock | 가능 | 불가능 |
전용 lock | 불가능 | 불가능 |
- 모든 트랜잭션이 기본 로킹 규약을 지키더라도 잘못된 결과를 얻을 수도 있다.
그림 10-40 기본 로킹 규약으로 직렬 가능성이 보장되지 않는 스케줄의 예
10-4-2 2단계 로킹 규약
- 2단계 로킹 규약(2 phase Locking Protocol)
확장 단계트랜잭션이 lock 연산만 실행, unlock은 불가
축소 단계 | 트랜잭션이 unlock 연산만 실행, lock 연산은 불가. |
그램 10-42 2단계 로킹 규약으로 직렬 가능성이 보장된 스케줄의 예
- 그림 10-40은 T1과 T2 모두 첫 번째 unlock 연산을 실행하기 전에 모든 lock 연산을 실행하지 않아 2단계 로킹 규약을 따르지 않았다.
- 그램 10-42은 2단계 로킹 규약을 적용하면 트랜잭션 스케줄의 직렬 가능성을 보장할 수 있다.
- 교착상태(deadlock)가 발생할 수 있어 해결책 필요
요약
1 트랜잭션 개념
- 하나의 작업을 수행하기 위해 필요한 데이터베이스 연산들을 모아 놓은 것,
- 논리적인 작업의 단위.
2. 트랜잭션의 특징
- 원자성: 트랜잭션의 연산이 모두 정상적으로 수행되거나 하나도 수행되지 않아야한다.
- 일관성: 트랜잭션이 수행된 후에도 데이터베이스가 일관성 있는 상태
- 격리성: 수행 중인 트랜잭션이 완료될 때까지 다른 트랜잭션들이 중간 연산 결과에 접근할 수 없다.
- 지속성: 트랜잭션의 수행이 완료된 후에 데이터베이스에 반경한 결과는 영구적이여야 한다.
3 트랜잭션의 연산
- commit 연산: 작업 완료
- Rollback 연산: 작업 취소
4 트랜잭션의 상태
- 활동 상태: 트랜잭션이 수행을 시작하여 현재 수행 중인 상태.
- 부분 완료 상태: 트랜잭션의 마지막 연산이 실행을 끝낸 직후의 상태
- 완료 상태: 트랜잭션이 성공적으로 완료되어 commit 연산을 실행한 상태
- 실패 상태: 장애가 발생하여 트랜잭션의 수행이 중단된 상태
- 철회 상태: 트랜잭션의 수행 실패로 rollback 연산을 실행한 상태.
5 장애의 정의와 유형
- 시스템이 제대로 동작하지 않는 상태, 트랜잭션 장애, 시스템 장애, 미디어 장애가 있다.
6 회복의 정의와 연산
- 장애가 발생했을 때 데이터베이스를 장애가 발생하기 전의
- 일관된 상태로 복구 시키는 것이다.
- Redo(재실행), undo(취소) 연산이 있다.
7 회복 기법의 유형
- 로그 회복 기법 : 로그를 이용한 회복
- 검사 시점 회복 기법 : 검사 시점을 이용한 회복이다.
- 미디어 : 데이터베이스 덤프(복사본)를 이용한 회복
8 로그 회복 기법
로그를 이용한 회복 기법으로, 즉시 갱신 회복과 지연 갱신 회복이 잇다.
- 즉시 갱신 회복: 트랜잭션을 수행하는 도중에 데이터 변경 연산의 결과를 데이터베이스에 즉시 반영한다.
- 지연 갱신 회복 : 트랜젝션이 부분 완료되면 데이터 변경 연산의 결과를 데이터베이스에 한번에 반영한다.
9 병행 수행과 병행 제어
- 병행 수행 : 여러 개의 트랜잭션을 동시에 수행하는 것으로, 갱신 분실, 모순성, 연쇄 복귀의 문제가 있다.
- 병행 제어 : 병행 수행시 문제가 발생하지 않고 정확한 결과를 얻을 수 있도록 트랜잭션 수행을 제어하는 것이다.
10 트랜잭션 스케줄
트랜잭션에 포함된 연산들을 실행하는 순서를 의미한다.
직렬 스케줄, 비직렬 스케줄, 지렬 가능 스케줄이 있다.
- 직렬 스케줄 : 인터리빙 방식을 이용하지 않고 트랜잭션별로 연산들을 순차적으로 실행
- 비직렬 스케줄: 인터리빙 방식을 이용하여 트랜잭션들을 병행해서 수행시키는 것
- 직렬 가능 스케줄: 직렬 스케줄과 동일한 정학한 결과를 생성하는 비직렬 스케줄
11 병행 제어 기법
- 병행 수행하면서도 정확한 결과를 얻을 수 있는 직렬 가능성을 보장
- 모든 트랜잭션들이 준수 하면 직렬 가능성이 보장되는 규약을 정의하고
- 트랜잭션들이 이 규약을 따르도록 한다.
12 로킹 기법
트랜잭션들이 동일한 데이터에 동시에 접근하지 못하도록 lock과 unlock 연산으로 제어한다.
로킹 단위가 커질수록 병행성이 낮아지지만 제어가 쉽고, 로킹 단위가 작아질수록 제어가 어렵지만 병행성이 높아진다.
- lock 연산 : 트랜잭션이 데이터에 대한 독점권을 요청하는 연산
- unlock 연산 : 트랜잭션이 데이터에 대한 독점권을 반환하는 연산
13 2단계 로킹 규약
트랜잭션이 lock과 unlock 연산을 확장 단계와 축소 단계로 나누어 수행해야 한다.
모든 트론잭션이 2단계 로킹 규약을 준수하면
해당 스케줄은 직렬 가능성을 보장 받는다.
- 확장 단계 : 트랜잭션이 lock 연산만 실행할 수 있고, unlock 연산은 실행할 수 없는 단계
- 축소 단계 : 트랜잭션이 unlock 연산만 실행할 수 있고, lock 연산은 실행할 수 없는 단계
'학교 전공 > 데이터베이스' 카테고리의 다른 글
데이터베이스 개론(3판) - 11장 보안과 권한 관리 (1) | 2023.12.06 |
---|---|
데이터베이스 개론(3판) - 9장 정규화 (1) | 2023.12.06 |
연습문제 - 데이터베이스 개론(3판) - 4장 데이터 모델링 (0) | 2023.10.23 |
연습문제 - 데이터베이스 개론(3판) - 3장 데이터베이스 시스템 (0) | 2023.10.23 |
연습문제 -데이터베이스 개론(3판) - 2장 데이터베이스 관리 시스템의 등장 배경 (0) | 2023.10.23 |