1. 정규화(Normalization)
테이블 간에 중복된 데이터를 허용하지 않는다는 것이다. 중복된 데이터를 허용하지 않음으로써 무결성을 유지할 수 있으며, DB 저장용량 역시 줄일 수 있다.
이러한 정규화는 테이블을 분해하는 단계가 있는데, 테이블을 어떻게 분해되는지에 따라 정규화 단계가 달라진다.
디비의 정규화가 진행되면 기존의 릴레이션이 분해가 된다.
하지만 분해된 릴레이션은 무손실 조인을 무조건적으로 보장해야한다.
여기서 무손실 조인은 분해된 릴레이션은 다시 결합하더라도 분해 전 결과랑 같아야 한다.
(1) 제 1 정규화
테이블의 컬럼이 원자값(Atomic Vlue, 하나의 값)을 갖도록 테이블을 분리하는 것.
취미 테이블에서 추신수와 박세리는 여러 개의 취미를 가지고 있기 때문에 제 1정규형을 만족하지 못하고 있다.
이를 해결하고자 제 1정규화를 적용하면, 아래와 같이 된다.
(2) 제 2정규화
제 1정규화가 진행된 테이블에 대해 완전 함수 종속을 만족하도록 테이블을 분해하는 것.
완전 함수 종속은 기본키의 부분집합이 결정자가 되어선 안된다는 것이다.
기본키가 두 개 이상의 애트리뷰트로 구성되었을 경우에만 제 2정규혀을 만족하는가를 고려할 필요가 있다.
어떤 애트리뷰트가 기본키에 대해 완전히 종속적일 때, 이러한 기본키가 다수일 경우 발생하는 문제점이다.
즉, 어느 한 기본키로도 해당 데이터를 판단할 수 없는 문제점이 발생한다.
이 테이블에서 기본키는 (학생번호, 강좌이름)으로 복합키이다. 그리고 (학생번호, 강좌이름)인 기본키는 성적을 결정하고 있다. (학생번호, 강좌이름) --> (성적)
그런데 여기서 강의실이라는 컬럼은 기본키의 부분집합인 강좌이름에 의해 결정될 수 있다. (강좌이름) --> (강의실)
즉, 기본키(학생번호, 강좌이름)의 부분키인 강좌이름이 결정자이기 때문에 위의 테이블의 경우 다음과 같이 기존의 테이블에서 강의실을 분해하여 별도의 테이블로 관리하여 제2 정규형을 만족시킬 수 있다.
(3) 제 3정규화
제 2정규화를 진행한 테이블에 대해 이행적 종속을 없애도록 테이블을 분해하는 것.
이행적 종속은 A -> B, B -> C 가 성립할 때, A -> C가 성립되는 것을 의미한다.
기존의 테이블에서 학생 번호는 강좌 이름을 결정하고 있고, 강좌 이름은 수강료를 결정하고 있다. 그렇기 때문에 이를 (학생 번호, 강좌 이름) 테이블과 (강좌 이름, 수강료) 테이블로 분해해야 한다.
이행적 종속을 제거하는 이유는 비교적 간단하다. 예를 들어 501번 학생이 수강하는 강좌가 스포츠경영학으로 변경되었다고 하자. 이행적 종속이 존재한다면 501번의 학생은 스포츠경영학이라는 수업을 20000원이라는 수강료로 듣게 된다. 물론 강좌 이름에 맞게 수강료를 다시 변경할 수 있지만, 이러한 번거로움을 해결하기 위해 제3 정규화를 하는 것이다.
즉, 학생 번호를 통해 강좌 이름을 참조하고, 강좌 이름으로 수강료를 참조하도록 테이블을 분해해야 하며 그 결과는 다음의 그림과 같다.
(4) BCNF 정규화
제 3정규화를 진행한 테이블에 대해 모든 결정자가 후보키가 되도록 분해하는 것.
특강수강 테이블에서 기본키는 (학생번호, 특강이름)이다. 그리고 기본키 (학생번호, 특강이름)는 교수를 결정하고 있다. 또한 여기서 교수는 특강이름을 결정하고 있다.
그런데 문제는 교수가 특강이름을 결정하는 결정자이지만, 후보키가 아니라는 점이다. 그렇기 때문에 BCNF 정규화를 만족시키기 위해서 위의 테이블을 분해해야 하는데, 다음과 같이 특강신청 테이블과 특강교수 테이블로 분해할 수 있다.
2. 정규화 장점과 단점
(1) 장점
- 데이트 구조의 안정성 유지
- 중복 값, 널 값 감소
- 이상 현상 제거
- 저장 공간 최소화
(2) 단점
- 릴레이션의 분해로 인해 릴레이션 간의 조인(join)연산이 많아진다.
[참고]
'CS 백엔드 > 데이터베이스' 카테고리의 다른 글
[DB] SQL과 NoSQL (0) | 2023.02.03 |
---|---|
[DB] 트랜잭션의 격리수준 (0) | 2023.02.03 |
[DB] 트랜잭션 (0) | 2023.02.01 |
[DB] 데이터 베이스(Database)의 기본 (0) | 2023.01.29 |
[데이터베이스] RDB에 하지 말아야 할 것들 (0) | 2022.12.19 |