대메뉴 바로가기 본문 바로가기

데이터 기술 자료

데이터 기술 자료 상세보기
제목 권순용의 DB 이야기 : 리버스 키 인덱스의 개념
등록일 조회수 5043
첨부파일  

권순용의 DB 이야기

리버스 키 인덱스의 개념



리버스 키(Reverse Key) 인덱스는 B*TREE 인덱스와 거의 같다. 단지 인덱스 키 값을 반대로 구성해 비트리 인덱스를 생성할 뿐이다. 그로 인한 몇 가지 제약 조건이 있을 뿐이다. 지금부터는 이에 대해 자세히 살펴보자.



B*TREE의 인덱스의 특징을 엿볼 수 있는 <그림 1>을 먼저 살펴보자. 여기서 사업번호 컬럼의 값이 순차적으로 증가할 경우 가장 우측의 리프 블록에 있는 인덱스 엔트리는 계속 순차적으로 추가(Insert)가 발생하게 된다. 따라서 최근 데이터가 저장돼 있는 리프 블록에 대해 경합이 증가된다. 이러한 경합을 제거하기 위해 리버스 키 인덱스가 고안됐다. 리버스 키 인덱스는 오라클 데이터베이스 8버전부터 지원한다.





리버스 키 인덱스의 구조

앞서 언급했듯 리버스 키 인덱스는 B*TREE 인덱스와 구조가 같다. 단지 저장되는 데이터만 역으로 리프 블록에 저장한다. 리버스 키 인덱스의 구조는 <그림 3>과 같다.





지금부터는 리버스 키 인덱스의 생성 원리를 살펴보자(<그림 4> 참조). 먼저 기존 테이블에 대한 인덱스 키 컬럼의 값을 반대로 변경해 B*TREE 인덱스를 생성한다. 테이블의 데이터 <03550, 이가혜>는 인덱스 키 컬럼인 사원번호 컬럼은 반대로 만들어지므로 데이터 값이 <05530, 이가혜>로 변경된다. 해당 데이터는 리버스 키 인덱스에서 인덱스 키 컬럼의 값이 05530으로 변경돼 사원번호 인덱스에 저장된다. 이처럼 리버스 키 인덱스는 B*TREE 인덱스와 구조가 같다. 단지 인덱스 키 값만을 반대로 변경해 B*TREE 인덱스를 생성한 것에 불과한 것이다.





리버스 키 인덱스의 생성과 사용

사원번호 값이 순차적으로 증가할 경우 일반적인 B*TREE 인덱스는 우측 리프 블록으로 모든 데이터가 저장된다. 그렇기 때문에 우측 리프 블록에 경합이 발생한다. 반면 리버스 키 인덱스는 사업번호 값이 순차적으로 증가하더라도 사원번호 인덱스의 우측 리프 블록에만 추가(Insert)가 발생하지 않고 모든 인덱스 블록으로 추가되게 된다. 이는 인덱스를 구성하는 과정에서 순차적으로 값을 역으로 변경해 B*TREE 인덱스를 생성하기 때문이다.



앞선 예제에서 사원번호가 03550과 03551인 인덱스 엔트리는 같은 리프 블록에 존재하지만 그 다음 사원번호인 03552는 다른 인덱스 리프 블록에 추가된다. 이런 원리에 의해 순차적으로 증가하는 데이터의 인덱스 엔트리들은 인덱스의 모든 리프 블록에 분산 저장된다. 즉 B*TREE 인덱스의 단점인 순차적으로 증가하는 인덱스 키 컬럼의 경우 최근 데이터가 우측 리프 블록에 집중되는 경합을 리버스 키 인덱스로 해결할 수 있다.

● 리버스 키 인덱스의 생성
리버스 키 인덱스라고해서 다른 인덱스와 생성 방법이 다른 것은 아니다. 인덱스를 생성할 때 옵션을 설정하는 것 하나만 다를 뿐이다.



<리스트 1> 리버스 키 인덱스 생성 SQL> CREATE INDEX EMPNO_IDX ON EMP(EMPNO) REVERSE ;



● B*TREE 인덱스를 리버스 키 인덱스로 변경
리버스 키 인덱스는 B*TREE 인덱스와 구조가 같으므로 언제든지 리버스 키 인덱스로 변경할 수 있다. 물론 리버스 키 인덱스를 B*TREE 인덱스로 언제든지 변경할 수도 있다. 리버스 키 인덱스는 <리스트 1> SQL을 통해 생성하거나 기존 B*TREE 인덱스를 리버스 키 인덱스로 변경할 수 있다. 이처럼 인덱스를 변경할 경우 실제 인덱스를 재구성하므로 데이터 양에 따라 많은 시간이 소요될 수 있다.



출처 : 마이크로소프트웨어 11월호

제공 : 데이터 전문가 지식포털 DBguide.net