BI/DW

[DW Modeling] 데이터 웨어하우스 모델링 개념

리오토리 2023. 1. 19. 16:17

DW 모델링(DW Modeling)

: 대용량 데이터를 다양한 관점에서 빠른 성능으로 분석할 수 있도록 구성하는 데이터 분석 관점의 모델링 기법

 

특징

  • 비즈니스 차원의 조직화, 사용자 접근 용이성

 

1. DW 다차원 모델링 기법

구분 설명
Star Schema 정규화 된 Fact Table을 중심으로 비정규화 된 Dimension Table들이 배치되는 형태의 모델링 기법
Snowflake Schema 정규화 된 Fact Table을 중심으로 정규화 된 (제3정규형) Dimension Table들이 배치되는 형태의 모델링 기법

 

2. DW 다차원 모델링의 구성요소

구성요소 설명
사실
(Facts)
●중심 테이블로서 관련성이 높은 Measure들의 집합
차원
(Dimensions)
● 각 Fact Table을 분석하는 하나의 관점
● Dimension은 복수의 속성을 갖고 있으며, 이것은 Drill-up과 Roll-up등 데이터분석의 요약 수준에 대한 Navigation을 가능하게 하는 경로를 지님
속성
(Attribute)
● 각 차원 테이블이 가지고 있는 속성
● 사실을 검색하고, 여과하고 분류할 때 사용
속성계층
(Hierarchiese)
● 차원 내 정의된 속성들 간에 존재하는 계층 관계
● 아래로 가기(Drill-down), 위로가기(Roll-up)등 기능 이용

 

3. DW 다차원 모델링 기법 비교

구분 Star Schema 모델(반정규화된 모델) Snowflake Schema 모델(정규화된 모델)
장점 ● 모델이 단순하여 사용자 이해가 빠름
● 계층 구조를 정의하기가 쉬움
● 조인 횟수를 줄임으로 응답 성능 향상
● Meta Data 단순
● 데이터 무결성 유지가 보다 용이
● 스타 스키마에 비해 상대적으로 작은 저장 공간을 요구
● 애플리케이션의 유연성 증가
● 데이터 중복성 최소화
단점 ● Fact 테이블 내의 요약 데이터를 추출할 경우 수행속도 저하( 계층이 여러 단계인 디멘션이 반정규화되어 디멘션이 큰 경우)
● 자료의 불일치 위험
● 중복 데이터 포함
● 모델이 유연하지 못함
● 더 많은 저장 공간이 필요
● 구조가 복잡해져 Mart 구축의 장점이 희석
● 데이터 베이스 내 관리 테이블 수 증가
● Dimension 테이블 간의 조인으로 인해 응답성능 저하
● 모델에 대한 사용자의 이해도가 스타 스키마에 비해 상대적으로 어려움

 

Star Schema/ Snowflake Schema

 

1. 스타 스키마(Star Schema)

: 스타 스키마는 차원(Dimension)테이블과 팩트(Fact)테이블로 구성이되어 있으며, 차원 테이블은 정규화되지 않은 형태로 저장됨

 

스타 스키마 장점

  • 원하는 정보가 주제별로 하나의 테이블에 모두 정리
  • 데이터를 단순화된 형태로 저장
  • 퀴리에 대해 높은 성능을 제공
  • 스타 조인 최적화 기능 활용
  • 많은  BI 도구에서 표준처럼 지원
  • 낮은 유지보수 비용(추가, 변경이 용이)

 

눈송이 스키마(Snowflake Schema)

: 스타 스키마에서 차원이 대용량일 경우 발생하는 처리속도 저하 문제를 해결하기 위해 제시된 데이터 모델링 기법

: 스타 스키마의 차원 테이블을 완전 정규화 시킨 것

 

 

 

참조

https://itpenote.tistory.com/527 DW 모델링

https://ysiksik.github.io/study/kt-development-consortium/database-modeling/2022-06-25-DW-Data-Modeling/#dw-%EC%A0%95%EC%9D%98 star/snow schema