DW 모델링(DW Modeling)
: 대용량 데이터를 다양한 관점에서 빠른 성능으로 분석할 수 있도록 구성하는 데이터 분석 관점의 모델링 기법
특징
- 비즈니스 차원의 조직화, 사용자 접근 용이성
1. DW 다차원 모델링 기법
구분 | 설명 |
Star Schema | 정규화 된 Fact Table을 중심으로 비정규화 된 Dimension Table들이 배치되는 형태의 모델링 기법 |
Snowflake Schema | 정규화 된 Fact Table을 중심으로 정규화 된 (제3정규형) Dimension Table들이 배치되는 형태의 모델링 기법 |
2. DW 다차원 모델링의 구성요소
구성요소 | 설명 |
사실 (Facts) |
●중심 테이블로서 관련성이 높은 Measure들의 집합 |
차원 (Dimensions) |
● 각 Fact Table을 분석하는 하나의 관점 ● Dimension은 복수의 속성을 갖고 있으며, 이것은 Drill-up과 Roll-up등 데이터분석의 요약 수준에 대한 Navigation을 가능하게 하는 경로를 지님 |
속성 (Attribute) |
● 각 차원 테이블이 가지고 있는 속성 ● 사실을 검색하고, 여과하고 분류할 때 사용 |
속성계층 (Hierarchiese) |
● 차원 내 정의된 속성들 간에 존재하는 계층 관계 ● 아래로 가기(Drill-down), 위로가기(Roll-up)등 기능 이용 |
3. DW 다차원 모델링 기법 비교
구분 | Star Schema 모델(반정규화된 모델) | Snowflake Schema 모델(정규화된 모델) |
장점 | ● 모델이 단순하여 사용자 이해가 빠름 ● 계층 구조를 정의하기가 쉬움 ● 조인 횟수를 줄임으로 응답 성능 향상 ● Meta Data 단순 |
● 데이터 무결성 유지가 보다 용이 ● 스타 스키마에 비해 상대적으로 작은 저장 공간을 요구 ● 애플리케이션의 유연성 증가 ● 데이터 중복성 최소화 |
단점 | ● Fact 테이블 내의 요약 데이터를 추출할 경우 수행속도 저하( 계층이 여러 단계인 디멘션이 반정규화되어 디멘션이 큰 경우) ● 자료의 불일치 위험 ● 중복 데이터 포함 ● 모델이 유연하지 못함 ● 더 많은 저장 공간이 필요 |
● 구조가 복잡해져 Mart 구축의 장점이 희석 ● 데이터 베이스 내 관리 테이블 수 증가 ● Dimension 테이블 간의 조인으로 인해 응답성능 저하 ● 모델에 대한 사용자의 이해도가 스타 스키마에 비해 상대적으로 어려움 |
Star Schema/ Snowflake Schema
1. 스타 스키마(Star Schema)
: 스타 스키마는 차원(Dimension)테이블과 팩트(Fact)테이블로 구성이되어 있으며, 차원 테이블은 정규화되지 않은 형태로 저장됨
스타 스키마 장점
- 원하는 정보가 주제별로 하나의 테이블에 모두 정리
- 데이터를 단순화된 형태로 저장
- 퀴리에 대해 높은 성능을 제공
- 스타 조인 최적화 기능 활용
- 많은 BI 도구에서 표준처럼 지원
- 낮은 유지보수 비용(추가, 변경이 용이)
눈송이 스키마(Snowflake Schema)
: 스타 스키마에서 차원이 대용량일 경우 발생하는 처리속도 저하 문제를 해결하기 위해 제시된 데이터 모델링 기법
: 스타 스키마의 차원 테이블을 완전 정규화 시킨 것
참조
https://itpenote.tistory.com/527 DW 모델링
https://ysiksik.github.io/study/kt-development-consortium/database-modeling/2022-06-25-DW-Data-Modeling/#dw-%EC%A0%95%EC%9D%98 star/snow schema
'BI > DW' 카테고리의 다른 글
[DW] 데이터 웨어하우스 핵심심화 (0) | 2023.02.03 |
---|---|
[DW]ETL의 간단한 개념 (0) | 2023.01.25 |
[Dimension/ fact] 디멘션과 팩트 개념 (0) | 2023.01.19 |
[DW] 데이터 웨어하우스(Data Warehouse) 란? (0) | 2023.01.18 |
[DW] 데이터 웨어하우스 모델링 방식 (0) | 2023.01.18 |