BI/DW

[Dimension/ fact] 디멘션과 팩트 개념

리오토리 2023. 1. 19. 10:27

마스터와 트랜잭션

마스터 : 트랜잭션에서 참고되는 각종 정보 → 상황에 따라 다시 쓰임

트랜잭션 : 시간과 함께 생성되는 데이터를 기록한 것 → 한 번 기록하면 변화하지 않음

 

이 데이터가 DW(데이터 웨어하우스)로 넘어오면서 데멘션테이블(마스터)와 팩트테이브(트랜잭션)가 된다

 

출처 : 주하히의 기술 블로그

그림 설명

판매이력 테이블: 트랜잭션

나머지 테이블 : 마스터

 

상황에 따라 상품, 점포, 고객 정보는 달라 질 수 있으나, 판매이력은 한 번 생성되면 바뀌지 않는다.

판매이력(트랜잭션)에 마스터 테이블들 정보가 참조된다.

 

디멘션 테이블

데이터 웨어하우스의 세계에서는 팩트 테이블에서 참고되는 마스터 데이터 등을 디멘전 테이블이라 한다

  • 관계형 디비에서 마스터 테이블들이 디멘전 테이블로 가공
  • 디멘전들은 비즈니스 프로세스에서 발생하는 이벤트에 대한 배경 설명 담음
  • '판매이력'이라는 팩트에 대하여 누가, 어디서, 어떤 상품을 구매 했는지에 대한 정보
  • 팩트 테이블과 PK로 연결되어있는 테이블
  • 팩트 테이블의 세세한 정보를 가짐, 주로 텍스트 형식

 

팩트 테이블

데이터 웨어하우스의 세계에서는 트랜잭션처럼 사실이 기록된 것을 팩트 테이블이라 한다

  • 관계형 디비에서 판매이력과 같은 테이블들이 DW에서 팩트 테이블로 가공
  • 지표 등을 산출하기 위해 집계의 대상이 되는 측정값, 수치 등을 저장
  • 비즈니스 측정값, 수치시간에 따라 증가하는데이터
  • Star Schema의 중심에 있는 테이블
  • 디멘전 테이블의 모든 PK로 이루어져 있을 수 있고 계산할 수 있는 측정값이나 관련 값

 

Star Schema

: 팩트 테이블을 중심으로 방사형으로 디멘전 테이블이 위치한 형태

star schena

 

Snowflake Schema

:데이터의 중복을 없애기 위해 여러 테이블이 유기적으로 foreigner key로 여기저기 얽혀있는 형태

snowflake schema

 

 

 

참조

https://juhi.tistory.com/78 디멘션/팩트

https://5ohyun.tistory.com/133 디멘션/팩트

https://dodonam.tistory.com/391 star schema/ snowflake schema