지연 변경 차원

Microsoft Fabric로 데이터 변환 및 분석

Luis Silva

Solution Architect - Data & AI

차원은 얼마나 자주 변할까요?

절대 변하지 않는 차원의 특성을 설명하는 표

Microsoft Fabric로 데이터 변환 및 분석

차원은 얼마나 자주 변할까요?

절대 변하지 않는 차원과 빠르게 변하는 차원의 특성을 설명하는 표

Microsoft Fabric로 데이터 변환 및 분석

차원은 얼마나 자주 변할까요?

절대 변하지 않는 차원, 빠르게 변하는 차원, 그리고 천천히 변하는 차원의 특성을 설명하는 표

Microsoft Fabric로 데이터 변환 및 분석

지연 변경 차원

  • 데이터 변경 관리 방식에 따른 SCD 유형:
    • 유형 0(변경 없음)
    • 유형 1(덮어쓰기)
    • 유형 2(전체 이력 보존)
    • 유형 3(제한적 이력 보존)
    • 기타 유형(4, 5, 6, 7)
Microsoft Fabric로 데이터 변환 및 분석

SCD 유형 0: 변경 없음

  • 변경을 허용하지 않습니다
  • 데이터 변경은 폐기됩니다
  • 데이터는 항상 원본 상태를 반영합니다
  • 최초 적재 이후 변경되지 않아야 할 데이터에 사용합니다

차원 테이블의 개인 레코드 다이어그램. 동일 인물의 새 레코드가 다른 생년월일로 도착해도, 변경은 무시되고 원본 레코드가 유지됨

Microsoft Fabric로 데이터 변환 및 분석

SCD 유형 1: 덮어쓰기

  • 기존 레코드를 새 데이터로 덮어씁니다
  • 데이터는 항상 최신 값을 반영합니다
  • 예: 변경 이력 필요 없는 보조 속성(전화번호 등)에 사용

차원 테이블의 개인 레코드 다이어그램. 동일 인물의 새 레코드가 다른 전화번호로 도착하면, 해당 레코드의 전화번호가 새 값으로 업데이트됨

Microsoft Fabric로 데이터 변환 및 분석

SCD 유형 2: 전체 이력 보존

  • 기존 레코드는 유지하고 새 데이터로 새 레코드를 생성합니다
  • 전체 이력을 보존합니다
  • 변경 적용 날짜를 추적하는 추가 컬럼을 사용합니다

차원 테이블의 영업사원 레코드 다이어그램. 동일 영업사원의 새 레코드가 다른 영업 지역으로 도착하면, 기존 레코드에 유효 시작일과 종료일을 기록하고 새 값을 가진 레코드를 추가 생성합니다. 기존 레코드는 비현재로, 새 레코드는 현재로 표시됨

Microsoft Fabric로 데이터 변환 및 분석

SCD 유형 3: 일부 이력 보존

  • 하나 또는 소수의 속성만 이력을 유지합니다
  • 각 속성에 이전 값을 저장하는 추가 컬럼을 둡니다
  • 행 추가 없이 제한적 이력(현재값과 직전값)이 필요할 때 사용합니다

차원 테이블의 영업사원 레코드 다이어그램. 동일 영업사원의 새 직함이 도착하면, 레코드를 새 직함과 이전 직함, 변경 일자로 업데이트함

Microsoft Fabric로 데이터 변환 및 분석

기타 SCD 유형

  • 기타 유형(4, 5, 6, 7)은 1·2·3의 변형입니다
  • 복잡성 때문에 널리 쓰이지 않습니다
  • 가장 일반적인 유형은 1과 2입니다. 가능하면 다음을 사용하십시오:
    • 이력이 필요 없으면 SCD 유형 1
    • 이력이 필요하면 SCD 유형 2
Microsoft Fabric로 데이터 변환 및 분석

연습해 봅시다!

Microsoft Fabric로 데이터 변환 및 분석

Preparing Video For Download...