파워 BI와 엑셀 파워 피봇을 사용한 데이터 분석 [예제를 통해 배우는 데이터 모델링]
- 원서명Analyzing Data with Power BI and Power Pivot for Excel (ISBN 9781509302765)
- 지은이알베르토 페라리(Alberto Ferrari), 마르코 루쏘(Marco Russo)
- 옮긴이이지은
- ISBN : 9791161751696
- 30,000원
- 2018년 06월 29일 펴냄
- 페이퍼백 | 324쪽 | 188*235mm
- 시리즈 : 데이터 과학
책 소개
요약
정보가 넘쳐나는 시대에 이 정보들을 어떻게 얻고 또 어떻게 활용할 수 있을까? 많은 데이터를 분석하여 데이터가 갖고 있는 정보를 얻고 활용해야 한다. 이 책은 파워 BI와 엑셀의 파워 피봇이라는 데이터 분석 도구를 사용해 데이터를 모델링에 관해 설명한다. 일상적인 업무에서 접하기 쉬운 예제를 통해 데이터 모델링의 기본 개념을 소개하고 있어서 초보자도 쉽게 활용할 수 있으며 데이터 모델링에 대한 감각을 얻을 수 있을 것이다.
이 책에서 다루는 내용
■ 테이블, 관계, 키 등의 데이터 모델링의 기본
■ 스타 스키마와 스노우플레이크, 일반적인 모델링 기술
■ 그래뉼래러티의 중요성
■ 복잡한 데이터 모델에서 판매와 구매 같은 다중 팩트 테이블 사용
■ date 테이블을 사용한 달력과 관계된 계산 관리
■ 고객의 이전 주소나 지정된 매니저와 같은 과거 속성 추적
■ 스냅샷을 사용해 편리하게 수량 계산
■ 가장 효율적인 방법으로 여러 통화 사용
■ 중첩 될 수 있는 기간을 포함하는 이벤트 분석
■ 특정 비즈니스 요구에 필요한 데이터 모델
이 책의 대상 독자
파워 피벗을 사용하는 엑셀 사용자나 파워 BI를 사용하는 데이터 분석가에게 도움되는 책이다. 또는 BI 전문가 경력을 쌓기 시작하는 사람이나 데이터 모델링의 주제를 살펴보고 싶은 사람에게 추천한다.
실제로 데이터 모델링이 필요하다는 사실을 전혀 모르는 독자를 생각하며 이 책을 썼다. 데이터 모델링을 배워야 할 필요가 있다는 사실을 이해시키고 통찰력을 제공하는 것이 목표다. 따라서 데이터 모델링이 무엇이고 왜 유용한 스킬인지 궁금하다면 이 책이 필요하다.
이 책의 구성
1장, '데이터 모델링 소개'에서는 데이터 모델링의 개념을 간단히 소개하고 그래뉼래러티에 대해 살펴본다. 데이터 웨어하우스의 기본적인 모델, 즉 스타 스키마, 스노우 플레이크, 정규화, 비정규화를 정의한다.
2장, '헤더/디테일 테이블 사용'에서는 헤더/디테일 테이블을 사용하는 일반적인 시나리오를 다룬다. 여기서 별도의 두 팩트 테이블에 주문과 주문의 종류를 저장하는 예제를 사용하는 시나리오를 살펴보고 해결 방법을 찾는다.
3장, '다중 팩트 테이블 사용'에서는 여러 팩트 테이블이 있고 이를 종합해 보고서를 만드는 시나리오를 설명한다. 데이터를 적절한 방법으로 살펴보기 위해 올바른 디멘션의 모델을 만들어야 한다는 사실을 강조한다.
4장, '날짜와 시간 처리'에서는 이 책의 가장 긴 장으로 타임 인텔리전스 계산을 다룬다. 적절한 date 테이블을 만드는 방법과 기본적인 타임 인텔리전스(YTD, QTA, PARALLELPERIOD 등)를 계산하는 방법을 설명한다. 그 후 날짜 계산 작업, 연내 특정 기간 처리, 일반적인 date를 사용하는 작업에 대한 몇 가지 예제를 제시한다.
5장, '과거 속성 추적'에서는 서서히 변하는 디멘션을 사용하는 모델을 설명한다. 5장에서 바뀌는 속성을 추적해야 할 때 필요한 변환 단계와 서서히 변하는 디멘션을 사용할 때 현재 시점에서 DAX 코드를 작성하는 올바른 방법을 상세히 설명한다.
6장, '스냅샷 사용'에서는 스냅샷의 매력적인 면을 다룬다. 스냅샷이 무엇인지, 스냅샷을 사용해야 할 때와 사용 이유, 스냅샷을 기반으로 값을 계산하는 방법을 소개하고 강력한 변환 매트릭스 모델을 설명한다.
7장, '날짜와 시간 간격 분석'에서는 5장에서 한발 더 나아가 시간 계산을 다루지만, 이번에는 팩트 테이블에 저장된 이벤트가 기간을 갖고 이로 인해 정확한 결과를 얻기 위해 특별한 조치가 필요한 모델을 분석한다.
8장, '다대다 관계'에서는 다대다 관계를 사용하는 방법을 설명한다. 다대다 관계는 모든 데이터 모델에서 아주 중요한 역할을 한다. 일반적인 다대다 관계와 캐스케이딩 관계, 그리고 인자 재할당과 필터 사용에 대해 다루고 성능과 이를 향상시키는 방법에 대해 알아본다.
9장, '서로 다른 그래뉼래러티 사용'에서는 서로 다른 그래뉼래러티로 저장된 팩트 테이블을 사용하는 작업에 대해 더 알아본다. 팩트 테이블의 그래뉼래러티가 서로 다른 예산 예제를 살펴보고, DAX와 데이터 모델에서 제공하는 몇 가지 대안을 관찰한다.
10장, '데이터 모델 세그멘테이션'에서는 세그멘테이션 모델에 대해 설명한다. 가격에 의한 단순한 세그멘테이션에서 시작해 가상 관계를 사용하는 동적 세그멘테이션 분석까지 다루고, DAX에서 수행된 ABC 분석에 대해 설명한다.
11장, '다중 통화 작업'에서는 환전에 대해 다룬다. 환율을 사용할 때 요구 사항을 이해하고 적절한 모델을 설계해야 한다. 요구 사항이 서로 다른 몇 개의 시나리오를 분석하고 각 시나리오에 가장 좋은 해결 방법을 찾아본다.
부록 A, '데이터 모델링 101'에서는 이것은 참조용이다. 예제를 사용해 이 책에서 다룰 기본 개념을 간략하게 설명한다. 어떤 측면이 확실하지 않을 때 여기로 건너뛰어 새로 이해하고 다시 주요 장으로 돌아가도록 한다.
목차
목차
- Chapter 1. 데이터 모델링 소개
- 단일 테이블 작업
- 데이터 모델 소개
- 스타 스키마 소개
- 객체 이름 정의의 중요성 이해
- 결론
- Chapter 2. 헤더/디테일 테이블 사용
- 헤더/디테일 소개
- 헤더 값 집계
- 헤더/디테일 평면화
- 결론
- Chapter 3. 다중 팩트 테이블 사용
- 비정규화 팩트 테이블 사용
- 디멘션 간의 필터링
- 모델 모호성의 이해
- 주문과 청구서
- 고객별 전체 청구 금액 계산
- 고객별 해당 주문을 포함하는 청구 금액 계산
- 청구됐을 때 주문 금액 계산
- 결론
- Chapter 4. 날짜와 시간 처리
- date 디멘션 생성
- 자동 time 디멘션 이해
- 엑셀의 자동 시간 그룹화
- 파워 BI 데스크톱의 자동 시간 그룹화
- 다중 date 디멘션 사용
- 날짜와 시간 처리
- 타임 인텔리전스 계산
- 회계 달력 처리
- 근무일 계산
- 한 국가 또는 지역의 근무일
- 여러 국가 또는 지역을 고려한 작업
- 연내 특정 기간 처리
- 중첩되지 않는 기간 사용
- today와 관련된 기간
- 중첩 기간 사용
- 주간 캘린더 작업
- 결론
- Chapter 5. 과거 속성 추적
- 서서히 변하는 디멘션 소개
- 서서히 변하는 디멘션 사용
- 서서히 변하는 디멘션 로딩
- 디멘션의 그래뉼래러티 수정
- 팩트 테이블의 그래뉼래러티 수정
- 빠르게 변하는 디멘션
- 올바른 모델링 기술 선택
- 결론
- Chapter 6. 스냅샷 사용
- 시간에 따라 집계할 수 없는 데이터 사용
- 스냅샷 집계
- 파생 스냅샷 이해
- 전이 행렬 이해
- 결론
- Chapter 7. 날짜와 시간 간격 분석
- 시간 데이터 소개
- 단순 간격 집계
- 날짜를 넘기는 간격
- 교대 근무와 시간 근무 모델링
- 진행 중인 이벤트 분석
- 서로 다른 기간의 혼합
- 결론
- Chapter 8. 다대다 관계
- 다대다 관계 소개
- 양방향 패턴의 이해
- 비가산 이해
- 다대다 캐스캐이딩
- 일시적인 다대다
- 인자와 퍼센트 재할당
- 다대다 구체화
- 팩트 테이블을 브리지로 사용
- 성능 고려 사항
- 결론
- 다대다 관계 소개
- Chapter 9. 서로 다른 그래뉼래러티 사용
- 그래뉼래러티 소개
- 서로 다른 그래뉼래러티의 관계
- 예산 데이터 분석
- 필터 이동을 위한 DAX 코드 사용
- 관계를 통한 필터링
- 잘못된 그래뉼래러티로 값 숨기기
- 높은 그래뉼래러티 값 할당
- 결론
- Chapter 10. 데이터 모델 세그멘테이션
- 다중 칼럼 관계 계산
- 정적 세그멘테이션 계산
- 동적 세그멘테이션 사용
- 계산된 칼럼의 힘: ABC 분석
- 결론
- Chapter 11. 다중 통화 작업
- 다양한 시나리오 이해
- 여러 종류의 소스 통화, 보고를 위한 하나의 통화
- 하나의 소스 통화, 보고서를 위한 여러 통화
- 여러 종류의 소스 통화, 여러 종류의 보고서 통화
- 결론
- Appendix A. 데이터 모델링 101
- 테이블
- 데이터 타입
- 관계
- 필터링과 크로스필터링
- 다양한 종류의 모델
- 스타 스키마
- 스노우플레이크 스키마
- 브리지 테이블을 사용하는 모델
- 측정식과 가산성
- 가산 측정식
- 비가산 측정식
- 반가산 측정식