Top

파워 BI와 엑셀 파워 피봇을 사용한 데이터 분석 [예제를 통해 배우는 데이터 모델링]

  • 원서명Analyzing Data with Power BI and Power Pivot for Excel (ISBN 9781509302765)
  • 지은이알베르토 페라리(Alberto Ferrari), 마르코 루쏘(Marco Russo)
  • 옮긴이이지은
  • ISBN : 9791161751696
  • 30,000원
  • 2018년 06월 29일 펴냄
  • 페이퍼백 | 324쪽 | 188*235mm
  • 시리즈 : 데이터 과학

책 소개

요약

정보가 넘쳐나는 시대에 이 정보들을 어떻게 얻고 또 어떻게 활용할 수 있을까? 많은 데이터를 분석하여 데이터가 갖고 있는 정보를 얻고 활용해야 한다. 이 책은 파워 BI와 엑셀의 파워 피봇이라는 데이터 분석 도구를 사용해 데이터를 모델링에 관해 설명한다. 일상적인 업무에서 접하기 쉬운 예제를 통해 데이터 모델링의 기본 개념을 소개하고 있어서 초보자도 쉽게 활용할 수 있으며 데이터 모델링에 대한 감각을 얻을 수 있을 것이다.

이 책에서 다루는 내용

■ 테이블, 관계, 키 등의 데이터 모델링의 기본
■ 스타 스키마와 스노우플레이크, 일반적인 모델링 기술
■ 그래뉼래러티의 중요성
■ 복잡한 데이터 모델에서 판매와 구매 같은 다중 팩트 테이블 사용
■ date 테이블을 사용한 달력과 관계된 계산 관리
■ 고객의 이전 주소나 지정된 매니저와 같은 과거 속성 추적
■ 스냅샷을 사용해 편리하게 수량 계산
■ 가장 효율적인 방법으로 여러 통화 사용
■ 중첩 될 수 있는 기간을 포함하는 이벤트 분석
■ 특정 비즈니스 요구에 필요한 데이터 모델

이 책의 대상 독자

파워 피벗을 사용하는 엑셀 사용자나 파워 BI를 사용하는 데이터 분석가에게 도움되는 책이다. 또는 BI 전문가 경력을 쌓기 시작하는 사람이나 데이터 모델링의 주제를 살펴보고 싶은 사람에게 추천한다.
실제로 데이터 모델링이 필요하다는 사실을 전혀 모르는 독자를 생각하며 이 책을 썼다. 데이터 모델링을 배워야 할 필요가 있다는 사실을 이해시키고 통찰력을 제공하는 것이 목표다. 따라서 데이터 모델링이 무엇이고 왜 유용한 스킬인지 궁금하다면 이 책이 필요하다.

이 책의 구성

1장, '데이터 모델링 소개'에서는 데이터 모델링의 개념을 간단히 소개하고 그래뉼래러티에 대해 살펴본다. 데이터 웨어하우스의 기본적인 모델, 즉 스타 스키마, 스노우 플레이크, 정규화, 비정규화를 정의한다.
2장, '헤더/디테일 테이블 사용'에서는 헤더/디테일 테이블을 사용하는 일반적인 시나리오를 다룬다. 여기서 별도의 두 팩트 테이블에 주문과 주문의 종류를 저장하는 예제를 사용하는 시나리오를 살펴보고 해결 방법을 찾는다.
3장, '다중 팩트 테이블 사용'에서는 여러 팩트 테이블이 있고 이를 종합해 보고서를 만드는 시나리오를 설명한다. 데이터를 적절한 방법으로 살펴보기 위해 올바른 디멘션의 모델을 만들어야 한다는 사실을 강조한다.
4장, '날짜와 시간 처리'에서는 이 책의 가장 긴 장으로 타임 인텔리전스 계산을 다룬다. 적절한 date 테이블을 만드는 방법과 기본적인 타임 인텔리전스(YTD, QTA, PARALLELPERIOD 등)를 계산하는 방법을 설명한다. 그 후 날짜 계산 작업, 연내 특정 기간 처리, 일반적인 date를 사용하는 작업에 대한 몇 가지 예제를 제시한다.
5장, '과거 속성 추적'에서는 서서히 변하는 디멘션을 사용하는 모델을 설명한다. 5장에서 바뀌는 속성을 추적해야 할 때 필요한 변환 단계와 서서히 변하는 디멘션을 사용할 때 현재 시점에서 DAX 코드를 작성하는 올바른 방법을 상세히 설명한다.
6장, '스냅샷 사용'에서는 스냅샷의 매력적인 면을 다룬다. 스냅샷이 무엇인지, 스냅샷을 사용해야 할 때와 사용 이유, 스냅샷을 기반으로 값을 계산하는 방법을 소개하고 강력한 변환 매트릭스 모델을 설명한다.
7장, '날짜와 시간 간격 분석'에서는 5장에서 한발 더 나아가 시간 계산을 다루지만, 이번에는 팩트 테이블에 저장된 이벤트가 기간을 갖고 이로 인해 정확한 결과를 얻기 위해 특별한 조치가 필요한 모델을 분석한다.
8장, '다대다 관계'에서는 다대다 관계를 사용하는 방법을 설명한다. 다대다 관계는 모든 데이터 모델에서 아주 중요한 역할을 한다. 일반적인 다대다 관계와 캐스케이딩 관계, 그리고 인자 재할당과 필터 사용에 대해 다루고 성능과 이를 향상시키는 방법에 대해 알아본다.
9장, '서로 다른 그래뉼래러티 사용'에서는 서로 다른 그래뉼래러티로 저장된 팩트 테이블을 사용하는 작업에 대해 더 알아본다. 팩트 테이블의 그래뉼래러티가 서로 다른 예산 예제를 살펴보고, DAX와 데이터 모델에서 제공하는 몇 가지 대안을 관찰한다.
10장, '데이터 모델 세그멘테이션'에서는 세그멘테이션 모델에 대해 설명한다. 가격에 의한 단순한 세그멘테이션에서 시작해 가상 관계를 사용하는 동적 세그멘테이션 분석까지 다루고, DAX에서 수행된 ABC 분석에 대해 설명한다.
11장, '다중 통화 작업'에서는 환전에 대해 다룬다. 환율을 사용할 때 요구 사항을 이해하고 적절한 모델을 설계해야 한다. 요구 사항이 서로 다른 몇 개의 시나리오를 분석하고 각 시나리오에 가장 좋은 해결 방법을 찾아본다.
부록 A, '데이터 모델링 101'에서는 이것은 참조용이다. 예제를 사용해 이 책에서 다룰 기본 개념을 간략하게 설명한다. 어떤 측면이 확실하지 않을 때 여기로 건너뛰어 새로 이해하고 다시 주요 장으로 돌아가도록 한다.

저자/역자 소개

지은이의 말

파워 BI는 2015년 배포됐다. 최근 숫자를 좋아하는 사람들은 엑셀의 파워 피벗과 파워 BI를 모두 좋아한다고 말할 수 있다. 이 두 도구는 VentiPaq 데이터베이스 엔진과 DAX 언어 등 SQL Server Analysis Services에서 이어받은 많은 기능을 공유한다.
엑셀의 이전 버전에서 숫자에 대해 분석하는 것은 데이터 세트를 로드하고 칼럼을 계산하고 차트를 설계하는 계산식을 작성하는 일이었다. 워크북의 크기와 엑셀의 계산식 언어라는 제약 사항으로 인해 대량의 고속 처리를 위한 최선의 선택이 아니었다. 파워 BI와 파워 피벗의 새로운 엔진은 빠르게 발전했다. 이제 데이터베이스의 모든 기능과 멋진 언어(DAX)를 사용할 수 있다. 하지만 더 나은 기능에는 더 많은 책임이 뒤따른다. 새로운 도구를 제대로 활용하고 싶다면 더 많이 배워야 한다. 즉, 데이터 모델링의 기초를 배워야 한다.
데이터 모델링은 로켓 과학이 아니다. 데이터를 통한 분석에 관심이 있는 사람이라면 익혀야 하는 기본적인 스킬이다. 게다가 숫자를 좋아한다면 데이터 모델링도 좋아할 것이다. 그러므로 익혀야 하는 쉬운 스킬일 뿐만 아니라 믿을 수 없을 정도로 재미있다.
이 책은 일상에서 맞닥뜨릴 가능성이 높은 실용적인 예제를 통해 데이터 모델링의 기본 개념을 가르쳐준다. 복잡한 솔루션 설계를 위한 많은 어려운 결정을 상세히 설명하는 모델링 관련 복잡한 책을 쓰고 싶은 것이 아니다. 대신 컨설턴트로서 일상적인 업무에서 보게 되는 예제에 초점을 맞춘다. 고객이 요청하는 문제들 중에 일반적인 문제라고 생각되는 것들을 모았다. 그리고 이 문제들에 대해 각 예제 관련 솔루션을 제공하고 이를 어느 정도 정리해 데이터 모델링 훈련용으로 사용했다.
이 책을 끝까지 보면 데이터 모델링의 전문가가 되지 못하더라도 주제에 대한 감각을 얻을 것이다. 데이터베이스를 보고 필요한 값을 계산하는 방법을 알아내려 하고, 도움이 되는 모델로 변경하는 것에 대해 고민하기 시작한다면 이 책의 목표를 이룬 것이나 다름 없다. 또한 성공적인 데이터 모델러가 되기 위한 첫걸음을 한 것이다. 경험과 많은 실패 이후에야 훌륭한 데이터 모델러가 될 수 있을 것이다.

지은이 소개

알베르토 페라리(Alberto Ferrari)

마이크로소프트 파워 피봇, 파워 BI, DAX, SQL Server Analysis Services에 대한 기사를 정기적으로 게재하는 SQLBI 설립자다. 비즈니스 인텔리전스(BI)에 대한 컨설턴트이자 멘토며, 종종 Microsoft Ignite, PASS Summit, SQLBits와 같은 주요 국제 콘퍼런스에서 연설한다.

마르코 루쏘(Marco Russo)

마이크로소프트 파워 피봇, 파워 BI, DAX, SQL Server Analysis Services에 대한 기사를 정기적으로 게재하는 SQLBI 설립자다. 비즈니스 인텔리전스(BI)에 대한 컨설턴트이자 멘토며, 종종 Microsoft Ignite, PASS Summit, SQLBits와 같은 주요 국제 콘퍼런스에서 연설한다.

옮긴이의 말

몇 년 전부터 빅데이터란 단어를 많이 들어봤을 것이다. 빅데이터란 단어가 익숙해지기 전에도 데이터란 방대한 양의 정보였으며, 지금은 그 크기가 훨씬 더 커졌다. 데이터 자체만으로는 아무 의미가 없다. 이 데이터를 잘 분석해야 의미 있는 정보가 되는 것이다. 여러분도 어떤 데이터를 보면서 이 데이터가 무엇을 의미하는지 알아채지 못한 경험이 있을 수 있다. 데이터가 주는 정보를 알기 위해 데이터 분석이 필요하고, 이를 위해 데이터 모델링 기술을 아는 것이 좋다.
데이터 분석을 하고자 데이터베이스를 사용해본 사람이라면 가끔 필요한 데이터를 가져오는 방법이 이상하다거나 혹은 제대로 요청한 것 같은데 결과가 잘못됐던 적이 있을 것이다. 데이터 모델링이 잘못됐을 수 있고, 혹은 사용자가 데이터 모델을 잘 이해하지 못한 채 사용하기 때문일 수 있다. 이 책은 우리가 쉽게 접할 수 있는 데이터 분석 툴인 파워 BI와 파워 피봇을 사용하여 데이터 모델링에 대해 소개하고 있다. 더불어 데이터 모델링의 예시와 잘못된 모델이나 모델을 잘못 사용하는 예시도 함께 소개한다. 모델링의 기본 요소와 기술들을 살펴보고 더 훌륭한 데이터 모델을 만드는 기초로 활용할 수 있을 것이다.

옮긴이 소개

이지은

컴퓨터공학을 전공하고 피처폰용 모바일 브라우저 개발을 시작으로 개발 업무를 맡았다. 이후 안드로이드앱 개발 프로젝트에 참여했으며 최근 통신사 과금 검증, 플랫폼 운영 등의 업무를 했다. 현재는 기술 번역에 집중하고 있다. 기술 전문가 그룹 GoDev의 멤버로 활동하고 있다.

목차

목차
  • Chapter 1. 데이터 모델링 소개
    • 단일 테이블 작업
    • 데이터 모델 소개
    • 스타 스키마 소개
    • 객체 이름 정의의 중요성 이해
    • 결론

  • Chapter 2. 헤더/디테일 테이블 사용
    • 헤더/디테일 소개
    • 헤더 값 집계
    • 헤더/디테일 평면화
    • 결론

  • Chapter 3. 다중 팩트 테이블 사용
    • 비정규화 팩트 테이블 사용
    • 디멘션 간의 필터링
    • 모델 모호성의 이해
    • 주문과 청구서
      • 고객별 전체 청구 금액 계산
      • 고객별 해당 주문을 포함하는 청구 금액 계산
      • 청구됐을 때 주문 금액 계산
    • 결론

  • Chapter 4. 날짜와 시간 처리
    • date 디멘션 생성
    • 자동 time 디멘션 이해
      • 엑셀의 자동 시간 그룹화
      • 파워 BI 데스크톱의 자동 시간 그룹화
    • 다중 date 디멘션 사용
    • 날짜와 시간 처리
    • 타임 인텔리전스 계산
    • 회계 달력 처리
    • 근무일 계산
      • 한 국가 또는 지역의 근무일
      • 여러 국가 또는 지역을 고려한 작업
    • 연내 특정 기간 처리
      • 중첩되지 않는 기간 사용
      • today와 관련된 기간
      • 중첩 기간 사용
    • 주간 캘린더 작업
    • 결론

  • Chapter 5. 과거 속성 추적
    • 서서히 변하는 디멘션 소개
    • 서서히 변하는 디멘션 사용
    • 서서히 변하는 디멘션 로딩
      • 디멘션의 그래뉼래러티 수정
      • 팩트 테이블의 그래뉼래러티 수정
    • 빠르게 변하는 디멘션
    • 올바른 모델링 기술 선택
    • 결론

  • Chapter 6. 스냅샷 사용
    • 시간에 따라 집계할 수 없는 데이터 사용
    • 스냅샷 집계
    • 파생 스냅샷 이해
    • 전이 행렬 이해
    • 결론

  • Chapter 7. 날짜와 시간 간격 분석
    • 시간 데이터 소개
    • 단순 간격 집계
    • 날짜를 넘기는 간격
    • 교대 근무와 시간 근무 모델링
    • 진행 중인 이벤트 분석
    • 서로 다른 기간의 혼합
    • 결론

  • Chapter 8. 다대다 관계
    • 다대다 관계 소개
      • 양방향 패턴의 이해
      • 비가산 이해
    • 다대다 캐스캐이딩
    • 일시적인 다대다
      • 인자와 퍼센트 재할당
      • 다대다 구체화
    • 팩트 테이블을 브리지로 사용
    • 성능 고려 사항
    • 결론

  • Chapter 9. 서로 다른 그래뉼래러티 사용
    • 그래뉼래러티 소개
    • 서로 다른 그래뉼래러티의 관계
      • 예산 데이터 분석
      • 필터 이동을 위한 DAX 코드 사용
      • 관계를 통한 필터링
      • 잘못된 그래뉼래러티로 값 숨기기
      • 높은 그래뉼래러티 값 할당
    • 결론

  • Chapter 10. 데이터 모델 세그멘테이션
    • 다중 칼럼 관계 계산
    • 정적 세그멘테이션 계산
    • 동적 세그멘테이션 사용
    • 계산된 칼럼의 힘: ABC 분석
    • 결론

  • Chapter 11. 다중 통화 작업
    • 다양한 시나리오 이해
    • 여러 종류의 소스 통화, 보고를 위한 하나의 통화
    • 하나의 소스 통화, 보고서를 위한 여러 통화
    • 여러 종류의 소스 통화, 여러 종류의 보고서 통화
    • 결론

  • Appendix A. 데이터 모델링 101
    • 테이블
    • 데이터 타입
    • 관계
    • 필터링과 크로스필터링
    • 다양한 종류의 모델
    • 스타 스키마
    • 스노우플레이크 스키마
    • 브리지 테이블을 사용하는 모델
    • 측정식과 가산성
      • 가산 측정식
      • 비가산 측정식
      • 반가산 측정식

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안