Top

데이터 시각화 원리 [인포그래픽 원리와 엑셀 활용 방법을 기초로 한 데이터 시각화 안내서]

  • 원서명Data at Work: Best practices for creating effective charts and information graphics in Microsoft Excel (ISBN 9780134268637)
  • 지은이조르즈 카몽이스(Jorge Camões)
  • 옮긴이이혜연
  • ISBN : 9791161750163
  • 35,000원
  • 2017년 06월 30일 펴냄 (절판)
  • 페이퍼백 | 468쪽 | 188*235mm
  • 시리즈 : 데이터 과학

판매처

  • 현재 이 도서는 구매할 수 없습니다.

책 소개

2018년 대한민국학술원 우수학술도서 선정도서
요약

비즈니스에서 효과적으로 데이터 시각화할 수 있는 원리를 설명하는 책으로, 사용할 소프트웨어에 독립적으로 응용할 수 있는 인포그래픽 안내서다. 엑셀에서 만든 차트를 중심으로 설명하기 때문에 엑셀 기반의 일반적인 사용자들은 좀 더 많은 팁을 얻을 수 있다. 내용을 따라가다 보면 어느새 엑셀 사용만으로도 데이터 과학자처럼 사고하는 방법을 터득하고 있는 자신을 발견하게 될 것이다. 그래픽 디자이너가 아니더라도 효율적이고 보기 좋은 시각화를 만들 수 있는 방법을 익힐 수 있다.

이 책에서 다루는 내용

무엇보다 효율적인 데이터 시각화란 데이터에 관해 사고하는 하나의 방식이다. 이 책은 여러분이 이미 생각해봤을 스킬을 사용하는 방법과 업무와 직접 관계된 방법들로 데이터를 구성하는 방법을 보여줄 것이다. 비즈니스 시각화가 작동하는 방식과 이유 그리고 무엇이 이것을 효율적으로 만들어주는지 보여줌으로써 여러분에게 데이터 분석가처럼 생각하는 방법을 가르쳐주는 것으로 시작한다. 어떤 차트는 작동하고 어떤 차트는 작동하지 않는지 확고한 개념을 갖고, 여러분은 데이터를 준비하고, 정렬하며, 분석할 수 있는 모범 사례를 학습하게 될 것이다.
■ 여러분의 필요에 제일 잘 맞는 차트 유형을 고르는 방법
■ 여러분의 차트에 적합한 서식을 적용하는 방법
■ 색깔을 효과적으로 사용하기 위한 특별한 팁들

이 책의 대상 독자

데이터 시각화에 관한 블로그(excelcharts.com)를 쓰고 있고, 수년간 워크시트에서 벗어나 진짜 시각화 도구에 집중해왔다. 이것이 보통의 과정이다. 하지만 스프레드시트는 우리 중 대다수가 조직적 컨텍스트에서 접근할 수 있는 유일한 도구며, 그래픽 능력을 배우고 향상시키려면 평균적인 사람들에게 데이터 시각화를 제공하는 데서 시작해야 한다. 그러고 나서 사람들과 조직은 자신들의 필요에 적합한 도구인지, 다른 애플리케이션으로 자연스럽게 수요 전환이 가능한지 여부를 평가하게 된다.
이 책은 분석적인 커뮤니케이션 도구로써의 데이터 시각화 표현을 위해 스프레드시트를 사용하는 대학생, 자신의 영업분석을 하는 영업사원들, 스스로 예산을 계획하는 상품 매니저들, 그리고 수행평가를 하는 매니저들을 위한 시각화 책이다.

이 책의 구성

이 책은 일상 작업에 적용하기에는 너무 추상적인 이론과 일반화된 규칙을 이해하는 데 도움이 되는 구체적인 작업에 초점을 맞춘 실전 사이에 있는 책이다. 나는 모든 장에서 각 사례에 이론이 어떻게 적용되는지, 그리고 특정 작업이 항상 이 이론을 설명하고 정당화하며 일반화하는 이론상의 프레임워크를 어떻게 갖는지 보여주려고 노력했다. 방법뿐만 아니라 이유를 이해하는 것이 중요하다.
데이터 시각화의 이해를 시작하기 위해 이 책의 첫 번째 장에서는 행동이 일어나는 컨텍스트인 인간 감각의 특성, 차트를 만들 때 우리가 사용하는 개체, 지각의 역할, 지식을 얻는 방법, 그리고 데이터 시각화를 정의할 수 있는 다양한 방법들을 설명하고 있다.
두 번째 장에서 차트는 시각적 논쟁의 대상이 된다는 점을 인지하고, 질문에 답할 것이다. 이 질문에 대한 답변의 질은 여러분이 선택한 차트의 유형으로 시작한다. 그 다음으로 차트 형식을 지정하고, 최상의 차트 형식이 품질을 높이고 결함을 줄여 콘텐츠를 제공하는 것이지 콘텐츠와 구별하는 것이 아니라는 점을 알게 된다.
이 책을 통해 데이터 관리의 모범 사례와 엑셀 차트 라이브러리, 잘못된 소프트웨어의 기본 설정을 피하는 방법, 엑셀 라이브러리가 제공하는 것 이상으로 애플리케이션의 유연성을 이용하는 방법을 포함해 구조적 컨텍스트에서 데이터 시각화를 분석할 것이다.

상세이미지

저자/역자 소개

지은이의 말

어떤 데이터 포인트도 그 자체로 온전한 섬이 아니다.
모든 데이터 포인트는 대륙의 한 조각, 패턴의 한 부분일 뿐이다.

위대한 시인 존 돈(John Donne)이 그의 아름다운 시 “아무도 혼자인 사람은 없다(No man is an island)”가 새겨진 자신의 무덤 속에서도 탄식하겠지만, 나는 컨텍스트와 웹 관계를 갖고 있는 데이터의 특성을 이 시 구절처럼 더 잘 표현할 방법을 찾지 못하겠다. 지식으로 향하는 길은 이러한 관계를 발견하고 시각화되도록 만드는 데 있다.
사회의 변화와 기술의 진보로 세상은 더 불확실한 곳이 되었다. 또 다른 시인인 루이스 드 카몽이스(Luis de Camoes)는 “변화는 이전처럼 변하지 않는다”라고 말했다. 불확실성에 대처하기 위해 우리는 대량으로 데이터를 생산하고 검색서비스에 기술을 적용한다. 이것은 수년에 걸쳐 많은 이름으로 불려왔으며, 오늘날은 이것을 ‘빅데이터(Big Data)’라고 부른다.
데이터 수집과 저장이 목표라면, 데이터가 많을수록 더 좋다. 하지만 우리가 놓치고 있는 것은 무엇일까? 만약 더 많은 데이터를 정말 더 좋은 데이터로 바꾸는 올바른 기술이 함께 동반되지 않는다면 우리는 더 이상 많은 데이터가 필요하지 않다. 우리는 데이터를 필요로 하는 사람들이 데이터를 어떻게 사용할지, 어떤 목적을 갖고 있는지를 고려할 필요가 있다. 그렇지 않다면 쓸모 없는 데이터를 하드디스크의 잊혀진 폴더 안에 디지털 먼지가 되도록 계속해서 쌓아둘 필요가 없다. 잠깐만! 파이차트를 만드는 것 역시 그다지 좋은 생각이 아니다.

지은이 소개

조르즈 카몽이스(Jorge Camões)

통계학과 정보관리를 공부했고, 2010년부터 정보시각화를 효과적으로 사용하는 방법에 대해 상위 25개 제약회사와 주요 유통업의 고객들을 대상으로 경영컨설팅을 해왔다. 컨설팅 사업을 시작하기 전, 머크 사(Merck&Co.)의 포르투갈 자회사의 비즈니스 인텔리전스(Business Intelligence) 부서에서 10년간 일했다. 현재는 포르투갈 리스본에 위치한 집에서 인기 있는 데이터 시각화 블로그인 Excelcharts.com을 운영하고 있다.

옮긴이의 말

데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정 자체를 데이터 시각화라고 하며, 비즈니스에서는 데이터의 효과적인 시각적 전달을 위해 ‘차트’나 ‘그래프’를 주로 이용한다. 많은 비즈니스 솔루션과 오픈소스 계열의 소프트웨어는 데이터 시각화 작업을 하게 될 작업자의 편의를 위해 사전 정의된 차트나 그래프의 서식을 방대하게 제공하고 있으며, 이 부문의 개발에 계속해서 많은 자원을 투자함으로써 데이터 시각화의 영역은 나날이 발달하고 있다. 또한 데이터 과학 영역의 요소와 그 사용성이 급증하게 됨으로써, 차트와 그래프 자체의 종류와 복잡성 역시 증가해 이렇게 사전 정의된 서식을 이용하는 것조차 효율적인 시각화를 위해서는 어떤 방법으로 무엇을 표시해야 할지를 결정하는 데에 상당한 노력이나 사전지식이 필요한 것이 사실이다. 경우에 따라서는 시각화 개체가 온라인상에서 사용돼야 할 때, 개체와 사용자 간 상호작용하는 기능까지 고려해 UX(User Experience), 사용자 경험 측면을 반영해야 하기도 한다.
이렇게 데이터 시각화는 정보 시각화(Information Visualization), 과학적 시각화(Scientific Visualization), 시각 디자인(Visual Design), 정보 그래픽(Information Graphic), 데이터 분석(Data Analytics), 데이터 과학(Data Science) 등의 분야가 복합적으로 관련되기에 자칫 균형을 잃으면 기능적인 요소나 심미적인 측면이 강조되는 결과를 초래해 정보를 명확하고 효과적으로 전달하려는 목적을 벗어나게 된다. 또 하나의 융합 영역인 데이터 시각화 작업을 목전에 두고 있는 많은 작업자를 위해 이 책은 인포그래픽과 차트의 기본적인 원리를 설명함으로써 전문적인 그래픽 디자이너가 아니더라도 효율적이고 세련된 시각화 개체를 생성할 수 있도록 도와주고 있다.
문서상으로 전달하는 시각화 개체뿐만 아니라, 가상현실(VR), 증강현실(AR) 등이 흔히 사용될 세상을 맞이하게 돼 여러 종류의 시각화 개체의 생산이 필요한 업무를 담당할 많은 작업자에게 이 책은 좋은 안내서가 될 것이다.

옮긴이 소개

이혜연

수년간 대기업 데이터 마이닝 시스템과 머신러닝 시스템 컨설팅 및 고급 분석을 기반으로 한 전략 컨설팅 경력을 보유하고 있다. 현재도 해당 분야의 컨설턴트로 활약 중이며, 기업과 공공기관 및 대학교에서 관련된 강의를 진행하고 있다. 기술 콘텐츠의 저술/번역 공동체 GoDev의 가족이다.

목차

목차
  • 1장. 데이터 시각화의 블록 쌓기
    • 자극의 공간적 조직
    • 추상적인 개념 바라보기
      • 차트
      • 네트워크
      • 지도
      • 부피: 비유적인 시각화
      • 엑셀에서의 시각화
    • 망막 변수
    • 개념에서 차트로
    • 원시 차트
    • 차트효과
    • 요약

  • 2장. 시각적 지각
    • 지각과 인지
      • 인지분산
      • 잘못된 이분법
      • 차트와 표
    • 눈 생리학
      • 망막
      • 원추세포들
      • 시야각
      • 새카드
      • 시각화에 대한 눈 생리학의 영향
    • 전 주의 처리
      • 두드러지게 보이기
      • 전 주의 처리의 영향과 시각화에서의 두드러짐
    • 작업 메모리
      • 시각화에 대한 작업 메모리의 영향
    • 게슈탈트 법칙
      • 근접의 법칙
      • 유사의 법칙
      • 구분의 법칙
      • 연결의 법칙
      • 공동 운명의 법칙
      • 폐쇄성의 법칙
      • 형태/배경의 법칙
      • 연속의 법칙
      • 시각화에 대한 게슈탈트 법칙의 영향
    • 지각의 한계
      • 좌표선과 기준선이 필요한 이유: 베버의 법칙
      • 왜곡 인지하기: 스티븐스의 멱함수 법칙
      • 맥락과 착시
      • 시각화에 대한 지각의 한계가 미치는 영향
    • 요약

  • 3장. 시각적 지각 너머
    • 사회적 함축성
    • 규칙 깨기
      • 공유지의 비극
      • 색 상징주의
      • 시간의 표현
      • 축 포개기
      • 나를 생각하게 하지 마세요!
    • 활용 능력과 경험
      • 그래픽 활용 능력
      • 주제와의 친밀도
      • 정보의 불균형
    • 조직적 맥락
      • 경영층의 잘못된 메시지
      • 인상관리
    • 요약

  • 4장. 데이터 준비
    • 데이터로 인한 문제들
      • 콘텐츠 없는 구조
      • 구조 없는 콘텐츠
    • ‘구조화가 잘 된 데이터’의 의미는 무엇인가?
      • 도움: 피벗 테이블
    • 데이터 추출
      • PDF 전염병
      • 엑셀로 내보낼 수 있나요?
    • 데이터 정제
    • 데이터 변형
    • 데이터 테이블 로딩
    • 엑셀에서의 데이터 관리
      • 워크북 구성하기
      • 엑셀 밖의 링크
      • 수식
      • 상품과 분석의 사이클
    • 요약

  • 5장. 데이터 시각화
    • 패턴부터 관측치까지
      • 형태 시각화
      • 점 시각화
      • 이상치 시각화
      • 데이터 시각화 작업
    • 지식의 형성
      • 데이터
      • 정보
      • 지식
      • 지혜
    • 데이터 시각화의 정의
    • 언어, 스토리, 배경
    • 그래픽 활용 능력
    • 그래픽 풍경 모드
      • 프로파일링
      • 대시보드
      • 인포그래픽스
    • 지식의 교차로
      • 통계
      • 디자인
      • 애플리케이션
      • 콘텐츠와 문맥
    • 엑셀에서의 데이터 시각화
      • 장점
      • 단점
      • 보기 흉함
      • 엑셀 차트 라이브러리를 넘어
      • 엑셀 차트를 만들지 말라
    • 요약

  • 6장. 데이터 발견, 분석, 그리고 대화
    • 어디서부터 시작하지?
      • 시각적 정보-탐색 만트라
      • 포커스 플러스 컨텍스트
    • 질문하기
      • 질문의 분류
    • 데이터의 선택과 수집
    • 패턴 검색
    • 우선 순위 설정
    • 결과 리포트
      • 설명
      • 인간의 차원
      • 디자인
    • 프로젝트: 월별 출생
      • 문제의 정의
      • 데이터 수집
      • 데이터 가용성 평가
      • 데이터 품질 평가
      • 데이터 조정
      • 데이터 탐색
      • 계절성의 유입
      • 분석 결과 커뮤니케이션
    • 요약

  • 7장. 차트 선택 방법
    • 작업 중심의 차트 분류
    • 관중 프로파일
    • 시각화의 공유
      • 스크린과 프로젝터
      • 스마트폰과 수직 디스플레이
      • PDF 파일
      • 엑셀 파일
      • 온라인 공유
    • 요약

  • 8장. 질서의 개념
    • 막대 차트
      • 수직 막대와 수평 막대
      • 색 코딩
      • 순서화
      • 차트 크기
      • 눈금의 파괴
      • 눈금의 파괴를 피하기 위한 측정법 변경
      • 진화와 변화
      • 특별한 막대 차트: 인구 피라미드
    • 점 도표
    • 기울기 차트
    • 스트립 도표
    • 속도계
    • 총알 차트
    • 경고
    • 요약

  • 9장. 전체의 부분들: 구성 차트
    • 구성이란 무엇인가?
      • 구성 혹은 비교?
    • 파이 차트
      • 비평
      • 손실 관리
    • 도넛 차트
      • 다단계 파이 차트 유형의 도넛 차트
    • 실제 계층형 차트: 썬 버스트 차트와 트리맵
    • 스택 막대 차트
    • 파레토 차트
    • 요약

  • 10장. 이산 데이터
    • 데이터
    • 분포
      • 모든 것을 보여주기: 투명도와 지터링
      • 느낌의 수량화
      • 평균과 표준편차
      • 중앙값과 사분범위
      • 이상치
    • 상자수염 도표
      • z-score
    • 파레토 차트에 관한 재논의
    • 엑셀 지도
    • 히스토그램
      • 빈 개수와 너비
      • 히스토그램과 막대 차트
    • 누적 빈도분포
    • 요약

  • 11장. 시간에 따른 변화
    • 흐름에 집중하기: 선 차트
      • 눈금과 가로세로 비율
    • 관계에 집중하기: 연결된 산점도
    • 갑작스러운 변화: 계단 차트
    • 계절성: 순환 도표
    • 스파크라인
    • 애니메이션
    • 요약

  • 12장. 관계
    • 관계에 대한 이해
      • 곡선 적합
    • 산점도
      • 산점도 디자인
      • 군집과 그룹화
      • 복수의 시리즈와 부분집합
      • 프로파일
    • 버블 차트
    • 요약

  • 13장. 프로파일링
    • 해결책의 필요성
    • 패널 차트
    • 여러 개의 시리즈를 가진 막대 차트
    • 수평 차트
    • 재조정 행렬
    • 스몰 멀티플
    • 엑셀로 프로파일링하기
    • 요약

  • 14장. 효율성을 위한 디자인
    • 미학 관점
      • 잘못된 모델
      • 디자인 연속체
    • 도구는 중립이 아니다: 기본 설정
    • 이성과 감성
      • A.I.D.A
      • 이성은 감성을 따르는가?
      • 감성과 효율성
      • 오캄의 면도날
    • 차트 구성요소 디자인하기
      • 가상의 3차원
      • 질감
      • 제목
      • 서체
      • 주석
      • 격자선
      • 클립아트
      • 두 번째 축
      • 범례
      • 배경
    • 데이터 순서화하기
    • 시리즈의 개수
      • 차트 유형
      • 그룹화
      • 기타 범주
      • 맥락
      • 스몰 멀티플
    • 차트로 하는 거짓말과 속임수
      • 데이터, 인지, 그리고 지각
      • 차이 과장하기
      • 시계열 왜곡하기
      • 종횡비
      • 점의 생략
      • 변화에 대한 변동의 실수
      • 이중축
      • 가상의 3차원
      • 맥락
      • 모든 것이 진행될 때
    • 요약

  • 15장. 아름다움을 넘어서
    • 색의 수량화
      • RGB 모델
      • HSL 모델
    • 자극 강도
    • 색의 기능적 작업
      • 범주화
      • 그룹화
      • 강조
      • 연속성
      • 분기
      • 경고
    • 색 상징주의
    • 회색의 역할
    • 색 준비
    • 색의 조화
      • 일반적인 원리
      • 고전적인 규칙
      • 보색
      • 보색의 분리
      • 3색의 조화
      • 아날로그 색
      • 사각형
      • 따뜻한 색과 차가운 색
    • 색 팔레트의 자원
      • 엑셀
      • 엑셀 이외의 것
      • 색맹
    • 요약

  • 16장. 결론
    • 이것은 모두 실용주의에 관한 것이며, 미적인 것이 아니다.
    • 옛날 방식에 안녕을
    • 자신의 데이터 시각화 모델을 찾기
    • 비즈니스 시각화에서는 열심히 하는 것만이 언제나 최고의 작업은 아니다
    • 조직의 활용능력
    • 이성과 감성
    • 제약으로 연극하기
    • 도구들

관련 블로그 글

비즈니스 환경에서 잘된 데이터 시각화란
바야흐로 빅데이터의 시대다. 무수히 많은 데이터가 쏟아져 나오는 상황에서, 누구보다 많은 데이터를 확보하는 것이 경쟁력을 갖추는 데 핵심이다. 많으면 많을수록 좋은 데이터를 충분히 확보했다. 그다음은? 데이터를 더 좋은 데이터로 바꾸지 않고서는 아무리 많은 데이터를 갖고 있더라도 비즈니스 환경에서 살아남기 힘들다.

No data point is an island, Entire of itself,
Every data point is a piece of the continent, A part of the pattern.
어떤 데이터도 그 자체로 온전한 섬이 아니다. 
모든 데이터는 대륙의 한 조각, 패턴의 한 부분일 뿐이다.



시인 존 돈(John Donne)은 그 누구도 섬이 아니라고(No man is an island) 했지만, 그 어떤 데이터 역시 섬이 아니다. 데이터가 가진 맥락을 이해하여 연결된 데이터가 만들어내는 의미를 효과적으로 전달해야만 내가 가진 데이터가 ‘더 좋은 데이터’로써 가치를 가질 수 있는 것이다. 그 길목에 ‘데이터 시각화’가 있다.

효과적인 데이터 시각화란 눈으로 보기에 훌륭해 보이는 것이라고 생각할 수 있다. 그래픽 디자이너의 화려한 작품처럼 당신의 저널, 책, 블로그와 SNS를 근사하게 만들어줄 장식을 꿈꾸기도 할 것이다. 하지만 데이터 시각화에 첫발을 들여놓았다면 이 달콤한 함정에 빠져선 안 된다. 비즈니스에서 데이터 시각화의 목적은 예쁜 차트를 만드는 게 아니라 효과적인 차트를 만드는 것이다.

비즈니스 환경에서 잘된 데이터 시각화는 기본적으로 데이터 시각화의 원칙과 모범 사례를 준수한 시각화다. 무엇보다 당신이 열심히 분석해놓은 유용한 정보를 잘못된 시각화로써 놓쳐버리지 않고 상대방에게 전달하는 것이 관건이다. 원칙을 지킨 다음에는 당신이 가진 미적 감각의 크기만큼 아름다움을 얼마든지 첨가해도 좋다.

 

『데이터 시각화 원리』는 대중을 위한 데이터 시각화 책이다. 학부생들, 사회 초년생들도 함께 할 수 있는 데이터 시각화 도구로 당신의 머릿속에 떠오르는 도구는 무엇인가? 바로 엑셀이다. 조직적 맥락에서 모두가 쉽게 접근할 수 있는 유일한 도구며, 시각화 이론의 기초를 다지기 위해 가장 좋은 도구라고 말할 수 있다. 데이터 시각화 입문자인 당신이 매일 규칙적인 시각화 습관을 다지고 싶다면 이 책을 만나보는 것은 어떨까?

CC

크리에이티브 커먼즈 라이센스 이 저작물은 크리에이티브 커먼즈 코리아 저작자표시 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안