Top

데이터 시각화 설계와 활용 [데이터에 내재된 인사이트 발견과 표현 방법]

  • 원서명Data Visualization: a successful design process (ISBN 9781849693462)
  • 지은이앤디 커크(Andy Kirk)
  • 옮긴이서하연
  • ISBN : 9788960777750
  • 22,000원
  • 2015년 10월 20일 펴냄
  • 페이퍼백 | 232쪽 | 188*235mm
  • 시리즈 : acorn+PACKT, 데이터 과학

책 소개

요약

이 책은 데이터 시각화 작업을 시도하는 모든 사람을 위한 프레임워크를 제시한다. 데이터 시각화를 만드는 전 과정을 단계별로 구분하고, 각 단계별로 어떤 결정을 내려야 하고 주의할 점은 무엇인지를 구조적인 방법론을 통해 점검할 수 있게 한다. 특히, 데이터 시각화가 예술과 과학의 교차점임을 강조하고, 시각화 디자이너가 갖추어야 할 전산학, 수학, 통계학, 인지과학, 시지각에 대한 연구 등 시각화의 저변에 깔린 다양한 형태의 과학 분야에 대한 이론적 접근과 풍부한 사례를 제시한다. 또한 시각화 작업에서 쓰이는 다양한 시각화 차트를 예시와 함께 제공하고 있으며, 유용한 소프트웨어와 프로그래밍 환경에 대한 개요와 참조 사이트, 최근 동향 등이 수록되어 있다.

이 책에서 다루는 내용

■ 규모나 복잡함에 관계없이 우아하고 강렬한 시각화 솔루션을 만드는 가장 효과적이고 효율적인 방식
■ 언제, 어떤 결정들을 내려야 할지 디자인 과정에서 결정해야 하는 사항들에 대해 가이드를 제공하는 디자인 방법론
■ 시각화 디자인의 목적을 수립하고, 디자인 작업에 영향을 미치는 핵심 요소를 파악하기 위한 전처리 작업의 중요성
■ 데이터를 이해하고 데이터의 물리적인 특성에 익숙해지는 방법과 잠재적인 스토리를 찾고 편집 방향을 잡는 과정에서 데이터를 활용하는 방법
■ 데이터 시각화 디자인에 대한 구조적 접근, 다양한 시각화 차트 종류 설명 및 예시
■ 시각화 작업에 쓰이는 다양한 도구에 대한 설명과 이후 작업에서 참고할 수 있는 자료들

이 책의 대상 독자

시각적인 데이터 분석과 커뮤니케이션에 책임이나 흥미가 있거나, 이를 혁신적이고 효과적인 방법으로 시도하고자 하는 누구에게나 유용하다.

이 책의 구성

1장, ‘데이터 시각화의 맥락’에서는 데이터 시각화라는 주제와 가치, 최근 동향을 소개한다. 이 장에서는 데이터 시각화 방법론과 효율적이고 효과적인 디자인을 만들어내기 위해 단계별로 필요한 방안을 소개하고, 선택 범위 중 적합한 것을 찾을 때 유용하게 참고할 수 있는 기초 설계 목표에 대한 토의로 마무리한다.

2장, ‘프로젝트의 목표 설정 및 핵심 요소 확인’에서는 시각화의 목적(시각화가 필요한 이유는 무엇이며 의도하는 효과는 무엇인가?)을 파악하는 작업으로 방법론의 첫 단계를 시작한다. 이어서 가급적 조기에 디자인 의사결정의 형태를 잡기 위해 시각화의 기능과 분위기를 결정하는 과정을 좀 더 자세히 살펴볼 것이다. 범위 결정 단계를 마무리하기 위해 프로젝트에 영향을 미치는 핵심 요인을 정의하고 효과를 측정할 것이다. 효과적 시각화 솔루션을 만들기 위해 필요한 기술, 지식, 일반적 능력에 특히 관심을 기울일 것이다.

3장, ‘편집 방향 설정, 데이터 파악’에서는 우리가 사용하는 데이터에 얽힌 문제들과 데이터로부터 찾아내고 표현하고자 하는 이야기들을 살펴볼 것이다. 무엇을 말하고자 하는지를 보여주기 위한 편집의 방향성이 얼마나 중요한지 살펴보고, 데이터 시각화 프로젝트에서 시간을 가장 많이 소모하는 작업인 데이터 준비 과정을 확인할 것이다. 이 장에서의 배운 내용을 견고하게 하기 위해, 데이터로부터 이야기를 발견하고 표현하는 과정에서 시각화 방법론을 적용한 예제들을 살펴볼 것이다.

4장, ‘시각화 디자인 옵션 결정’은 데이터 준비 작업 및 범위 결정 단계 완료 후 효과적 시각화 솔루션을 만드는 과정에 수반되는 디자인 이슈로 우리를 인도한다. 이는 디자인 옵션을 정의하고 무엇을 선택해야 할지를 파악한다는 점에서 이 책의 중심 내용이라고 볼 수도 있다. 이 단계를 통해 시각화 디자인의 구조를 치밀하게 분석하고, 우리의 도전을 데이터의 묘사와 표현이라는 상호 보완적인 두 관점으로 나눌 것이다.

5장, ‘데이터 시각화 방법론 분류체계’는 커뮤니케이션을 목적으로 데이터 시각화 방법론의 분류를 살펴본다는 점에서 앞 장과 관계가 있다. 이 장에서는 가장 많이 사용되는 차트 유형과 그래픽 방법론을 조직화해서 정리했고, 이를 활용해 각자의 프로젝트에 적용할 수 있는 아이디어 모음집을 만들 수 있을 것이다.

6장, ‘시각화 솔루션 구축 및 평가’에서는 시각화 디자인 구축 과정 중 마지막 단계에 집중한다. 이 장에서는 일반적이고 유용한 소프트웨어와 프로그래밍 환경을 개괄적으로 설명한다. 또한 시각화 디자인의 테스트, 완료, 출시 시점에 고려해야 할 주요 사안과 프로젝트의 출시를 평가하는 데 관계된 중요 항목을 제시한다. 마지막으로 데이터 시각화 디자인 기술을 끊임없이 배우고 개발하고 연마하는 데 도움이 되는 몇 가지 좋은 방법을 공유하면서 마무리한다.

저자/역자 소개

지은이의 말

예술, 과학, 수학, 테크놀로지, 그 외 다양한 흥미로운 재료로 만든 요리라고 할 수 있는 데이터 시각화의 세계에 온 것을 환영한다. 얼마 전까지만 해도 데이터로 그래프를 작성하거나 차트를 만드는 것은 전문가의 영역으로 생각되었고, 통계학자나 공학자, 과학자들이 하는 대단한 일로 여겨졌다.

최근에는 데이터 분석과 시각화가 점차 주류가 되고 있지만 여전히 이런 종류의 일을 잘 할 수 있도록 교육을 받은 사람은 소수에 불과하다. 취향이나 본능이 신뢰할 만한 가이드의 역할을 할 수 있지만, 우리는 다양한 종류의 도전을 직면하고 그에 따라 선택들을 해야 하고 이 과정을 효과적이고 효율적으로 헤쳐나가기에 취향이나 본능만으로는 충분치 않다.

이 책은 데이터 시각화 작업에 좀 더 나은 노하우를 적용하고 작업에 자신감을 가질 수 있도록 돕는 유용한 가이드며, 데이터를 이해하고 주제를 찾고 데이터로부터 이야기를 찾아내는 과정에서 필요한 지식과 기술, 자원을 갖출 수 있게 하는 잘 정리된 방법론을 담고 있다.

이 책은 시각화 프로젝트 과정에서 고려해야 할 모든 것을 단계적으로 알려주고, 언제 그것들을 검토해야 할지, 무슨 일을 할지를 결정하는 방법 등을 포함한 이해하기 쉬운 프레임워크를 제공한다.

이 책을 읽고 나면 최고의 결과물을 만들기 위해 필요한 모든 전술과 가이드를 확보했다는 자신감을 갖고, 프로젝트의 종류(규모나 복잡도, 협업 여부, 일회성 혹은 정기적)에 관계없이 확신을 갖고 착수하게 될 것이다.

지은이 소개

앤디 커크(Andy Kirk)

프리랜서 데이터 시각화 컨설턴트이자 강사이며, 유명한 데이터 시각화 블로그(visualisingdata.com)를 운영하고 있다.
랭캐스터 대학에서 경영과학(OR, Operational Research) 학사 학위를 받은 후, 영국의 수많은 대기업을 대상으로 비즈니스 분석 및 경영 정보 관련 업무로 10년 이상을 보냈다.
2006년 후반, 우연히 데이터 시각화에 대한 깨달음을 얻어 직업을 바꾸고, 바로 리드 대학의 석사 과정을 우수한 성적으로 마치는 등 이 일에 열정적으로 임하게 된다.
2010년 2월, 대중에게 데이터 시각화라는 유망한 분야에 대해 기술, 리소스, 애플리케이션의 동향과 우수 사례를 전달하고 영감을 준다는 목표를 가지고 블로그를 열었다. 디자인 컨설팅과 교육 과정은 이러한 포부를 더욱 확장한 것이며, 다양한 형태와 크기, 모든 산업 분야의 조직이 데이터의 영향력을 극대화할 수 있도록 데이터 분석과 커뮤니케이션 업무를 돕고 있다.
이 책은 다년간 얻은 유용한 전문 지식을 담고 있으며, 독자들이 데이터 시각화 디자인이라는 다소 어렵지만 흥미로운 세계에서 성공적으로 자리잡는 데 유용한 안내서가 될 것이다.

옮긴이의 말

데이터 분석 프로젝트 중 가장 어려운 작업은 분석 결과를 사용자(고객)에게 설명하는 일인 것 같다. 적절한 데이터를 확보하는 일이라든가, 어려운 통계 기법 혹은 알고리즘을 적용하는 일이 아니라, 분석이 다 끝난 후 찾아낸 인사이트를 전달하는 일이 가장 어렵다는 주장이 쉽게 납득되지 않을 수도 있다. 그러나 아무리 고되게 분석을 해도 그 결과가 사용자에게 온전히 받아들여지지 않으면, 분석 결과는 숫자가 잔뜩 적힌 서류 뭉치에 불과하고 애써 발굴한 인사이트는 빛날 기회를 잃는다.

저자는 이런 상황에 대한 솔루션으로 데이터 시각화를 제시한다. “데이터 시각화를 통해, 데이터를 그저 바라보기만 했던 사람들이 데이터를 이해하게 된다.”라는 명쾌한 표현으로 데이터 시각화의 역할을 규정할 뿐 아니라, 데이터를 처음 탐색하는 작업부터 최종 시각화 작품을 만들어낼 때까지 거쳐야 하는 각 단계를 현장감 있는 목소리로 상세하게 설명한다.

이 책을 읽다 보면 드라마 《미생(未生)》의 캐릭터인 철강팀 강대리가 떠오른다. 뭔가 뻔하고 평이한 말을 다소 딱딱하게 나열한 것 같다는 인상을 주기 때문이다. 첫 소감은 이렇다. ‘누가 그런 것도 모를까 봐?’ 그러나 문장을 되새기면서 ‘저 말을 왜 했을까’ 자꾸 생각하다 보면 저자가 오랜 경험을 통해 터득한 노하우가 엑기스처럼 추출되어 가장 쉬운 문장으로 표현되어 있다는 사실을 알게 된다. 경험 많은 선배가 보여주는 숙련되고 군더더기 없는 일 처리 방식처럼.

시각화를 전공하지 않은 사람이라면 누구나 가장 손이 잘 닿는 곳에 꽂아두고 시간이 날 때마다 순서에 상관없이 뒤적거리는 것처럼 보기를 권장한다. 동일한 페이지를 여러 번 읽어도 관계없다. 오히려 그렇게 되기를 바란다. 아는 만큼 보이는 것이 아니라, 곱씹고 되새기는 만큼 보이는 책이기 때문이다.

모두를 위한 데이터 시각화의 입문서로 오래 남을 의미 있는 책을 번역 출간하는 작업에 참여하게 되어 기쁘다.

옮긴이 소개

서하연

KAIST에서 전산학을 전공하고, 경영학석사(MBA)를 취득했다. 외국계 컨설팅 회사에서 경영 분석 및 전략 수립 프로젝트를 다년간 경험하면서, 데이터를 활용해 비즈니스 성과를 내는 법을 배웠다. 2012년 모바일 데이터 분석 서비스인 파이브락스의 기능 설계 및 화면 디자인을 총괄하면서 데이터 시각화에 대한 실전 경험을 쌓았고, 현재는 데이터 분석 회사인 알렉스앤컴퍼니(Alex & Company)에서 데이터와 관련해 어려움을 겪고 있는 다양한 조직을 돕는 일을 하고 있다.

목차

목차
  • 1 데이터 시각화의 맥락
    • 디지털 시대 개척
    • 발견을 위한 도구로서의 시각화
    • 시각화 지식의 기반
    • 데이터 시각화 정의
    • 대중을 위한 시각화 기법
    • 데이터 시각화 방법론
    • 시각 디자인의 목표
      • 형식과 기능을 모두 고려 할 것
      • 모든 일의 필요성을 증명하라
      • 직관적 디자인을 통해 접근성 확보
      • 사용자를 속이지 말자
    • 정리

  • 2 프로젝트의 목표 설정 및 핵심 요소 확인
    • 프로젝트의 목적 명확화
      • 존재의 이유
      • 의도된 효과
    • 의도 설정: 시각화의 기능적 측면
      • 설명을 위한 용도일 때
      • 탐색을 위한 용도일 때
      • 표현을 위한 용도일 때
    • 의도 설정: 시각화의 분위기
      • 정확하고 분석적으로
      • 감정적이고 추상적으로
    • 시각화 프로젝트를 둘러싼 핵심 요소들
    • 데이터 시각 디자인 분야의 8개 모자 모델
      • 창안자
      • 데이터 과학자
      • 기자
      • 컴퓨터 과학자
      • 디자이너
      • 인지 과학자
      • 전달자
      • 프로젝트 매니저
    • 정리

  • 3 편집 방향 설정, 데이터 파악
    • 편집 방향의 중요성
    • 전처리 및 데이터 파악
    • 편집 방향 재정비
    • 스토리를 찾기 위해 시각적 분석 활용
    • 스토리 발견과 스토리 전달
    • 정리

  • 4 시각화 디자인 옵션 결정
    • 데이터 시각화 디자인에서 선택의 중요성
    • 몇 가지 유용한 팁
    • 시각화 내부 구조: 데이터 형상화
      • 적절한 시각화 방법 선택
      • 데이터의 물리적 성질 고려
      • 해석 상의 정확도 결정
      • 적절한 디자인 메타포 생성
      • 최종 솔루션 선택
    • 시각화 내부 구조: 데이터 표현
      • 색상의 사용
      • 상호작용 생성
      • 주석
      • 배치
    • 정리

  • 5 데이터 시각화 방법론 분류체계
    • 데이터 시각화 방법론
    • 적합한 차트 유형 선택
      • 카테고리 비교
        • 도트 플롯
        • 바 차트
        • 플로팅 바 차트
        • 픽셀화 바 차트
        • 히스토그램
        • 기울기 그래프
        • 방사형 차트
        • 글리프 차트
        • 생키 다이어그램
        • 영역 크기 차트
        • 스몰 멀티플스
        • 단어 구름
      • 계층구조 및 부분과 전체의 관계 확인
        • 파이 차트
        • 누적 바 차트
        • 사각 파이
        • 트리 맵
        • 서클 패킹 다이어그램
        • 계층화 버블
        • 계층화 트리
      • 시간에 따른 변화 보기
        • 라인 차트
        • 스파크라인
        • 영역 차트
        • 호라이즌 차트
        • 누적 영역 차트
        • 스트림 그래프
        • 양초 차트
        • 바코드 차트
        • 플로우 맵
      • 연결과 관계 플로팅
        • 산점도
        • 버블 플롯
        • 산점도 행렬
        • 히트맵
        • 병렬 세트
        • 방사형 네트워크
        • 네트워크 다이어그램
      • 지리-공간 데이터 매핑
        • 등치 지역도
        • 도트 플롯맵
        • 버블 플롯맵
        • 등치선도
        • 입자 흐름 지도
        • 카토그램
        • 돌링 카토그램
        • 네트워크 연결 지도
    • 정리

  • 6 시각화 솔루션 구축 및 평가
    • 시각화 작업의 기술적인 측면
      • 시각화 소프트웨어, 애플리케이션과 프로그램
      • 차트와 통계를 위한 분석 도구
      • 프로그래밍 환경
      • 지도를 위한 도구들
        • 다른 특별한 도구
    • 시각화 디자인 구축 프로세스
    • 마지막 단계
    • 출시 후 검증
    • 역량 개발
      • 연습, 연습, 연습!
      • 다른 사람들의 작품 평가
      • 결과를 공개하고 공유
      • 본격적인 학습
    • 정리

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안