Top

파이썬 데이터 시각화 마스터 [파이썬 패키지를 사용해 효과적으로 정보를 전달하는 매력적인 플롯 만들기]

  • 원서명Mastering Python Data Visualization (ISBN 9781783988327)
  • 지은이키르시 라만(Kirthi Raman)
  • 옮긴이정기연, 안진규, 허혜정
  • ISBN : 9788960776852
  • 35,000원
  • 2017년 05월 11일 펴냄
  • 페이퍼백 | 408쪽 | 188*235mm
  • 시리즈 : acorn+PACKT

책 소개

본문에 쓰인 컬러 이미지는 여기에서 내려 받으세요.

요약

데이터 시각화의 개념부터 시작해, Python 패키지 설치 방법, 개발 환경을 소개하며 파이썬 데이터 시각화를 위해 필요한 준비 과정을 살펴본다. 파이썬 데이터 시각화에 대한 기본 이해를 마치면, 본격적으로 시각화가 많이 사용되는 주요 분야의 예제를 학습한다. 인터랙티브 플로팅 도구를 사용해 계산 물리학과 응용 수학 예제를 다루며, 통계/머신 러닝 모델을 사용해 주식 시세, 회귀 분석, 몬테카를로(Monte Carlo) 알고리즘 등 금융 공학 예제를 다룬다. 그리고 소셜 네트워크, 유전학 네트워크 모델 분석을 알아본다. 마지막으로는 Julia, DS.js와 같은 툴과 비교하며 고급 시각화 내용까지 다루어, 기본 개념부터 실제 응용, 고급 내용까지 안내하는 이 책을 통해 파이썬 데이터 시각화를 마스터할 수 있다.

이 책에서 다루는 내용

■ 데이터 수집, 정리, 액세스 및 시각적 프레임워크에의 데이터 매핑
■ 적용 가능한 시각화 방법 이해 및 데이터 시각화를 위한 모범 사례 학습
■ 독자 중심의 서술, 저자 중심의 서술 및 인식의 원칙
■ 파이썬이 MATLAB과 같은 수치 계산을 위한 효과적인 도구인 이유 및 파이썬과 함께 제공되는 흥미로운 데이터 구조 탐험
■ 파이썬을 재무 및 통계 계산에 매우 유용하게 사용하기 위한 시각화 기법
■ Julia와 D3.js 등 JavaScript 기반 프레임워크를 사용하는 다른 시각화 접근법과 파이썬 비교
■ 분산 환경에서 결과를 효율적으로 생성하기 위해 Hive와 같은 NoSQL과 함께 파이썬을 사용하는 방법

이 책의 대상 독자

파이썬이나 데이터 시각화를 다룬 책은 매우 많다. 그러나 파이썬을 알고 있으면서 데이터 시각화를 배우고 싶은 사람에게 추천해줄 만한 책은 거의 없고, 코드를 더 쉽게 동작하고 재사용할 수 있게 만들어줄 수 있는 틈새 기술에 대해서 논의하는 책은 더욱 찾아보기 어렵다. 여러분이 파이썬 프로그래밍을 알고 있지만 더 많은 것을 배우기를 원한다면, 이 책이 분석적 결과를 얻는 방법과 놀라운 시각적 결과를 생성하는 방법을 알려줄 것이다.

이 책의 구성

1장, ‘데이터 시각화 개념 잡기’에서는 데이터 시각화가 실제로 ‘지식 추론을 위한 정보의 시각화’임을 자세히 설명한다. 이 장에서는 데이터 및 정보로부터 지식으로의 변환과, 의미 있는 표현들이(로그, 색상 맵, 산점도, 상관 관계 등) 어떻게 지식을 더 쉽게 잘 이해할 수 있게 하는지 설명하는 프레임워크를 살펴본다.
2장, ‘데이터 분석과 시각화’에서는 시각화의 중요성을 알아보고, 선택할 수 있는 도구의 여러 옵션들을 포함해 시각화 과정에서의 몇 가지 단계를 보여준다. 시각화 도구들은 예전부터 있었고, 우리는 지속적으로 그 도구들에 노출돼 왔다. 예를 들어 어린 아이들조차도 막대 그래프를 그릴 줄 안다. 인터랙티브 시각화는 많은 강점을 지니며, 이 장에서는 그 강점들을 예제와 함께 설명한다.
3장, ‘파이썬 IDE로 시작하기’에서는 각 파이썬 라이브러리를 개별 설치하는 것에 대한 걱정 없이 어떻게 컨티넘 애널리틱스(Continuum Analytics)의 아나콘다(Anaconda)를 사용할 수 있는지 설명할 것이다. 아나콘다는 간소한 패키지를 가지고 있고 IPython과 다른 라이브러리들이 함께 실행되기 쉬운 개발 도구를 가지고 있다.
4장, ‘수치 연산 및 인터랙티브 플로팅’에서는 인터랙티브 플로팅(plotting) 도구를 계산 물리학과 응용 수학 예제와 함께 다룰 것이다. 몇 가지 눈에 띄는 예제들은 SciPy를 사용한 보간(interpolation) 도구, 근사, 군집(clustering), 표본 추출(sampling), 상관(correlation)과 볼록 최적화(convex optimization)다.
5장, ‘금융과 통계 모델’에서는 파이썬의 흥미로운 활용 사례들을 만들어 내는 많은 수치와 그래픽 도구들을 사용하는 금융 공학에 대해 살펴본다. 또한 주식 시세, 회귀분석, 몬테카를로(Monte Carlo) 알고리즘, 그리고 예제들을 사용한 시뮬레이션 도구들을 알아본다.
6장, ‘통계와 머신러닝’에서는 numpy와 scipy, matplotlib, scikit-learn을 사용해 선형, 비선형 회귀와 같은 통계 도구들과 군집, 분류 도구들을 살펴본다.
7장, ‘생물정보학, 유전학, 네트워크 모델’에서는 소셜 네트워크와 일상생활에서의 방향성 그래프 예와 같은 흥미로운 예제들과 이런 문제들에 적합한 데이터 구조, 네트워크 분석에 대해 살펴본다. 이 장에서는 graph-tool, NetworkX, matplotlib, scipy, numpy 같은 특정 라이브러리들을 사용한다.
8장, ‘고급 시각화’에서는 시뮬레이션 도구들과 여러 시각화 도구들을 보여주기 위한 신호 처리 예제들을 알아본다. 또한 Julia, DS.js와 같은 다른 고급 도구와 비교해 본다.
부록, ‘시각화 출발하기와 탐색하기’에서는 conda에 대한 개괄적 설명과 파이썬 라이브러리들의 리스트를 보여준다.

저자/역자 소개

지은이의 말

데이터 시각화는 정보를 명확하게 제공하며 정보를 보는 사람이 데이터를 질적으로 이해할 수 있게 도와준다. “그림 한 장이 천 마디 단어만큼의 가치가 있다”는 잘 알려진 표현은 “한 장의 그림은 단어들의 방대한 모음일 뿐 아니라 우리에게 이야기를 들려준다”고 바꿔 말할 수 있을 것이다. 그러므로 시각화는 보는 이가 빠르게 개념을 이해할 수 있게 돕는 매우 귀중한 도구다. 그러나 데이터 시각화는 과하면 오히려 역효과를 낼 수 있기 때문에 기술이라기보다는 예술에 가깝다.
우리는 현재 현대 사회에서 성공의 열쇠가 될 많은 통찰을 내포한 과다한 데이터들을 마주하고 있다. 데이터를 발견하고, 정제해 시각화의 올바른 도구로 사용하는 것은 매우 중요하다. 이 책은 파이썬 패키지를 사용해 데이터를 시각화하는 여러 가지 방법과 수치 계산, 금융 모델, 통계와 머신 러닝, 유전학과 네트워크에 걸친 매우 다양한 분야에서의 유용한 예제들을 설명할 것이다.

지은이 소개

키르시 라만(Kirthi Raman)

미국 버지니아 맥클레인에 있는 뉴스타(Neustar)에서 현재 수석 데이터 엔지니어로 근무하고 있다. 자바스크립트, 파이썬, R, 자바를 이용해 데이터 시각화 업무를 진행하며 인정받는 엔지니어다. 이전에는 크루션트(Quotient)에서 수석 아키텍트, 데이터 분석가, 정보 검색 전문가로 일했다. 또한 스타트업 회사의 기술 고문과 매니저를 맡고 있다.
이산 수학과 컴퓨터 과학을 몇 년 동안 가르쳤으며, 델리 인도 공대(IIT Delhi)에서 수학과 컴퓨터 과학 학사를, 메릴랜드 대학(University of Maryland)에서 컴퓨터 과학 석사를 수료했다. 데이터 분석과 빅데이터에 대한 백서를 작성하고 있다.

옮긴이의 말

우리 사회는 거대한 데이터 홍수 속에 있다. 그 데이터가 빅데이터인지 스몰 데이터인지에 관계없이, 데이터 속에 담겨 있는 의미 있는 정보를 찾아내 올바른 의사결정으로 빠르게 연결될 수 있게 하는 것이 데이터 시각화의 중요한 역할이다.
데이터 자체만으로 인사이트를 제공하지는 않는다. 이 데이터가 무엇을 의미하는지, 이것이 올바른 표현인지, 올바른 해석인지, 어떻게 활용해야 하는지 등 끊임없이 의문을 갖고 바라봐야 한다. 이 과정에 데이터 시각화가 있다. 따라서 데이터 시각화를 올바르게 이해하는 것은 중요하다.
이 책을 처음 접하고 “데이터 시각화와 관련된 좋은 책을 찾았어요.”라며 들뜬 목소리로 이야기하던 기억이 난다. 우리는 프로그래밍 언어보다는 데이터 시각화 기술에 더 초점을 맞춘 책을 찾고 있었다. 그러한 책을 찾기는 쉽지 않았고, 드디어 찾았다. 이 책은 파이썬 사용법을 자세히 알려주는 책은 아니다. 파이썬 프로그래밍은 알고 있으며, 데이터 시각화 기술을 배우기 원하는 독자에게 매우 유용한 책이다. 데이터 시각화를 위한 기본 지식에서부터 문제 해결을 위한 다양한 방법, 다양한 분야에서의 유용한 예제들을 살펴볼 수 있을 것이다. 이 책이 여러분의 전문 지식을 채워줄 수 있을 것이라고 확신한다.

옮긴이 소개

정기연

경제학과 전자공학을 공부했고, 전자 공학으로 석사 학위를 받았다. 경세제민(經世濟民)의 뜻을 기술로 이뤄 보고자 10여 년간 전자 회사에서 엔지니어로 일하며 기술을 연마해왔다. 최근에는 가치를 만들어 내는 기술의 응용을 고민하며 꿈에 한 걸음 더 가까이 다가가고 있다.

안진규

전자공학과에서 화질 개선과 영상 압축 VLSI로 석사 학위를 이수했다. 전자 회사의 선행 연구소에서 SoC(System on Chip)를 설계하고 있다. 하드웨어 전공이지만, 남의 떡이 커 보여서 여기저기 기웃거리며 더 좋은 엔지니어가 되고자 노력 중이다.

허혜정

컴퓨터 과학으로 학사, 석사 및 박사 학위를 받았다. 주요 연구 분야는 가상 현실, 과학적 시각화, HCI 분야이다. 현재는 전자 회사에서 그래픽스 선행 연구를 하고 있다. 새로운 것을 배우는 것을 좋아하고, 자연을 좋아해 캠핑과 여행을 좋아한다. 이 책의 번역 작업 일부도 캠핑 의자에 앉아서 했다.

목차

목차
  • 1장. 데이터 시각화 개념 잡기
    • 데이터, 정보, 지식, 통찰
      • 데이터
      • 정보
      • 지식
      • 데이터 분석과 통찰
    • 데이터의 변환
      • 데이터, 정보로의 변환
        • 데이터 수집
        • 데이터 전 처리
        • 데이터 처리
        • 데이터 조직화
        • 데이터 셋 받기
      • 정보, 지식으로의 변환
      • 지식, 통찰로의 변환
    • 데이터 시각화의 역사
      • 컴퓨터 이전의 시각화
        • 미나드의 러시아 원정 지도(1812)
        • 런던의 콜레라 전염병(1831-1855)
        • 통계 그래픽(1850-1915)
        • 이후의 데이터 시각화 발전
    • 시각화가 어떻게 의사결정을 돕는가?
      • 시각화는 어느 곳에 적합할까?
      • 데이터 시각화의 현재
        • 좋은 시각화란 무엇인가?
    • 플롯 시각화
      • 막대 그래프와 원 그래프
        • 막대 그래프
        • 원 그래프
      • 상자 그래프
      • 산포도와 버블 차트
        • 산포도
        • 버블 차트
      • KDE 도표
    • 요약

  • 2장. 데이터 분석과 시각화
    • 시각화는 왜 계획이 필요한가?
    • 에볼라 예제
    • 스포츠 예제
      • 시각적으로 결과를 표현하기
    • 데이터를 이용해 즐거운 이야기 만들기
      • 왜 이야기는 중요한가?
      • 독자 중심의 이야기
        • 갭마인더
        • 미국의 주별 유권자 경향
        • 미국 내 사망률
        • 이야기를 위한 몇 가지 다른 예
      • 저자 중심의 이야기
    • 인식 방법과 표현 방법
      • 지각에서의 게슈탈트 법칙
    • 시각화를 위한 좋은 사례들
      • 비교와 순위
      • 상호 연관성
      • 분포
      • 지역 특정 혹은 지리정보
      • 부분에서 전체의 관계
      • 시간 경과에 따른 경향
    • 파이썬을 이용한 시각화 도구
      • 개발 도구
        • Enthought의 Canopy
        • 컨티넘 애널리틱스의 아나콘다
    • 인터랙티브 시각화
      • 이벤트 리스너
        • 레이아웃
        • 원형 레이아웃
        • 방사형 레이아웃
        • 풍선 레이아웃
    • 요약

  • 3장. 파이썬 IDE로 시작하기
    • 파이썬 내장 IDE
      • 파이썬 3.x vs. 파이썬 v2.7
      • 인터랙티브 도구의 종류
        • IPython
        • Plotly
      • 파이썬 IDE의 종류
        • PyCharm
        • PyDev
        • 파이썬 인터랙티브 에디터(IEP)
        • Enthought의 Canopy
        • 컨티넘 애널리틱스의 아나콘다
        • Spyder의 개관
        • conda의 개관
    • 아나콘다의 시각화 그림/도표
      • surface-3D 그림/도표
      • 사각형 지도 플롯
    • 인터랙티브 시각화 패키지들
      • Bokeh
      • VisPy
    • 요약

  • 4장. 수치 연산 및 인터랙티브 플로팅
    • NumPy, SciPy, and MKL 함수들
      • NumPy
        • NumPy 보편 함수
        • 모양과 모양 재편에 대한 조작
        • 보간 예제
        • 벡터화 함수들
        • NumPy 선형 대수 요약
      • SciPy
        • 선형 방정식의 예제
        • 벡터화된 수치 미분
      • MKL 함수
      • 파이썬의 성능
    • 스칼라 선택
    • 분할
      • flat을 사용하는 분할
    • 배열 색인
      • 수치 색인
      • 논리 색인
    • 다른 데이터 구조
      • 스택
      • 튜플
      • 사전
      • 행렬 표현 사전
        • 희소 행렬
        • 희소성 시각화
        • 저장을 위한 사전
      • 트라이
    • matplotlib을 이용한 시각화
      • 워드 클라우드
      • 워드 클라우드 설치
      • 워드 클라우드 입력
        • Web feeds
        • 트윗 글
      • 주식 차트의 플로팅
        • 데이터 획득
    • 스포츠에서의 시각화 예제
    • 요약

  • 5장. 금융과 통계 모델
    • 결정론적 모형
      • 총 수익률
    • 확률론적 모델
      • 몬테카를로 시뮬레이션
        • 몬테카를로 시뮬레이션은 정확히 무엇인가?
        • 몬테카를로 시뮬레이션으로 재고 문제 다루기
        • 농구에서 몬테카를로 시뮬레이션
        • 변동성 그래프
        • 내재 변동성
      • 포트폴리오 평가
      • 시뮬레이션 모델
      • 기하학적 브라운 시뮬레이션
      • 확산 기반 시뮬레이션
    • 임계 모델
      • 셸링의 분리 모델
    • 통계 및 기계 학습의 개요
      • K- 최근접 이웃
      • 일반화 선형 모델
        • 베이즈 선형 회귀
    • 애니메이션 및 인터랙티브 플롯 작성하기
    • 요약

  • 6장. 통계와 머신러닝
    • 분류 방법
    • 선형 회귀의 이해
    • 선형 회귀
    • 의사결정 트리
      • 예제
    • 베이즈 정리
    • 나이브 베이즈 분류기
    • TextBlob을 이용한 나이브 베이즈 분류기
      • TextBlob 설치
      • 말뭉치 다운로드
      • TextBlob을 이용한 나이브 베이즈 분류기
    • 워드 클라우드를 이용해 긍정적인 감정 보기
  • k 근접 이웃
  • 로지스틱 회귀
  • 서포트 벡터 머신
  • 주성분 분석
    • scikit-learn 설치
  • k-평균 군집화
  • 요약

  • 7장. 생물정보학, 유전학, 네크워크 모델
    • 방향성 그래프와 멀티 그래프
      • 그래프 데이터 저장하기
      • 그래프 보여주기
        • igraph
        • NetworkX
        • Graph-tool
    • 그래프의 클러스터링 계수
    • 소셜 네트워크의 분석
    • 평면 그래프 테스트
    • 방향성 비순환 그래프 테스트
    • 최대 플로우와 최소 컷
    • 유전자 프로그래밍 예제
    • 확률 블록 모델
    • 요약

  • 8장. 고급 시각화
    • 컴퓨터 시뮬레이션
      • 파이썬의 랜덤 패키지
        • SciPy의 랜덤 함수
      • 시뮬레이션 예제
      • 신호 처리
      • 애니메이션
      • HTML5를 이용한 시각화 방법
      • Julia는 파이썬과 어떻게 다른가
      • 시각화를 위한 D3.js
      • 대시보드
    • 요약

  • 부록. 시각화 출발하기와 탐색하기
    • conda 둘러보기
    • 아나콘다를 이용한 패키지 설치
    • 패키지 웹 사이트
  • 도서 오류 신고

    도서 오류 신고

    에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

    오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

    (예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안

    정오표

    정오표

    [p.24 : 아래서 4행]

    https://www.packtpub.com/sites/default/files/downloads/AAA
    ->
    https://www.packtpub.com/sites/default/files/downloads/8327OS_Graphics.pdf