파이썬 데이터 시각화 마스터 [파이썬 패키지를 사용해 효과적으로 정보를 전달하는 매력적인 플롯 만들기]
- 원서명Mastering Python Data Visualization (ISBN 9781783988327)
- 지은이키르시 라만(Kirthi Raman)
- 옮긴이정기연, 안진규, 허혜정
- ISBN : 9788960776852
- 35,000원
- 2017년 05월 11일 펴냄 (절판)
- 페이퍼백 | 408쪽 | 188*235mm
- 시리즈 : acorn+PACKT
판매처
- 현재 이 도서는 구매할 수 없습니다.
책 소개
본문에 쓰인 컬러 이미지는 여기에서 내려 받으세요.
요약
데이터 시각화의 개념부터 시작해, Python 패키지 설치 방법, 개발 환경을 소개하며 파이썬 데이터 시각화를 위해 필요한 준비 과정을 살펴본다. 파이썬 데이터 시각화에 대한 기본 이해를 마치면, 본격적으로 시각화가 많이 사용되는 주요 분야의 예제를 학습한다. 인터랙티브 플로팅 도구를 사용해 계산 물리학과 응용 수학 예제를 다루며, 통계/머신 러닝 모델을 사용해 주식 시세, 회귀 분석, 몬테카를로(Monte Carlo) 알고리즘 등 금융 공학 예제를 다룬다. 그리고 소셜 네트워크, 유전학 네트워크 모델 분석을 알아본다. 마지막으로는 Julia, DS.js와 같은 툴과 비교하며 고급 시각화 내용까지 다루어, 기본 개념부터 실제 응용, 고급 내용까지 안내하는 이 책을 통해 파이썬 데이터 시각화를 마스터할 수 있다.
이 책에서 다루는 내용
■ 데이터 수집, 정리, 액세스 및 시각적 프레임워크에의 데이터 매핑
■ 적용 가능한 시각화 방법 이해 및 데이터 시각화를 위한 모범 사례 학습
■ 독자 중심의 서술, 저자 중심의 서술 및 인식의 원칙
■ 파이썬이 MATLAB과 같은 수치 계산을 위한 효과적인 도구인 이유 및 파이썬과 함께 제공되는 흥미로운 데이터 구조 탐험
■ 파이썬을 재무 및 통계 계산에 매우 유용하게 사용하기 위한 시각화 기법
■ Julia와 D3.js 등 JavaScript 기반 프레임워크를 사용하는 다른 시각화 접근법과 파이썬 비교
■ 분산 환경에서 결과를 효율적으로 생성하기 위해 Hive와 같은 NoSQL과 함께 파이썬을 사용하는 방법
이 책의 대상 독자
파이썬이나 데이터 시각화를 다룬 책은 매우 많다. 그러나 파이썬을 알고 있으면서 데이터 시각화를 배우고 싶은 사람에게 추천해줄 만한 책은 거의 없고, 코드를 더 쉽게 동작하고 재사용할 수 있게 만들어줄 수 있는 틈새 기술에 대해서 논의하는 책은 더욱 찾아보기 어렵다. 여러분이 파이썬 프로그래밍을 알고 있지만 더 많은 것을 배우기를 원한다면, 이 책이 분석적 결과를 얻는 방법과 놀라운 시각적 결과를 생성하는 방법을 알려줄 것이다.
이 책의 구성
1장, ‘데이터 시각화 개념 잡기’에서는 데이터 시각화가 실제로 ‘지식 추론을 위한 정보의 시각화’임을 자세히 설명한다. 이 장에서는 데이터 및 정보로부터 지식으로의 변환과, 의미 있는 표현들이(로그, 색상 맵, 산점도, 상관 관계 등) 어떻게 지식을 더 쉽게 잘 이해할 수 있게 하는지 설명하는 프레임워크를 살펴본다.
2장, ‘데이터 분석과 시각화’에서는 시각화의 중요성을 알아보고, 선택할 수 있는 도구의 여러 옵션들을 포함해 시각화 과정에서의 몇 가지 단계를 보여준다. 시각화 도구들은 예전부터 있었고, 우리는 지속적으로 그 도구들에 노출돼 왔다. 예를 들어 어린 아이들조차도 막대 그래프를 그릴 줄 안다. 인터랙티브 시각화는 많은 강점을 지니며, 이 장에서는 그 강점들을 예제와 함께 설명한다.
3장, ‘파이썬 IDE로 시작하기’에서는 각 파이썬 라이브러리를 개별 설치하는 것에 대한 걱정 없이 어떻게 컨티넘 애널리틱스(Continuum Analytics)의 아나콘다(Anaconda)를 사용할 수 있는지 설명할 것이다. 아나콘다는 간소한 패키지를 가지고 있고 IPython과 다른 라이브러리들이 함께 실행되기 쉬운 개발 도구를 가지고 있다.
4장, ‘수치 연산 및 인터랙티브 플로팅’에서는 인터랙티브 플로팅(plotting) 도구를 계산 물리학과 응용 수학 예제와 함께 다룰 것이다. 몇 가지 눈에 띄는 예제들은 SciPy를 사용한 보간(interpolation) 도구, 근사, 군집(clustering), 표본 추출(sampling), 상관(correlation)과 볼록 최적화(convex optimization)다.
5장, ‘금융과 통계 모델’에서는 파이썬의 흥미로운 활용 사례들을 만들어 내는 많은 수치와 그래픽 도구들을 사용하는 금융 공학에 대해 살펴본다. 또한 주식 시세, 회귀분석, 몬테카를로(Monte Carlo) 알고리즘, 그리고 예제들을 사용한 시뮬레이션 도구들을 알아본다.
6장, ‘통계와 머신러닝’에서는 numpy와 scipy, matplotlib, scikit-learn을 사용해 선형, 비선형 회귀와 같은 통계 도구들과 군집, 분류 도구들을 살펴본다.
7장, ‘생물정보학, 유전학, 네트워크 모델’에서는 소셜 네트워크와 일상생활에서의 방향성 그래프 예와 같은 흥미로운 예제들과 이런 문제들에 적합한 데이터 구조, 네트워크 분석에 대해 살펴본다. 이 장에서는 graph-tool, NetworkX, matplotlib, scipy, numpy 같은 특정 라이브러리들을 사용한다.
8장, ‘고급 시각화’에서는 시뮬레이션 도구들과 여러 시각화 도구들을 보여주기 위한 신호 처리 예제들을 알아본다. 또한 Julia, DS.js와 같은 다른 고급 도구와 비교해 본다.
부록, ‘시각화 출발하기와 탐색하기’에서는 conda에 대한 개괄적 설명과 파이썬 라이브러리들의 리스트를 보여준다.
목차
목차
- 1장. 데이터 시각화 개념 잡기
- 데이터, 정보, 지식, 통찰
- 데이터
- 정보
- 지식
- 데이터 분석과 통찰
- 데이터의 변환
- 데이터, 정보로의 변환
- 데이터 수집
- 데이터 전 처리
- 데이터 처리
- 데이터 조직화
- 데이터 셋 받기
- 정보, 지식으로의 변환
- 지식, 통찰로의 변환
- 데이터, 정보로의 변환
- 데이터 시각화의 역사
- 컴퓨터 이전의 시각화
- 미나드의 러시아 원정 지도(1812)
- 런던의 콜레라 전염병(1831-1855)
- 통계 그래픽(1850-1915)
- 이후의 데이터 시각화 발전
- 컴퓨터 이전의 시각화
- 시각화가 어떻게 의사결정을 돕는가?
- 시각화는 어느 곳에 적합할까?
- 데이터 시각화의 현재
- 좋은 시각화란 무엇인가?
- 플롯 시각화
- 막대 그래프와 원 그래프
- 막대 그래프
- 원 그래프
- 상자 그래프
- 산포도와 버블 차트
- 산포도
- 버블 차트
- KDE 도표
- 막대 그래프와 원 그래프
- 요약
- 데이터, 정보, 지식, 통찰
- 2장. 데이터 분석과 시각화
- 시각화는 왜 계획이 필요한가?
- 에볼라 예제
- 스포츠 예제
- 시각적으로 결과를 표현하기
- 데이터를 이용해 즐거운 이야기 만들기
- 왜 이야기는 중요한가?
- 독자 중심의 이야기
- 갭마인더
- 미국의 주별 유권자 경향
- 미국 내 사망률
- 이야기를 위한 몇 가지 다른 예
- 저자 중심의 이야기
- 인식 방법과 표현 방법
- 지각에서의 게슈탈트 법칙
- 시각화를 위한 좋은 사례들
- 비교와 순위
- 상호 연관성
- 분포
- 지역 특정 혹은 지리정보
- 부분에서 전체의 관계
- 시간 경과에 따른 경향
- 파이썬을 이용한 시각화 도구
- 개발 도구
- Enthought의 Canopy
- 컨티넘 애널리틱스의 아나콘다
- 개발 도구
- 인터랙티브 시각화
- 이벤트 리스너
- 레이아웃
- 원형 레이아웃
- 방사형 레이아웃
- 풍선 레이아웃
- 이벤트 리스너
- 요약
- 3장. 파이썬 IDE로 시작하기
- 파이썬 내장 IDE
- 파이썬 3.x vs. 파이썬 v2.7
- 인터랙티브 도구의 종류
- IPython
- Plotly
- 파이썬 IDE의 종류
- PyCharm
- PyDev
- 파이썬 인터랙티브 에디터(IEP)
- Enthought의 Canopy
- 컨티넘 애널리틱스의 아나콘다
- Spyder의 개관
- conda의 개관
- 아나콘다의 시각화 그림/도표
- surface-3D 그림/도표
- 사각형 지도 플롯
- 인터랙티브 시각화 패키지들
- Bokeh
- VisPy
- 요약
- 파이썬 내장 IDE
- 4장. 수치 연산 및 인터랙티브 플로팅
- NumPy, SciPy, and MKL 함수들
- NumPy
- NumPy 보편 함수
- 모양과 모양 재편에 대한 조작
- 보간 예제
- 벡터화 함수들
- NumPy 선형 대수 요약
- SciPy
- 선형 방정식의 예제
- 벡터화된 수치 미분
- MKL 함수
- 파이썬의 성능
- NumPy
- 스칼라 선택
- 분할
- flat을 사용하는 분할
- 배열 색인
- 수치 색인
- 논리 색인
- 다른 데이터 구조
- 스택
- 튜플
- 셋
- 큐
- 사전
- 행렬 표현 사전
- 희소 행렬
- 희소성 시각화
- 저장을 위한 사전
- 트라이
- matplotlib을 이용한 시각화
- 워드 클라우드
- 워드 클라우드 설치
- 워드 클라우드 입력
- Web feeds
- 트윗 글
- 주식 차트의 플로팅
- 데이터 획득
- 스포츠에서의 시각화 예제
- 요약
- NumPy, SciPy, and MKL 함수들
- 5장. 금융과 통계 모델
- 결정론적 모형
- 총 수익률
- 확률론적 모델
- 몬테카를로 시뮬레이션
- 몬테카를로 시뮬레이션은 정확히 무엇인가?
- 몬테카를로 시뮬레이션으로 재고 문제 다루기
- 농구에서 몬테카를로 시뮬레이션
- 변동성 그래프
- 내재 변동성
- 포트폴리오 평가
- 시뮬레이션 모델
- 기하학적 브라운 시뮬레이션
- 확산 기반 시뮬레이션
- 몬테카를로 시뮬레이션
- 임계 모델
- 셸링의 분리 모델
- 통계 및 기계 학습의 개요
- K- 최근접 이웃
- 일반화 선형 모델
- 베이즈 선형 회귀
- 애니메이션 및 인터랙티브 플롯 작성하기
- 요약
- 결정론적 모형
- 6장. 통계와 머신러닝
- 분류 방법
- 선형 회귀의 이해
- 선형 회귀
- 의사결정 트리
- 예제
- 베이즈 정리
- 나이브 베이즈 분류기
- TextBlob을 이용한 나이브 베이즈 분류기
- TextBlob 설치
- 말뭉치 다운로드
- TextBlob을 이용한 나이브 베이즈 분류기
- 워드 클라우드를 이용해 긍정적인 감정 보기
- k 근접 이웃
- 로지스틱 회귀
- 서포트 벡터 머신
- 주성분 분석
- scikit-learn 설치
- k-평균 군집화
- 요약
- 방향성 그래프와 멀티 그래프
- 그래프 데이터 저장하기
- 그래프 보여주기
- igraph
- NetworkX
- Graph-tool
- 그래프의 클러스터링 계수
- 소셜 네트워크의 분석
- 평면 그래프 테스트
- 방향성 비순환 그래프 테스트
- 최대 플로우와 최소 컷
- 유전자 프로그래밍 예제
- 확률 블록 모델
- 요약
- 컴퓨터 시뮬레이션
- 파이썬의 랜덤 패키지
- SciPy의 랜덤 함수
- 시뮬레이션 예제
- 신호 처리
- 애니메이션
- HTML5를 이용한 시각화 방법
- Julia는 파이썬과 어떻게 다른가
- 시각화를 위한 D3.js
- 대시보드
- 파이썬의 랜덤 패키지
- 요약
- conda 둘러보기
- 아나콘다를 이용한 패키지 설치
- 패키지 웹 사이트
도서 오류 신고
정오표
정오표
[p.24 : 아래서 4행]
https://www.packtpub.com/sites/default/files/downloads/AAA
->
https://www.packtpub.com/sites/default/files/downloads/8327OS_Graphics.pdf