예제로 배우는 파이썬 데이터 시각화 [파이썬 초심자부터 다양한 데이터 시각화 예제 학습이 필요한 독자들을 위한 필독서]
- 원서명Python Data Visualization Cookbook - Second Edition (ISBN 9781784396695)
- 지은이이고 밀로바노빅(Igor Milovanovi), 디미트리 포레스(Dimitry Foures), 기우스페 베티글리(Giuseppe Vettigli)
- 옮긴이정기연, 김명선, 허혜정, 최재혁
- ISBN : 9791161750040
- 30,000원
- 2017년 06월 12일 펴냄 (절판)
- 페이퍼백 | 364쪽 | 188*235mm
- 시리즈 : acorn+PACKT
판매처
- 현재 이 도서는 구매할 수 없습니다.
책 소개
소스 코드 파일은 여기에서 내려 받으실 수 있습니다.
본문에 쓰인 컬러 이미지는 여기에서 내려 받으세요.
요약
파이썬으로 작성된 예제 코드를 중심으로 데이터 시각화를 소개한다. 일반 데이터 형식과 CSV, JSON, XSL, 또는 관계형 데이터베이스 데이터의 읽고 쓰기부터 시작해, 플롯과 차트 그리기와 커스터마이징하기, 3D 시각화 만들기, 이미지와 지도로 차트 그리기와 같은 데이터 시각화의 기본을 실제 파이썬 코드로 설명한다. 또한 클라우드 환경에서 시각화를 만들고 공유하기 위해 Plot.ly를 사용하는 방법을 소개한다. 다양한 예제를 제공해 파이썬을 처음 접하는 입문자들부터 기본 이론적인 지식이 있는 독자들까지 자신이 가지고 있는 데이터를 쉽게 시각화할 수 있도록 돕는다.
이 책에서 다루는 내용
■ 작업 환경 설정을 위한 필수 툴 소개
■ 표준 파이썬 데이터 라이브러리와 Pandas 라이브러리를 이용한 데이터 탐험
■ 첫 번째 차트 그리기와 사용자 최적화
■ 가장 많이 쓰이는 파이썬 시각화 라이브러리 사용
■ mplot3d를 이용한 3D 시각화
■ 이미지와 맵을 가진 차트 작성
■ 당신의 데이터를 설명하기 위한 가장 적절한 차트 이해
■ matplotlib에 숨어있는 보석 발견
■ Plot.ly를 이용해 온라인상에 시각화 공유
이 책의 대상 독자
이 책은 이미 파이썬을 사용하고 있지만 실용적인 방법으로 데이터를 시각화하는 방법을 배우고자 하는 개발자와 데이터 과학자를 위한 책이다. 여러분이 데이터 시각화에 대해 들어본 적은 있지만 어디서부터 시작해야 할지 모른다면, 이 책은 처음부터 여러분을 안내하고, 데이터, 데이터 포맷, 데이터 시각화, 파이썬을 데이터 시각화를 위해 사용하는 방법을 이해하도록 도울 것이다.
일반적인 프로그래밍 개념을 알아야 하며, 그동안의 프로그래밍 경험이 도움이 될 수 있다. 하지만 이 책에서도 이해하기 쉽도록 코드를 거의 라인 단위로 설명하므로 부담 갖지 않아도 된다. 수학 역시 필요하지 않다. 소개할 모든 개념은 철저하게 일반 단어로 설명할 것이고, 그 주제에 더 관심이 있는 독자를 위해 노트를 제공할 것이다.
이 책의 구성
1장, ‘작업 환경 준비하기’에서는 플랫폼에 필요한 파이썬 패키지와 라이브러리를 설치하는 방법을 설명하고, 몇 가지 조언을 제공한다.
2장, ‘자신의 데이터 알기’에서는 일반 데이터 형식과 CSV, JSON, XSL, 또는 관계형 데이터베이스를 읽고 쓰는 방법을 알아본다.
3장, ‘첫 번째 플롯 그리기와 커스터마이징’에서는 간단한 플롯 그리기로 시작해서 몇 가지 커스터마이징 방법을 살펴본다.
4장, ‘더 많은 플롯 그리기와 커스터마이징’에서는 앞 장에 이어서 더 발전된 차트 그리기와 그리드 커스터마이징 방법을 설명한다.
5장, ‘3D 시각화 만들기’에서는 3D 막대, 3D 히스토그램, matplotlib 애니메이션과 같은 3차원 데이터 시각화에 대해 설명한다.
6장, ‘이미지와 지도로 차트 그리기’에서는 이미지 프로세싱, 지도 위에 데이터를 투영하는 방법, CAPTCHA 테스트 이미지를 생성하는 방법을 알아본다.
7장, ‘적절한 플롯을 사용해 데이터 이해하기’에서는 스펙트로그램 및 상관 관계와 같은 고급 플로팅 기술에 대한 설명과 예제를 살펴본다.
8장, ‘더 많은 matplotlib Gems에 대해’에서는 간트(Gantt) 차트, 박스 플롯, 수염 플롯과 같은 차트를 알아보고, matplotlib에서 텍스트(문자)를 그리기 위한 LaTeX 사용 방법에 대해 설명한다.
9장, ‘Plot.ly를 사용한 클라우드에서의 시각화’에서는 클라우드 환경에서 시각화하고 공유하기 위해 Plot.ly를 사용하는 방법을 알아본다.
목차
목차
- 1장. 작업 환경 준비하기
- 소개
- matplotlib, NumPy, SciPy 설치하기
- virtualenv와 virtualenvwrapper 설치하기
- 맥 OS X에 matplotlib 설치하기
- 윈도우에 matplotlib 설치하기
- 이미지 처리를 위해 파이썬 이미징 라이브러리(PIL) 설치하기
- Requests 모듈 설치하기
- 코드에서 matplotlib 매개변수 커스터마이징
- 프로젝트별 matplotlib의 매개변수 사용자 정의하기
- 2장. 자신의 데이터 알기
- 소개
- CSV로부터 데이터 읽어오기
- 마이크로소프트 엑셀 파일로부터 데이터 읽어오기
- Fixed-width 데이터 파일로부터 데이터 읽어오기
- Tab-delimited 파일로부터 데이터 읽어오기
- JSON 리소스로부터 데이터 읽어오기
- JASON, CSV, 엑셀에 데이터 내보내기
- Pandas로 데이터 읽어오기 및 조작하기
- 데이터베이스로부터 데이터 임포트하기
- 아웃라이어로부터 데이터 정제
- Chunk단위로 파일 읽기
- 스트리밍 데이터 소스 읽기
- NumPy배열로 파일 불러오기
- 제어된 랜덤 데이터 셋 생성하기
- 현실 세계 데이터에서의 노이즈 다듬기
- 3장. 첫 번째 플롯 그리기와 커스터마이징
- 소개
- 플롯 타입의 정의 - 막대, 선, 누적 차트
- 간단한 사인, 코사인 그래프 그리기
- 축 길이와 한계 정의하기
- 플롯 라인 스타일, 특성 및 포맷 문자열 정의하기
- 눈금, 레이블 및 그리드 설정하기
- 범례 및 주석 추가하기
- spines를 중심으로 이동하기
- 히스토그램 만들기
- 오류 막대가 있는 막대형 차트 만들기
- 원 그래프 만들기
- 채워진 영역으로 플롯 그리기
- 누적 그래프 만들기
- 색깔 마커로 산포도 그리기
- 4장. 더 많은 플롯 그리기와 커스터마이징
- 소개
- 축 레이블의 투명도와 크기 설정하기
- 차트 라인에 그림자 추가하기
- 그림에 데이터 테이블 추가하기
- 서브플롯 사용하기
- 그리드 커스터마이징하기
- 등고선 플롯 생성하기
- under-plot 영역 채우기
- 극도표 그리기
- 극 막대를 사용해 파일 시스템 트리 시각화하기
- style을 이용한 matplotlib 커스터마이징
- 5장. 3D 시각화 만들기
- 소개
- 3D 막대 만들기
- 3D 히스토그램 만들기
- matplotlib 애니메이션화하기
- OpenGL로 애니메이션화하기
- 소개
- 6장. 이미지와 지도로 차트 그리기
- PIL로 이미지 처리하기
- 이미지로 플롯 그리기
- 그림 내에 다른 도표로 이미지 표시하기
- Basemap을 사용해 지도 위에 데이터 그리기
- 구글 맵 API를 사용해 데이터 그리기
- CAPTCHA 이미지 생성하기
- 7장. 적절한 플롯을 사용해 데이터 이해하기
- 소개
- 로그 플롯 이해하기
- 스펙트로그램 이해하기
- 스템 플롯 만들기
- 벡터 플로우의 스트림라인 그리기
- 색상 맵 사용하기
- 산포도와 히스토그램 사용하기
- 두 변수 사이의 교차 상관 관계 표시하기
- 자기상관의 중요성
- 8장. 더 많은 Matplotlib Gems에 대해
- 소개
- 미늘 그리기
- 상자-수염 그래프 그리기
- 간트 차트 그리기
- 에러 막대 그리기
- 텍스트 및 글꼴 속성 사용하기
- LaTeX로 텍스트 그리기
- pyplot과 OO API의 차이점 이해하기
- 9장. Plot.ly를 사용한 클라우드에서의 시각화
- 소개
- 선 그래프 만들기
- 막대 그래프 만들기
- 3D 삼각 매듭 그리기
- 지도와 버블 차트 시각화