구글 빅쿼리 애널리틱스 [구글 빅쿼리 개발팀 멤버가 직접 집필한]
- 원서명Google BigQuery Analytics (ISBN 9781118824825)
- 지은이조던 티가니(Jordan Tigani), 싯다르타 나이두(Siddartha Naidu)
- 옮긴이최명근, 심지현
- ISBN : 9788960778436
- 40,000원
- 2016년 04월 14일 펴냄 (절판)
- 페이퍼백 | 644쪽 | 188*235mm
- 시리즈 : 데이터 과학
판매처
- 현재 이 도서는 구매할 수 없습니다.
책 소개
요약
구글의 새로운 빅데이터 분석 플랫폼, 빅쿼리
빅데이터 분석은 개인과 기업을 막론하고 요즘 최고의 화두다. 구글 빅쿼리를 활용하면 대량의 데이터에 복잡한 쿼리를 던지고 빠른 시간 내에 답을 얻을 수 있다. 이 책은 빅쿼리를 언제, 어떻게 사용하는지 설명하며, 유용한 인사이트를 얻을 수 있도록 돕는다. 먼저 기본적인 빅쿼리 개념을 다진 후, 빅쿼리 API와 쿼리 작성법, 빅쿼리의 동작 방식을 다양한 모범 사례와 예제를 통해 설명한다. 또한 태블로나 엑셀 등 다른 시스템과의 통합도 다룬다. 특히 이 책이 제공하는 앱엔진 앱과 웹 애플리케이션 예제는 사용자 애플리케이션 개발을 시작하는 데 매우 유용할 것이다.
이 책에서 다루는 내용
■ 빅쿼리 API를 통한 인증과 커뮤니케이션 방법
■ 데이터를 서비스로 가져오고 내보내는 방법
■ 간단한 쿼리들로 강력한 쿼리를 구성하는 방법
■ 구글 클라우드 플랫폼과 외부 도구로 서비스를 사용하는 법
■ 현재의 모범 사례와 기술을 보여주는 실제 예제
■ 빅데이터 분석에 많이 쓰이는 언어인 파이썬으로 작성된 웹 애플리케이션 예제
■ 이 책에서 사용하는 안내 웹사이트와 공개 데이터셋 제공
이 책의 대상 독자
이 책은 빅쿼리로 데이터를 분석하려는 데이터 과학자와 사용자의 데이터 파이프라인에 빅쿼리를 통합하려는 개발자, 빅쿼리가 사용하기 적합한 도구인지 결정하려는 기술 평가자를 대상으로 한다.
이 책의 구성
빅쿼리 기본(1장~4장)
: 빅쿼리를 시작하는 방법과 서비스에서 사용하는 기초적인 개념을 설명한다. 빅쿼리에 익숙하다면 이 부는 건너뛰어도 되지만, 주요 개념에 대한 기반을 확고히 다지는 데 도움이 될 것이다.기초 빅쿼리(5장~8장)
: HTTP 하단 및 상단 클라이언트에서 API를 사용하는 방법과 SQL 쿼리 작성법을 설명한다. 특히 8장에서는 다양한 API를 사용하는 앱엔진 앱을 설명하며, 이러한 API가 실제 시나리오에서 얼마나 유용한지 살펴본다.고급 빅쿼리(9장~11장)
: 빅쿼리 동작 방식을 상세히 설명하고, 고급 쿼리 기술과 방법, 데이터 관리 전략을 제안한다. 또한 동작할 듯한 쿼리가 왜 오류를 반환하는지 설명하고, SQL로 표현하기 어려운 쿼리를 생성한다.빅쿼리 애플리케이션(12장~14장)
: 다른 시스템과 빅쿼리를 통합하는 방법을 알아본다. 예를 들어, 태블로로 데이터를 시각화하는 방법, 마이크로소프트 엑셀에서 빅쿼리 테이블에 쿼리하는 방법, 사용자의 구글 애널리틱스 데이터에 쿼리하는 방법을 살펴본다.목차
목차
- 1부 빅쿼리 기본
- 01장 구글의 빅데이터 역사
- 빅데이터 스택 1.0
- 빅데이터 스택 2.0(그리고 이후)
- 오픈소스 스택
- 구글 클라우드 플랫폼
- 클라우드 처리
- 클라우드 스토리지
- 클라우드 애널리틱스
- 문제 명시
- 빅데이터의 의미
- 왜 빅데이터인가
- 빅데이터 처리에 새로운 방법이 필요한 이유
- 수 초 내에 테라바이트를 읽는 방법
- 맵리듀스의 문제점
- 빅데이터에 질문하고 빠르게 대답을 얻는 방법
- 요약
- 02장 빅쿼리 기초
- 빅쿼리의 의미
- 빅데이터에 SQL 쿼리
- 클라우드 스토리지 시스템
- 분산 클라우드 컴퓨팅
- 서비스형 애널리틱스
- 빅쿼리는 ...이 아니다
- 빅쿼리 기술 스택
- 구글 클라우드 플랫폼
- 빅쿼리 서비스 역사
- 빅쿼리 센서 애플리케이션
- 센서 클라이언트 안드로이드 앱
- 빅쿼리 센서 앱엔진 앱
- 애드혹 쿼리 실행
- 요약
- 빅쿼리의 의미
- 03장 빅쿼리 시작
- 프로젝트 생성
- 구글 API 콘솔
- 무료 버전 제한과 결제
- 첫 쿼리 실행
- 데이터 로딩
- 명령행 클라이언트 사용
- 설치와 설정
- 클라이언트 활용
- 서비스 계정 접근
- 구글 클라우드 스토리지 설치
- 개발 환경
- 파이썬 라이브러리
- 자바 라이브러리
- 그 밖의 도구
- 요약
- 프로젝트 생성
- 04장 빅쿼리 객체 모델의 이해
- 프로젝트
- 프로젝트명
- 프로젝트 결제
- 프로젝트 접근 제어
- 프로젝트와 앱엔진
- 빅쿼리 데이터
- 빅쿼리 내 명명
- 스키마
- 테이블
- 데이터셋
- 잡
- 잡 컴포넌트
- 빅쿼리 결제와 한도
- 저장 비용
- 처리 비용
- 쿼리 RPC
- TableData.insertAll( ) RPC
- 단대단 애플리케이션을 위한 데이터 모델
- 프로젝트
- 데이터셋
- 테이블
- 요약
- 프로젝트
- 2부 기초 빅쿼리
- 05장 빅쿼리 API
- 구글 API 소개
- API 접근 인증
- SOAP-Less 사용자를 위한 RESTful 웹 서비스
- 구글 API 설명서
- 공통 연산
- 빅쿼리 REST 컬렉션
- 프로젝트
- 데이터셋
- 테이블
- 테이블 데이터
- 잡
- 빅쿼리 API 여행
- 빅쿼리의 오류 처리
- 요약
- 구글 API 소개
- 06장 데이터 로딩
- 벌크 로드
- 바이트 이동
- 데스티네이션 테이블
- 데이터 포맷
- 오류
- 제한과 한도
- 스트리밍 삽입
- 요약
- 벌크 로드
- 07장 쿼리 실행
- 빅쿼리 쿼리 API
- 쿼리 API 메소드
- 쿼리 API 기능
- 쿼리 결제와 한도
- 빅쿼리 쿼리 언어
- 쿼리 다섯 개로 알아보는 빅쿼리 SQL
- 표준 SQL과의 차이점
- 요약
- 빅쿼리 쿼리 API
- 08장 응용
- 애플리케이션 소개
- 모바일 클라이언트
- 감시 서비스
- 로그 컬렉션 서비스
- 로그 트램펄린
- 대시보드
- 데이터 캐싱
- 데이터 변환
- 웹 클라이언트
- 요약
- 3부 고급 빅쿼리
- 09장 쿼리 실행의 이해
- 배경지식
- 저장 구조
- 콜로서스 파일시스템(CFS)
- 컬럼 IO
- 내구성과 가용성
- 쿼리 처리
- 드레멜 제공 트리
- 구조 비교
- 관계형 데이터베이스
- 맵리듀스
- 요약
- 10장 고급 쿼리
- 고급 SQL
- 하위 쿼리
- 테이블 합치기: 암묵적인 UNION과 JOIN
- 분석과 윈도우 함수
- 빅쿼리 SQL 확장
- EACH 키워드
- 데이터 샘플링
- 반복 필드
- 쿼리 오류
- 너무 큰 결과
- 자원 초과
- 쿼리 기법
- 피벗
- 코흐트 분석
- 병렬 리스트
- 정확한 COUNT DISTINCT
- 최근 평균
- 동시 실행 계산
- 요약
- 고급 SQL
- 11장 빅쿼리에 저장된 데이터 관리
- 쿼리 캐싱
- 결과 캐싱
- 테이블 스냅샷
- 앱엔진 데이터스토어 통합
- 간단한 카인드
- 혼합 타입들
- 마지막 생각
- 메타테이블과 테이블 샤딩
- 시간 여행
- 테이블 선택
- 요약
- 4부 빅쿼리 애플리케이션
- 12장 외부 데이터 처리
- 빅쿼리에서 데이터 가져오기
- 추출 잡
- TableData.list( )
- 앱엔진 맵리듀스
- 순차 솔루션
- 기본 앱엔진 맵리듀스
- 빅쿼리 통합
- 하둡과 함께 빅쿼리 사용
- 스프레드시트에서 빅쿼리로 쿼리
- 구글 스프레드시트에서의 빅쿼리 쿼리들(앱스 스크립트)
- 마이크로스트 엑셀에서의 빅쿼리 쿼리들
- 요약
- 빅쿼리에서 데이터 가져오기
- 13장 외부 도구에서 빅쿼리 이용
- 빅쿼리 어댑터들
- 심바 ODBC 커넥터
- JDBC 연결 옵션들
- 클라이언트측 암호화를 통한 암호화된 빅쿼리
- 빅쿼리에서의 과학적 데이터 처리 툴들
- R에서의 빅쿼리
- 파이썬 판다와 빅쿼리
- 빅쿼리에서의 데이터 시각화
- 태블로를 이용한 빅쿼리 데이터 시각화
- 빔을 이용한 빅쿼리 데이터 시각화
- 다른 데이터 시각화 옵션들
- 요약
- 빅쿼리 어댑터들
- 14장 구글 데이터 소스에 쿼리
- 구글 애널리틱스
- 빅쿼리 접근 설정
- 테이블 스키마
- 테이블 쿼리
- 구글 애드센스
- 테이블 구조
- 빅쿼리 레버리지
- 구글 클라우드 스토리지
- 구글 애널리틱스