R을 활용한 비즈니스 인텔리전스 [마케팅 분석, 운영 과학, 데이터 시각화 등 따라 하며 배우는 R]
- 원서명Introduction to R for Business Intelligence (ISBN 9781785280252)
- 지은이제이 겐드론(Jay Gendron)
- 옮긴이박필재
- ISBN : 9791161750361
- 24,000원
- 2017년 08월 18일 펴냄 (절판)
- 페이퍼백 | 264쪽 | 188*235mm
- 시리즈 : acorn+PACKT
판매처
- 현재 이 도서는 구매할 수 없습니다.
책 소개
소스 코드 파일은 여기에서 내려 받으실 수 있습니다.
요약
단순히 감으로 비즈니스 의사 결정을 하는 시대는 지났다. 데이터로 경영 현장의 마케팅, 운영 과학, 데이터 시각화 문제를 해결해보자. 빅데이터 분석의 아이콘인 R을 활용해, 비즈니스 현장의 다양한 의사 결정을 분석하는 과정을 초심자도 하나하나 따라 하면서 배울 수 있도록 구성돼 있다.
이 책에서 다루는 내용
■ 원 데이터의 추출, 변형, 로딩
■ 데이터를 정리하는 체계적인 접근법
■ 데이터를 이해하기 위한 탐색적 방법
■ 회귀 모델을 통한 예측
■ 군집 분석으로 데이터에 가려진 그룹을 파악
■ 시계열 분석
■ 데이터 시각화
■ 샤이니 패키지로 상호작용적인 웹 대시보드 생성
이 책의 대상 독자
기업이 당면한 문제를 분석적으로 접근하고, R 테크닉을 향상시키길 원하는 비즈니스 분석가를 대상으로 한다. 또한 비즈니스의 전문 언어를 배우고, 기업 문제에 R 테크닉을 적용하기 때문에 데이터 과학 전문가에게도 도움이 될 것이다.
이 책의 구성
데이터 과학의 일반적인 흐름에 따라 총 3부(데이터 준비, 분석, 결과물 제시)로 이루어졌다.
1부에서는 데이터를 클리닝하고 다양한 자료에서 데이터를 가져오는 법을 배울 것이다.
1장. '추출, 변형, 저장'에서는 다양한 자료에서 데이터를 추출(Extract), 분석 목적에 따라 데이터를 변형(Transform), 비즈니스 시스템에 변형한 데이터를 저장(Load)하는 ETL 과정을 배울 것이다.
2장. '데이터 처리'에서는 다양한 종류의 데이터에 적합한 처리 절차를 4단계로 배울 것이다. 분석에 앞서 준비 단계에서 데이터의 요약, 수정, 변환, 조정 등을 배울 것이다.
2부에선 비즈니스 인텔리전스를 위해 데이터 탐색, 예측 모델, 군집 분석과 시계열 분석을 해볼 것이다.
3장. '탐색적 데이터 분석'에서는 체계적인 접근을 통해 다소 생소한 데이터셋에 도전해볼 것이다. 3장을 통해 추후에 시도할 분석에 중요한 기법을 배울 것이다.
4장. '비즈니스 회귀 분석'에서는 회귀 분석의 기본 전제 조건을 학습하고, 단순 회귀, 다중 회귀 분석과 같은 대표적인 회귀 분석을 배운다.
5장. '군집 분석을 통한 데이터 마이닝'에서는 k평균, 계층 클러스터링(hierarchical clustering)과 같은 비지도 학습을 배운다. 이 두 가지 데이터 마이닝 기법을 통해 데이터에 숨겨진 패턴을 찾아낼 수 있다.
6장. '시계열 분석'에서는 데이터 과학 과정에서 잘 가르치지 않는 어려운 주제를 소개한다. 머신 러닝 기법은 아니지만, 과거 데이터를 활용해 미래를 예상하는 테크닉을 배울 것이다.
마지막으로 3부에서 첨단 시각화 기술, 상호작용하는 웹 기반의 대시보드로 데이터 분석의 결과물을 상대방에게 전달하는 법을 배운다.
7장. '데이터 스토리 시각화'에서는 결과물을 시각화하는 테크닉은 물론 색상, 모양, 위치에 따라 상대방이 어떻게 결과물을 인지적으로 해석하는지 배울 것이다.
8장. 'Shiny로 만드는 웹 대시보드'에서는 R의 Shiny 패키지를 통해 웹 기반 비즈니스 인텔리전스를 구축하는 법을 배운다.
목차
목차
- 1장. 추출, 변형, 저장
- 비즈니스 인텔리전스 분석에서 빅데이터 이해하기
- 다양한 정보원에서 데이터 추출하기
- CSV 및 다른 형태 파일 불러오기
- 관계형 데이터에서 자료 호출하기
- 분석 수요에 맞게 데이터 변형하기
- 데이터 행 필터링하기
- 데이터 칼럼(열) 선택하기
- 기존 데이터에서 계산된 열 삽입하기
- 그룹별로 데이터 집계하기
- 분석을 위해 비즈니스 시스템에 데이터 로딩하기
- CSV 파일로 저장하기
- TXT 파일로 저장하기
- 요약
- 2장. 데이터 처리
- 검사를 위해 데이터 요약하기
- str() 함수를 이용해 요약하기
- 분석 결과 검사하고 분석하기
- 결함 데이터 찾아 수정하기
- 데이터셋의 결함 찾아내기
- 결함 데이터 수정하기
- 분석 목적에 맞도록 데이터 형태 가공하기
- 데이터 형태간 변환
- 날짜 및 시간 변환
- 문자열 데이터를 표준형으로 가공하기
- 숫자 7의 힘
- 데이터 분석을 위한 최종 준비
- 요약
- 검사를 위해 데이터 요약하기
- 3장. 탐색적 데이터 분석
- 탐색적 데이터 분석 이해하기
- 질문의 중요성
- 측정 척도
- R의 데이터 형태
- 단일 변수 분석하기
- 표를 활용한 데이터 탐색
- 그래픽을 활용한 데이터 탐색
- 두 개의 변수 분석하기
- 데이터의 전반적인 모양은 어떨까?
- 두 변수 사이에 어떤 관계가 있을까?
- 두 변수 사이에 어떤 상관관계가 있을까?
- 상관관계는 유의한 수준인가?
- 다수의 변수 동시에 분석하기
- 데이터 관찰
- 데이터의 관계
- 상관관계
- 유의성 판단
- 요약
- 탐색적 데이터 분석 이해하기
- 4장. 비즈니스 회귀 분석
- 선형 회귀의 이해
- lm() 함수 이해하기
- 단순 선형 회귀
- 잔차
- 회귀 모델의 가정 점검
- 선형성
- 독립성
- 정규성
- 등분산성
- 가정들에 대한 정리
- 단순 선형 회귀 활용
- 분석 결과 해석하기
- 단순 선형 회귀로 미지의 결과 예측하기
- 신뢰 구간을 활용한 빅데이터 다루기
- 선형 회귀를 위한 데이터 개선
- 데이터 변형하기
- 이상치 데이터 처리하기
- 다중 선형 회귀 분석 실행
- 요약
- 선형 회귀의 이해
- 5장. 군집 분석을 활용한 데이터 마이닝
- 군집 분석에 대한 설명
- K평균 군집을 활용한 분할
- 데이터 탐색
- k평균 함수 실행하기
- 모델 결과 해석하기
- 비즈니스 사례 분석하기
- 계층적 군집화 기술
- 데이터 정리 및 탐색
- hclust() 함수 실행하기
- 분석 결과를 시각화하기
- 모델 평가하기
- 모델 선택하기
- 분석 결과 준비하기
- 요약
- 6장. 시계열 분석
- 선형 회귀로 시계열 데이터 분석하기
- 선형성, 정규성, 등분산성
- 예측과 신뢰 구간
- 시계열 분석의 핵심 요소 이해
- 안정적 데이터 가정
- 차분 방법
- ARIMA 모델 만들기
- 모델 선택
- 고급 모델링 기법 사용하기
- 요약
- 선형 회귀로 시계열 데이터 분석하기
- 7장. 데이터 스토리 시각화
- 데이터 시각화
- 원하는 정보로 주의 집중시키기
- 이용자의 해석 돕기
- ggplot2로 그래프 그리기
- Leaflet을 활용한 지리 정보 시각화
- 지리 정보 시각화 학습
- 지리 정보 시각화 기능 확장
- rCharts로 상호작용하는 그래프 그리기
- 데이터 스토리의 큰 틀 짜기
- 자바스크립트로 상호작용 기능의 그래프 그리기
- 요약
- 데이터 시각화
- 8장. Shiny로 만드는 웹 대시보드
- 기본 Shiny 애플리케이션 만들기
- ui.R 파일
- server.R 파일
- 마케팅 캠페인 Shiny 애플리케이션 만들기
- 다기능의 Shiny 폴더와 파일 구조 사용하기
- 유저 인터페이스 설계
- 서버 코드 만들기
- Shiny 애플리케이션 배포하기
- 깃허브에 저장
- RStudio에 호스팅
- 사설 웹 서버에 호스팅
- 요약
- 기본 Shiny 애플리케이션 만들기
도서 오류 신고
정오표
정오표
[p.38 : 아래서 4행]
을 만다는 것이다.
->
을 만드는 것이다.