Top

R을 활용한 비즈니스 인텔리전스 [마케팅 분석, 운영 과학, 데이터 시각화 등 따라 하며 배우는 R]

  • 원서명Introduction to R for Business Intelligence (ISBN 9781785280252)
  • 지은이제이 겐드론(Jay Gendron)
  • 옮긴이박필재
  • ISBN : 9791161750361
  • 24,000원
  • 2017년 08월 18일 펴냄
  • 페이퍼백 | 264쪽 | 188*235mm
  • 시리즈 : acorn+PACKT

책 소개

소스 코드 파일은 여기에서 내려 받으실 수 있습니다.

요약

단순히 감으로 비즈니스 의사 결정을 하는 시대는 지났다. 데이터로 경영 현장의 마케팅, 운영 과학, 데이터 시각화 문제를 해결해보자. 빅데이터 분석의 아이콘인 R을 활용해, 비즈니스 현장의 다양한 의사 결정을 분석하는 과정을 초심자도 하나하나 따라 하면서 배울 수 있도록 구성돼 있다.

이 책에서 다루는 내용

■ 원 데이터의 추출, 변형, 로딩
■ 데이터를 정리하는 체계적인 접근법
■ 데이터를 이해하기 위한 탐색적 방법
■ 회귀 모델을 통한 예측
■ 군집 분석으로 데이터에 가려진 그룹을 파악
■ 시계열 분석
■ 데이터 시각화
■ 샤이니 패키지로 상호작용적인 웹 대시보드 생성

이 책의 대상 독자

기업이 당면한 문제를 분석적으로 접근하고, R 테크닉을 향상시키길 원하는 비즈니스 분석가를 대상으로 한다. 또한 비즈니스의 전문 언어를 배우고, 기업 문제에 R 테크닉을 적용하기 때문에 데이터 과학 전문가에게도 도움이 될 것이다.

이 책의 구성

데이터 과학의 일반적인 흐름에 따라 총 3부(데이터 준비, 분석, 결과물 제시)로 이루어졌다. 1부에서는 데이터를 클리닝하고 다양한 자료에서 데이터를 가져오는 법을 배울 것이다.
1장. '추출, 변형, 저장'에서는 다양한 자료에서 데이터를 추출(Extract), 분석 목적에 따라 데이터를 변형(Transform), 비즈니스 시스템에 변형한 데이터를 저장(Load)하는 ETL 과정을 배울 것이다.
2장. '데이터 처리'에서는 다양한 종류의 데이터에 적합한 처리 절차를 4단계로 배울 것이다. 분석에 앞서 준비 단계에서 데이터의 요약, 수정, 변환, 조정 등을 배울 것이다.

2부에선 비즈니스 인텔리전스를 위해 데이터 탐색, 예측 모델, 군집 분석과 시계열 분석을 해볼 것이다.
3장. '탐색적 데이터 분석'에서는 체계적인 접근을 통해 다소 생소한 데이터셋에 도전해볼 것이다. 3장을 통해 추후에 시도할 분석에 중요한 기법을 배울 것이다.
4장. '비즈니스 회귀 분석'에서는 회귀 분석의 기본 전제 조건을 학습하고, 단순 회귀, 다중 회귀 분석과 같은 대표적인 회귀 분석을 배운다.
5장. '군집 분석을 통한 데이터 마이닝'에서는 k평균, 계층 클러스터링(hierarchical clustering)과 같은 비지도 학습을 배운다. 이 두 가지 데이터 마이닝 기법을 통해 데이터에 숨겨진 패턴을 찾아낼 수 있다.
6장. '시계열 분석'에서는 데이터 과학 과정에서 잘 가르치지 않는 어려운 주제를 소개한다. 머신 러닝 기법은 아니지만, 과거 데이터를 활용해 미래를 예상하는 테크닉을 배울 것이다.

마지막으로 3부에서 첨단 시각화 기술, 상호작용하는 웹 기반의 대시보드로 데이터 분석의 결과물을 상대방에게 전달하는 법을 배운다.
7장. '데이터 스토리 시각화'에서는 결과물을 시각화하는 테크닉은 물론 색상, 모양, 위치에 따라 상대방이 어떻게 결과물을 인지적으로 해석하는지 배울 것이다.
8장. 'Shiny로 만드는 웹 대시보드'에서는 R의 Shiny 패키지를 통해 웹 기반 비즈니스 인텔리전스를 구축하는 법을 배운다.

저자/역자 소개

지은이의 말

이 책은 성장하는 스타트업 기업에서 근무하는 데이터 분석가의 시각으로 비즈니스 인텔리전스를 경험할 수 있는 기회를 제공한다. 독자들은 기업 경영과 관련된 여러 가지 케이스를 통해 R을 배울 것이다. 즉 마케팅, 재무, 운영 등 기업 경영에서 마주칠 수 있는 다양한 문제에 대해 독자들이 데이터 중심 분석으로 해결하도록 도와준다. 이 책은 올바른 질문을 제기하고 스토리와 시각화를 통해 독자들이 데이터와 기업을 연결하는 것을 도와준다. R을 통해 비즈니스 인텔리전스 문제를 해결하는 과정을 즐기길 바란다.

지은이 소개

제이 겐드론(Jay Gendron)

컨설팅 회사 부즈 앨런 해밀턴(Booz Allen Hamilton)에서 근무하는 데이터 과학자다. 지난 10년 동안 통계, 데이터 분석, 머신 러닝 분야에서 경험을 쌓아왔으며, 날카로운 질문과 효과적인 시각화가 의사 결정자의 분석을 더욱 효과적으로 만든다고 믿고 있다. 비즈니스 리더, 스타트업, 예술가, 저자 등으로써 다양한 경력을 쌓았다. 기계공학으로 학사 학위를 받은 뒤, 기술경영과 OR(Operation Research)로 석사 학위를 받았다. 또한 최고정보책임자(CIO)를 위한 대학원 인증 교육을 수료했다. 코세라(Coursera)에서 제공하는 존스 홉킨스 대학의 10개 데이터 과학 전문 과정을 이수하는 등 평생 학습자로서의 삶을 계속하고 있다. 또한 전 세계에서 강연 활동을 하며 관련 상을 수상하기도 했으며 공익기관의 경영 통찰력을 높이기 위해 자신의 데이터 전문 지식을 무료로 제공하고 있다.

옮긴이의 말

기본적으로 (흔히 말하는 경영학을 포함한) 비즈니스는 응용 학문이다. 기업 경영에 필요한 회계, 재무, 운영 과학, 마케팅, 인사 등이 필수 요소지만, 분석가들이 활용 가능한 데이터의 양과 질이 급속도로 증가하면서 비즈니스 현장의 수많은 의사 결정도 그 방법과 형태가 많이 변화하고 있다. 예를 들어 마케팅 분야는 과거에는 결정가의 통찰력과 아이디어가 중요했지만 최근엔 데이터를 활용한 의사 결정이 더욱 주목받고 있다. 더군다나 R이란 막강한 도구가 무료로 확산되고 코세라(coursera), 유튜브(youtube) 등 무료 강의도 찾아볼 수 있기 때문에 “돈이 없어서, 잘 몰라서”라는 답변은 더 이상 유효하지 않게 됐다. R을 경험한 사람으로서 말하자면, R은 SAS나 SPSS보단 상대적으로 더 어렵다. 하지만 무료이고 최신 분석 방법은 R을 통해 가장 먼저 확산된다. 무척 탄력적인 코딩이 가능하기 때문에 R을 배우길 추천한다. R은 ‘레고’라고 생각하면 쉽다. 복잡한 모델을 만들기는 어렵지만 자신의 생각을 매우 자유자재로 코딩할 수 있다. R의 상대적인 어려움은 이러한 탄력성에서 연유한다고 보면 될 것이다. 또 한 가지 기업에서 은퇴하면 개인 입장에서 비싼 유료 분석 툴을 접하기 어려워진다. 이 사실도 R과 같은 무료 분석 툴을 배워야 하는 이유이기도 하다. 이 책은 비즈니스 현장에서 실무자들이 경험할 수 있는 상황을 R로 하나하나 따라 하며 실습할 수 있는 매뉴얼 같은 책이다. 약간의 통계 지식만 있으면 일부 장을 제외하고 R을 전혀 모르는 사람이라도 쉽게 따라 할 수 있다. 모든 내용을 이해할 필요는 없다. R을 배운다는 것은 외국어를 배우는 것과 아주 비슷하다. 분석 과정을 즐기면서 R이란 막강한 도구를 배우길 빈다.

옮긴이 소개

박필재

콜로라도 주립대(볼더)에서 MBA와 비즈니스 분석을 공부했으며, 공공 기관에서 경제 조사 분석을 주로 담당해왔다. 정성(통찰력)적인 부분과 정량(분석)적인 역량을 골고루 갖추어야 훌륭한 경영자가 될 수 있다고 믿고 있다. 데이터 분석의 기업 경영 활용에 관심이 많다. 여가 시간에는 여행과 사진으로 재충전을 한다. 최근 텍스트 마이닝의 마케팅 활용을 공부 중이다.

목차

목차
  • 1장. 추출, 변형, 저장
    • 비즈니스 인텔리전스 분석에서 빅데이터 이해하기
    • 다양한 정보원에서 데이터 추출하기
      • CSV 및 다른 형태 파일 불러오기
      • 관계형 데이터에서 자료 호출하기
    • 분석 수요에 맞게 데이터 변형하기
      • 데이터 행 필터링하기
      • 데이터 칼럼(열) 선택하기
      • 기존 데이터에서 계산된 열 삽입하기
      • 그룹별로 데이터 집계하기
    • 분석을 위해 비즈니스 시스템에 데이터 로딩하기
      • CSV 파일로 저장하기
      • TXT 파일로 저장하기
    • 요약

  • 2장. 데이터 처리
    • 검사를 위해 데이터 요약하기
      • str() 함수를 이용해 요약하기
      • 분석 결과 검사하고 분석하기
    • 결함 데이터 찾아 수정하기
      • 데이터셋의 결함 찾아내기
      • 결함 데이터 수정하기
    • 분석 목적에 맞도록 데이터 형태 가공하기
      • 데이터 형태간 변환
      • 날짜 및 시간 변환
    • 문자열 데이터를 표준형으로 가공하기
      • 숫자 7의 힘
      • 데이터 분석을 위한 최종 준비
    • 요약

  • 3장. 탐색적 데이터 분석
    • 탐색적 데이터 분석 이해하기
      • 질문의 중요성
      • 측정 척도
      • R의 데이터 형태
    • 단일 변수 분석하기
      • 표를 활용한 데이터 탐색
      • 그래픽을 활용한 데이터 탐색
    • 두 개의 변수 분석하기
      • 데이터의 전반적인 모양은 어떨까?
      • 두 변수 사이에 어떤 관계가 있을까?
      • 두 변수 사이에 어떤 상관관계가 있을까?
      • 상관관계는 유의한 수준인가?
    • 다수의 변수 동시에 분석하기
      • 데이터 관찰
      • 데이터의 관계
      • 상관관계
      • 유의성 판단
    • 요약

  • 4장. 비즈니스 회귀 분석
    • 선형 회귀의 이해
      • lm() 함수 이해하기
      • 단순 선형 회귀
      • 잔차
    • 회귀 모델의 가정 점검
      • 선형성
      • 독립성
      • 정규성
      • 등분산성
      • 가정들에 대한 정리
    • 단순 선형 회귀 활용
      • 분석 결과 해석하기
      • 단순 선형 회귀로 미지의 결과 예측하기
      • 신뢰 구간을 활용한 빅데이터 다루기
    • 선형 회귀를 위한 데이터 개선
      • 데이터 변형하기
      • 이상치 데이터 처리하기
    • 다중 선형 회귀 분석 실행
    • 요약

  • 5장. 군집 분석을 활용한 데이터 마이닝
    • 군집 분석에 대한 설명
    • K평균 군집을 활용한 분할
      • 데이터 탐색
      • k평균 함수 실행하기
      • 모델 결과 해석하기
      • 비즈니스 사례 분석하기
    • 계층적 군집화 기술
      • 데이터 정리 및 탐색
      • hclust() 함수 실행하기
      • 분석 결과를 시각화하기
      • 모델 평가하기
      • 모델 선택하기
      • 분석 결과 준비하기
    • 요약

  • 6장. 시계열 분석
    • 선형 회귀로 시계열 데이터 분석하기
      • 선형성, 정규성, 등분산성
      • 예측과 신뢰 구간
    • 시계열 분석의 핵심 요소 이해
      • 안정적 데이터 가정
      • 차분 방법
    • ARIMA 모델 만들기
      • 모델 선택
      • 고급 모델링 기법 사용하기
    • 요약

  • 7장. 데이터 스토리 시각화
    • 데이터 시각화
      • 원하는 정보로 주의 집중시키기
      • 이용자의 해석 돕기
    • ggplot2로 그래프 그리기
    • Leaflet을 활용한 지리 정보 시각화
      • 지리 정보 시각화 학습
      • 지리 정보 시각화 기능 확장
    • rCharts로 상호작용하는 그래프 그리기
      • 데이터 스토리의 큰 틀 짜기
      • 자바스크립트로 상호작용 기능의 그래프 그리기
    • 요약

  • 8장. Shiny로 만드는 웹 대시보드
    • 기본 Shiny 애플리케이션 만들기
      • ui.R 파일
      • server.R 파일
    • 마케팅 캠페인 Shiny 애플리케이션 만들기
      • 다기능의 Shiny 폴더와 파일 구조 사용하기
      • 유저 인터페이스 설계
      • 서버 코드 만들기
    • Shiny 애플리케이션 배포하기
      • 깃허브에 저장
      • RStudio에 호스팅
      • 사설 웹 서버에 호스팅
    • 요약

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안

정오표

정오표

[p.38 : 아래서 4행]
을 만다는 것이다.
->
을 만드는 것이다.