Top

[빅데이터 시대 쉽고 빠른 R 통계 프로그래밍을 위한]
RStudio 따라잡기

  • 원서명Learning RStudio for R Statistical Computing (ISBN 9781782160601)
  • 지은이마크 P.J. 판 데르 루, 에드윈 데 용에
  • 옮긴이정사범
  • ISBN : 9788960774315
  • 15,000원
  • 2013년 05월 23일 펴냄
  • 페이퍼백 | 140쪽 | 188*235mm
  • 시리즈 : acorn+PACKT, 데이터 과학

책 소개

R은 데이터 분석 분야에서 단기간에 다양한 사용자를 끌어들인 오픈소스 통계 프로그래밍 언어다. RStudio는 가장 보편적으로 사용되며 운영체제 환경 등에 상관없이 활용할 수 있으며 지원도 빠른 오픈소스 기반 R용 IDE 툴이다. 이 책에서는 빠르고 효율적인 통계 분석 프로젝트 생성, 관리, 데이터 불러오기, R 스크립트 개발, 보고서와 그래픽 생성 등을 가르쳐 준다. R 개발자들은 패키지 개발, 코딩 원칙, RStudio를 이용한 버전 관리에 대해 배울 수 있다. 또한 단계별 지침을 이용하여 R 개발을 위한 통합 개발 환경을 빠르게 마스터할 수 있도록 기능이 풍부하면서도 쉬운 예제로 구성되었다.


[ 이 책에서 다루는 내용 ]

■ 데스크톱이나 웹 서버에서 RStudio 설치 및 실행
■ 최신 및 고급 R 콘솔 기능
■ 코드 편집 및 탐색 수행
■ 고급 대화형 그래픽 생성법
■ R 프로젝트와 프로젝트 파일의 효율적인 관리
■ R 확장 패키지 작성
■ R 프로젝트로 재현 가능한 통계 분석 수행


[ 이 책의 대상 독자 ]

이 책은 RStudo 기능을 최대한 활용하여 R개발 노력을 경감하고자 하는 R개발자와 분석가를 대상으로 만들었다. 따라서 여러분이 R에 대해서 잘 알고 있다고 가정한다. RStudio를 이용하여 R개발을 시작하려는 사람도 이 책은 도움이 될 것이다. 여러분이 이미 R을 이용하고 있지만 재현 가능한 통계분석 프로젝트를 만들거나 자작 패키지를 개발하여 R을 확장하기를 원한다면 이 책은 RStudio를 이용하여 좀더 신속하게 실행하는 방법을 보여줄 것이다.


[ 이 책의 구성 ]

1장, 시작하기: 윈도우, 맥, 리눅스에 R과 RStudio를 설치하고 처음으로 재현 가능한 연구프로젝트에 대해 소개한다.

2장, R스크립트 작성과 R콘솔: RStudio 코드를 대화식으로 콘솔과 스크립트에서 편집하고 실행하는 기능에 대해 논의한다.

3장, 데이터 보기와 플로팅: RStudio는 R객체에 대한 조사와 데이터에 대한 가시화 기능을 제공한다. manipulate 패키지를 이용하여 대화형 플롯을 만드는 방법을 배운다.

4장, R프로젝트 관리: RStudio의 프로젝트 파일 관리 기능과 버전 관리 통합기능을 설명하며 버전 관리에 대한 간단한 소개를 하겠다.

5장, 보고서 생성: 데이터 분석결과를 보기 좋게 HTML 페이지나 PDF 보고서로 자동변환하는 방법과 실제로 재현하는 방법을 배운다.

6장, 효과적인 RStudio 활용: RStudio을 극대로 활용하려는 R 개발자를 위한 내용으로 고급 코드 편집, 코드 탐색, 패키지 개발을 다룬다.

저자/역자 소개

[ 저자 서문 ]

RStudio 따라잡기는 R을 위한 유명한 오픈소스 통합개발환경(IDE)의 포괄적인 안내서이다. 6장으로 구성된 내용에서 RStudio를 이용해 재현 가능한 통계연구를 수행하는 방법에 대해서 설명하겠다. 이 책은 자동 리포트 생성, 고급 R코드 편집, 프로젝트 파일 관리, 데이터 가시화 등을 내용으로 한다.


[ 저자 소개 ]

마크 P.J. 판 데르 루(Mark P.J. van der Loo)
네덜란드 네이메헌대학교 이론화학연구원에서 박사학위를 받았다. 2007년 이후로 네덜란드 통계청의 통계방법론 부서에서 연구를 하고 있다. 관심연구분야는 데이터 정제 방법과 전산통계업무 자동화다. 네덜란드 통계청에서 지역 R전문센터를 담당하며, R을 이용한 전산통계에 대해 사용자들을 교육하고 지원하고 있다. 수년 동안 R을 교육해왔고 CRAN에서 다운로드할 수 있는 R패키지(editrules, deducorrect, rspa, extremevalues)를 만든 공동개발자다. 저술 목록은 웹사이트(www.markvanderloo.eu)에서 볼 수 있다.

에드윈 데 용에(Edwin de Jonge)
네덜란드 통계청에서 15년 이상 근무해 왔다. 이론과 전산고체물리학 석사학위를 받은 후 전산통계부서에서 업무를 시작했다. 현재는 통계방법론 부서에서 연구를 하고 있다. 관심연구분야는 데이터 시각화, 데이터 분석, 전산통계다. R을 이용한 그래픽 분석 워크샵에서 150명 이상의 사람들을 교육시켰으며, CRAN에서 다운로드할 수 있는 R패키지(tabplot, tabplotd3, ffbase, whisker, editrule, deducorrect)를 만든 공동개발자다.


[ 옮긴이의 말 ]

소셜미디어가 발전함에 따라, 우리의 일상생활에 적용해 분석해볼 만한 무궁무진한 영역들이 웹에서 나날이 늘어나고 있다. 이제는 누구든지 분석기술만 있으면 다양한 오픈소스를 활용해 데이터에 숨겨진 다양한 인사이트를 찾아볼 수 있는 시대가 되었다. 이러한 현상의 중심에 R 언어가 있다. 실제로 최근에 전세계적으로 유명한 연구기관에서 주목해야 할 데이터 분석 분야의 여러 가지 기술 중 하나로 R을 했다는 사실은 이를 입증해 준다고 할 수 있다.

벨 연구소에서 개발한 S 언어에서 시작된 R은 1993년 뉴질랜드 오클랜드대학교의 통계학과 교수인 로버트 젠틀맨과 로스 이하카에 의해 개발된 이후 1997년 GNU 프로젝트를 시작하게 되었고 데이터 분석 분야에서 단기간에 다양한 사용자를 끌어들인 오픈소스 통계 프로그래밍 언어다.

이미 200만 명의 분석가들이 사용 중인 R은 현재 전 세계적으로 매우 강력한 커뮤니티를 형성하고 있다. 또한 다양한 분야에 종사하는 분석 전문가들이 개발한 분석 알고리즘을 R 패키지 형태로 제공하고 있다. 워낙 다양한 분야의 분석가들이 사용하고 있기 때문에 적용 사례도 그만큼 많고, R이 제공하는 분석 기능으로 대부분의 분석 문제를 해결할 수 있을 정도다.

R은 오픈소스라는 특성으로 인해 저렴한 가격으로 복잡한 데이터 분석 문제를 해결하는 장점이 있다. 이에 따라 R은 현재 세계 최고의 데이터분석가를 위한 분석 도구로 인정받음으로써, 외국에서는 이미 통계 분석 분야에 있어 표준 언어로 자리매김을 한 것으로 보인다. 국내에서도 최근 빅데이터와 함께 많은 주목을 받으며 실제로 많은 분야에서 사용되고 있다.

R의 가장 큰 특징은 콘솔 화면의 인터프리터에서 스크립트를 입력해 분석을 수행하는 방식이다. 이로 인해 기존의 화려한 GUI 분석 툴에 익숙한 사용자들이 배우기에 어려운 점이 있다. 따라서 초보자들이 좀더 쉽고 효율적으로 사용하게 하기 위해 R GUI 툴 개발 프로젝트가 추진 중이며, 현재 다양한 툴(RStudio, R Commander, rattle, Red-R 등)이 소개되고 있다.

이 책은 R을 좀더 효율적으로 이용하기 위한 RStudio를 사용법을 소개하는 책이다. RStudio는 R 분석 과정에서 발생하는 다양한 업무를 쉽고 효율적으로 실행하게 하는 강력한 R 기반 통합개발환경(IDE)이다.

RStudio의 대표적인 특징으로는 첫째, R과 같은 오픈소스라는 점이고 둘째, 멀티 플랫폼을 지원하기 때문에 윈도우, 리눅스, 맥에서 동일한 환경으로 작업할 수 있다. 셋째, 코드 일반적인 통합개발환경 도구가 지원하는 자동완성 기능을 제공하며 넷째, 코드 소스, R콘솔, 작업공간, 그래프를 한 화면에 정리해 볼 수 있다는 장점을 들 수 있다. 그리고 다섯째로는 RStudio에서 R로 데이터 분석을 하고 보고서까지도 편리하게 작성할 수 있는 기능을 제공하기 때문에 분석의 모든 작업을 RStudio에서 수행할 수 있다. 마지막으로 Rstudio를 리눅스 서버에 서버 버전을 설치하면 웹 브라우저로 서버에 접속해 서버에서 작업하는 환경과 동일하게 RStudio를 이용할 수 있는 기능을 제공한다는 장점이 있다. 이런 빼어난 장점들로 인해 좀더 효율적인 업무 방식을 찾고자 하는 데이터 분석가들로부터 많이 사용된다.

따라서 이 책은 데이터 분석가를 대상으로 RStudio를 설치하는 방법을 시작으로 스크립터 작성, R 콘솔 사용하기, 데이터 보기, 플로팅, R프로젝트 관리, 보고서 작성, 함수와 패키지 만들기 등의 분석 과정에서 발생하는 다양한 업무에서 RStudio를 사용하는 방법을 간단한 예를 들어가며 이해하기 쉽게 설명해준다.

현장에서 다양한 데이터를 분석해 보면서, 데이터 분석이라는 업무는 분석 방법도 중요하지만 무엇보다도 분석 대상에 대해 올바른 지식을 갖고 이해하며 분석을 수행하는 것이 가장 중요하다는 점을 느꼈다. 그만큼 데이터 분석 업무는 한 가지 기술이 아닌 다양한 분야에 대한 지식을 필요로 하고 이를 응용해 문제를 해결하는 기술이라고 생각한다. 다행히도 최근 이런 분야의 중요성이 높아감에 따라, 대학에서 다양한 과정이 개설되고 있으며, 기업에서도 데이터 분석 분야 전문가들에 관심을 갖는다는 점은 이 분야에서 일하는 사람으로서 상당히 고무적인 현상이라고 생각한다.

데이터 분석 관련 연구 분야는 앞으로가 더욱 기대되는 영역이며 지금도 끊임없이 새로운 분석 방법과 분석 분야가 생겨나고 있다. 이러한 사실은 이 분야의 전문가들이 끊임없이 새로운 것을 배우고 적용하여 해당 기술을 체득해야 함을 의미한다. 그런 점에서 RStudio와 R을 이용해 새로운 기술을 이해하고 다양한 분야에 적용해 보는 시도를 멈추지 않기를 바라며 그 과정에서 이 책이 큰 도움이 되기를 희망한다.


[ 옮긴이 소개 ]

정사범
산업공학을 전공했으며 현재는 LG전자 생산기술원에서 제품 개발과 생산 과정에서 발생되는 다양한 데이터를 분석하기 위한 데이터 마이닝 알고리즘 연구 및 소프트웨어를 개발하고 있다. 특히 최근에는 비정형화된 데이터를 분석해 제품 개발 지식을 체계화하기 위한 방법에 대해 관심이 많으며, 해당 연구에 노력을 기울이고 있다.

목차

목차
  • 1장 시작하기
    • 한눈에 보는 RStudio
    • RStudio 설치
      • R 설치
        • 윈도우와 맥 OS X에서 R 설치
        • 리눅스에서 R 설치
    • 소스코드를 이용한 R 빌드
    • 윈도우에서 R 빌드
    • RStudio 설치
      • RStudio 서버 설치
      • R 패키지 설치
    • 개요 : 첫 번째 R세션
      • 단축키
      • 도움말 찾기
        • RStudio 제거
    • 추가 참고 도서
    • 요약

  • 2장 R 스크립트 작성과 R 콘솔
    • R에 근접하기
    • R 콘솔의 기능
      • 실행 명령
      • 명령 이력
      • 명령어 완성
        • 함수와 매개변수 완성
        • 객체 완성
        • 파일 이름 완성
      • 콘솔용 단축키
    • 소스편집기의 기능
      • R 스크립트 편집
        • 구문 강조
        • 들여쓰기
        • 주석 달기
        • 찾기와 바꾸기
      • 코드 접기, 분할, 탐색
        • 코드 접기
        • 코드 탐색
        • 코드 분할
        • 코드 실행
    • 요약
  • 3장 데이터 보기와 플로팅
    • 데이터 보기와 객체 브라우저
    • 플로팅
      • 내보내기
      • 탐색
    • manipulate 패키지를 이용한 대화형 플로팅
      • 조정 함수
      • 더 많은 조정 옵션 이용하기
      • 고급 주제: manipulate로부터 플롯 매개변수 가져오기
    • 요약
  • 4장 R 프로젝트 관리
    • R 프로젝트
      • R 프로젝트 만들기
      • 디렉터리 구조와 파일 조작
    • 버전 관리
      • 버전 관리란
        • GIT 또는 Subversion 설치
      • 단일 개발자 프로젝트를 위한 버전 관리
        • GIT
        • Subversion
    • 팀작업
    • 추가 참고 도서
    • 요약
  • 5장 보고서 생성
    • 보고서 생성을 위한 사전 준비
    • 노트북
      • 노트북 옵션
      • 노트북 게시
    • R 마크다운과 Rhtml
      • R 마크다운 작업순서
      • 확장 예제
      • 마크다운 문법
      • Rhtml
    • 코드 조각
      • 조각 구문과 선택 옵션
        • RMarkdown: .Rmd files
        • Rhtml: .Rhtml files
        • LaTeX: .Rnw files
      • RStudio의 chunk 지원과 단축키
    • LaTeX
    • 추가 참고 도서
    • 요약
  • 6장 효과적인 Rstudio 활용
    • 함수 작성을 위한 추가 기능
      • 함수 추출
      • 함수 탐색
    • 패키지 작성법 소개
      • 전제 조건
      • 기본 구조와 워크플로
      • 패키지 디렉터리 구조 만들기
        • Roxygen2로 함수 문서화
      • devtools로 패키지 구축하기
        • Devtools 패키지에 대한 상세 내용
        • 패키지 게시

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안