데이터 과학: 어떤 기존 시스템 또는 계획 중인 시스템에서 데이터와 데이터의 흐름을 체계적으로 조사하는 것을 안내하는 도서 시리즈입니다.

R을 활용한 기계 학습: 지은이 - 브레트 란츠 옮긴이 - 전철욱 35,000원 | 2014년 09월 30일 펴냄; 이 책은 R이 제공하는 다양한 확률, 통계 기법을 모두 사용할 수 있을 뿐만 아니라 사용법도 쉽기 때문에 누구나 데이터를 분석하고 예측할 수 있게 한다. 손쉬운 CRAN을 통해 라이브러리를 설치는 다양한 라이브러리가 필요한 기계 학습에 매우 적합하다. 저자는 다양하고 흥미로운 실제 연구 데이터로 예제를 만들어 화려한 기법 소개보다 정확한 개념과 과정을 설명함으로써 어려운 개념을 쉽게 이해할 수 있게 한다.

주키퍼 ZooKeeper: 지은이 - 플라이보 융케이라 외 1명 옮긴이 - 한연수, 박용준 28,000원 | 2014년 08월 29일 펴냄; 우리가 매일 이용하는 수많은 응용프로그램은 대부분 분산 시스템하에서 운영되고 있다. 아파치 주키퍼(Apache ZooKeeper)는 핵심 분산 컴퓨팅 개념을 비롯해 견고한 분산 시스템을 쉽게 구성하기 위해 만들어졌다. 이 책은 이런 분산 시스템에 대한 배경지식과 함께 마스터-워커(master-worker) 예제를 통해 주키퍼 API 사용 방법, 와처(watcher) 사용 방법, 장애 처리 방법 등을 다룬다. 또한 주키퍼가 동작하는 과정을 이해할 수 있도록 내부 구조에 대한 설명을 제공해 효과적인 주키퍼 사용과 운영 방법에 대해 설명한다

d3.js를 이용한 데이터 시각화: 지은이 - 스위첵 텔러 옮긴이 - 오명운 20,000원 | 2014년 08월 14일 펴냄; d3.js는 현재 웹에서 가장 각광받는 언어인 자바스크립트로 만들어진 오픈소스 데이터 시각화 라이브러리다. 이 책은 d3.js를 사용하기 위한 환경의 구축에서부터, 간단한 예제를 통한 d3.js의 기본 개념 해설, 화려한 데이터 시각화를 만드는 고급 기법까지 설명하고 있어, 자바스크립트를 알고 있는 모든 분을 데이터 시각화의 세계로 친절하게 안내해 줄 것이다. 데이터 시각화에 관심을 갖고 있고 자바스크립트를 조금이라도 아는 사람이라면 누구에게나 아주 좋은 길잡이가 될 책이다.

실시간 데이터 분석 시스템 (세트): 지은이 - 앤톤 츄바킨 외 5명 옮긴이 - 구형준 외 3명 98,000원 | 2014년 08월 12일 펴냄; ★ 세트 구성: 전4권 ★ 1) 『실전 LOG 분석과 체계적인 관리 가이드: 개발자와 운영자의 트러블슈팅과 보안 담당자의 이상행위 탐지를 위한』 2) 『아파치 Kafka 따라잡기: 확장성과 고가용성을 지닌 메시지 브로커』 3) 『Storm 실시간 빅데이터 분석 플랫폼: 분산 환경과 머신 러닝을 이용한 데이터 처리』 4) 『빅데이터 분석 도구 R 프로그래밍: 데이터 고급 분석과 통계 프로그래밍을 위한』

하둡 맵리듀스 최적화와 튜닝: 지은이 - 칼레드 타니어 옮긴이 - 김현준 14,000원 | 2014년 07월 23일 펴냄; 오픈소스인 하둡(Hadoop)에서, 클러스터 구성 및 최적화는 사용자의 기술과 경험적인 영향을 많이 받는다. 맵리듀스(MapReduce)의 경우 하위 인프라에 추가로 수행될 맵리듀스 애플리케이션과 데이터, 사용자의 특성까지 고려하여 구성하고 튜닝해야 한다. 이 책에는 맵리듀스와 맵리듀스의 성능에 대해 개괄하고, 맵리듀스 클러스터 최적화 구성, 리소스 병목을 찾아내고 해결하는 저자의 소중한 노하우가 담겨있으며, 맵리듀스 애플리케이션과 데이터에 따른 맵리듀스의 각 단계별 상세한 튜닝법을 설명한다. 아울러 맵리듀스 애플리케이션 개발자가 반드시 숙지하고 있어야 할 코딩 기술과, 사용자의 맵리듀스 애플리케이션 성능을 극대화 할 수 있는 다양한 시스템 관련 튜닝(OS, JVM, GC, I/O 등)과 체크리스트, 그리고 애플리케이션 성능과 개발자의 생산성을 함께 높일 수 있는 맵리듀스 템플릿 코드를 제공한다.

R과 Knitr를 활용한 데이터 연동형 문서 만들기: 지은이 - 고석범 40,000원 | 2014년 04월 30일 펴냄; 이 책은 R 언어와 니터(Knitr) 패키지를 사용하여, ‘재현 가능한 연구(reproducible research)’ 방법으로 인쇄물, 웹 페이지, 웹 프리젠테이션, 웹 애플리케이션 등의 다양한 데이터 문서와 자료를 만드는 방법을 소개한다. 이 책에서 설명하는 모든 문서와 자료는 데이터와 다이내믹하게 연동되어 움직이고, 원래의 데이터와 결론에 이르는 과정을 투명하고 일관되게 보여줄 수 있다.

빅데이터에서 천금의 기회를 캐라: 지은이 - 빌 프랭크스 옮긴이 - 전정순 25,000원 | 2014년 03월 31일 펴냄; 조직 내에 빅데이터를 활용하는 의사결정 문화를 뿌리내리고 싶은 사람들에게 테라데이타(Teradata)의 최고분석책임자인 빌 프랭크스(Bill Franks)가 들려주는 빅데이터 입문서. 빅데이터를 다루는 데 필요한 도구와 프로세스, 기법 등 기술적 측면과 빅데이터를 효과적으로 활용하는 데 필요한 사람과 조직구조, 혁신과 발견을 장려하는 조직 문화 등 조직적 측면을 균형 있게 서술한 책이다. 이 책을 통해 빅데이터 활용을 어떻게 시작해야 할지, 어디에 가장 중점을 두어야 할지, 피해야 할 함정이나 조직에서 부닥칠 문제는 무엇인지 등 실무적인 조언을 얻을 수 있다.

The R Book (Second Edition) 한국어판: 지은이 - 마이클 크롤리(Michael J. Crawley) 옮긴이 - 정사범, 권정민 55,000원 | 2014년 03월 31일 펴냄; 빅데이터 시대에 가장 범용적으로 사용되는 통계 언어인 R의 기초부터 활용까지 전반적인 내용과 상세한 예제를 다룬 책이다. 이 책에서는 R을 이용하여 데이터 처리에 필요한 기초문법과 그래픽부터 가설 검정, 회귀분석, 분산 분석, 다변량 분석, 시계열 분석, 생존 분석, 베이지안 통계 등의 고급 분석까지 폭 넓게 다루고 있다. 이 책 한 권으로 R언어 초보자부터 전문가까지 누구나 필요로 하는 데이터 처리와 분석에 대한 다양한 정보를 습득할 수 있다. 특히 각 주제에 대한 분석방법을 상세한 예제코드와 함께 소개하고 있어 데이터 분석 기술과 R 프로그래밍 기술을 쉽게 익히고 실행하여 볼 수 있다.

R과 Shiny 패키지를 활용한 웹 애플리케이션 개발: 지은이 - 크리스 비일리 옮긴이 - 고석범 13,000원 | 2014년 02월 28일 펴냄; 샤이니(Shiny) 패키지는 환상적인 데이터 분석 능력을 가진 R의 기능을 그대로 확장하여, R 언어만으로도 쉽고 빠르면서도 강력한 웹 애플리케션을 만들 수 있는 기능을 제공한다. 웹과 R의 기능을 동시에 갖춘 샤이니 앱을 이용하면 데이터에 담긴 스토리를 이해관계에 있는 수많은 사람들과 효율적으로 공유할 수 있다. 어렵지 않다. 바로 시작할 수 있다. 특히, 이 책에는 초보자를 위해 R과 RStudio를 설치하는 방법과 RStudio에서 샤이니 앱 개발을 손쉽게 시작할 수 있는 한국어판 특별 부록도 수록했다.

정보 스토리지와 관리 Information Storage and Management: 지은이 - EMC교육사업부 옮긴이 - 김기성 40,000원 | 2014년 01월 23일 펴냄; 정보 스토리지는 기업의 IT 인프라의 핵심 요소로 매우 다양한 IT 기술을 접목한 분야다. 이 책은 하드웨어 장비뿐만 아니라 데이터 처리를 위한 소프트웨어 솔루션도 공급하는 업체인 EMC에서 스토리지 교육을 위해 기술한 책으로 스토리지 기술의 전반적인 내용을 다룬다.

하둡과 빅데이터 분석 실무: 지은이 - 조나단 오웬스 외 2명 옮긴이 - 안건국, 이정림 30,000원 | 2013년 10월 31일 펴냄; 따라하며 배울 수 있는 하둡을 활용한 빅데이터 분석 실무에 대한 좋은 참고서!

데이터 마이닝 Data Mining: 지은이 - 이안 위튼 외 2명 옮긴이 - 이승현 48,000원 | 2013년 06월 28일 펴냄; 기계 학습에 관한 완벽한 설명과 기계 학습 도구를 실질적인 데이터 마이닝 사례에 적용할 수 있는 노하우를 배울 수 있는 책

데이터의 미학 Beautiful Data: 지은이 - 토비 세가란 외 1명 옮긴이 - 공상휘 35,000원 | 2013년 06월 28일 펴냄; 여러 분야의 데이터 처리에 대한 다양한 시도에 직접 참여한 전문가들이 들려주는 새로운 데이터 처리 기술과 활용 경험

R과 RStudio를 활용한 빅데이터 분석 (세트): 지은이 - 노만 매트로프 외 2명 옮긴이 - 권정민, 정사범 45,000원 | 2013년 05월 31일 펴냄; 『빅데이터 분석 도구 R 프로그래밍』과 『RStudio 따라잡기』를 하나로 묶은 세트 도서