실시간 데이터 분석 시스템 (세트)
- 지은이앤톤 츄바킨, 케빈 슈미트, 크리스토퍼 필립스, 니샨트 가르그, 퀸튼 앤더슨, 노만 매트로프
- 옮긴이구형준, 양원국, 조효성, 권정민
- ISBN : 9788960775909
- 98,000원
- 2014년 08월 12일 펴냄 (절판)
- 페이퍼백 | 1,468쪽 | 188*235mm
- 시리즈 : 데이터 과학
판매처
- 현재 이 도서는 구매할 수 없습니다.
책 소개
세트 구성: 전4권
1) 『실전 LOG 분석과 체계적인 관리 가이드: 개발자와 운영자의 트러블슈팅과 보안 담당자의 이상행위 탐지를 위한』
2) 『아파치 Kafka 따라잡기: 확장성과 고가용성을 지닌 메시지 브로커』
3) 『Storm 실시간 빅데이터 분석 플랫폼: 분산 환경과 머신 러닝을 이용한 데이터 처리』
4) 『빅데이터 분석 도구 R 프로그래밍: 데이터 고급 분석과 통계 프로그래밍을 위한』
『실전 LOG 분석과 체계적인 관리 가이드』 소개
『실전 LOG 분석과 체계적인 관리 가이드』은 IT 분야에 종사하는 사람이라면 매우 친숙하지만 소홀히 할 수 있는 로그(log)에 관해 광범위한 내용을 다룬다. 로그의 정의에서 로그 메시지의 종류와 사례연구, 여러 가지 로그 분석 기법과 보고/요약, 로그 관련 도구의 이해와 활용방법, 로깅과 법규 컴플라이언스에 이르기까지 로그라는 주제에 관해 상세히 소개하고 있다. 이 책을 통해 다양한 목적으로 실무에서 로그를 활용할 수 있는 방안을 익힐 수 있다.
이 책에서 다루는 내용
■ 분석, 시각화, 보고 등을 포함한 포괄적인 로그 관리 범위
■ 시스템 운영에서 규정 컴플라이언스까지 다양한 로그 사용방식에 대한 정보 포함
■ syslog-ng와 사고 대응에서 간편히 로그를 얻을 수 있는 실제 상황 사례 연구
■ 보고, 로그 분석 시스템 선정, 로그 분석 시스템 계획, 로그 데이터 정규화와 상관관계 영역에서 실전 가이드 제공
이 책의 대상 독자
컴퓨터 비전 애플리케이션을 구축하기 위해 OpenCV 라이브러리의 사용 방법을 배우고 싶은 C++ 프로그래머 초보에게 적합한 책이다. 또한 컴퓨터 비전 프로그래밍 개념을 알기 원하는 전문 소프트웨어 개발자에게도 안성맞춤이다. 학부 수준 컴퓨터 비전 코스에서 교재로 사용할 수 있으며, 영상처리와 컴퓨터 비전 분야의 석사 과정과 연구자에겐 최고의 참고서다. 이 책은 기본에서 고급 예제까지의 훌륭한 조합을 제공한다. 단, 이 책을 읽으려면 기본적인 C++ 지식은 알고 있어야 한다.
『아파치 Kafka 따라잡기』 소개
아파치 카프카(Apache Kafka)는 오픈소스 메시지 브로커(message broker)로서 확장성과 고가용성을 가지고 분산 기반으로 대용량 데이터를 처리한다. 이러한 아파치 카프카를 실제로 적용하는 데 알아야 할 카프카 활용 사례와 카프카 내부 디자인에 대해 알아본다. 이를 바탕으로 브로커에 데이터를 집어넣는 생산자와 데이터를 가져오는 소비자를 직접 구현해본다. 배치 처리하는 서비스와 스트리밍 처리하는 외부 서비스에 연동하는 법을 배운 후 마지막으로 카프카를 실제 관리하기 위한 도구와 카프카와 연동할 수 있는 서드파티 도구에 대해 알아 본다.
이 책에서 다루는 내용
■ 카프카 다운로드와 빌드
■ 단일 또는 다중 노드 카프카 클러스터 설정과 메시지 전송
■ 내부 디자인과 메시지 압축의 이해
■ 카프카의 리플리케이션 동작 이해
■ 카프카 API를 사용한 생산자와 소비자 작성
■ 소비자 설정 개요
■ 아파치 하둡과 스톰을 카프카와 연동
■ 카프카 관리 도구 사용
이 책의 대상 독자
『아파치 Kafka 따라잡기』의 독자는 실전에서 아파치 카프카 사용에 대해 알기를 원하는 사람이다. 아파치 카프카나 비슷한 기술에 대한 사전 경험이 없는 사람을 주요 독자 대상으로 삼았다. 또한, 기업용 애플리케이션 개발자이나 기타 발행 구독 기반의 시스템을 다뤘지만, 차후 확장성 있는 솔루션으로 아파치 카프카를 도입하기를 고려하는, 빅데이터에 관심이 많은 개발자들을 위해 집필했다.
『Storm 실시간 빅데이터 분석 플랫폼』 소개
아파치 스톰(Apache Storm)은 분산 환경에서 사용할 수 있는 실시간 빅데이터 분석 플랫폼이다. 분산 환경에서 카산드라(Cassandra), 카프카(Kafka) 등과 같은 다양한 데이터베이스와 연동할 수 있는 기능과 다양한 프로그램 언어로 실시간 데이터 분석 알고리즘을 적용할 수 있어 다양한 프로그램 개발자에게 빅데이터 분석의 장에 참여할 수 있도록 유도하고 있다. 아울러 스택오버플로우(stackoverflow), 소스포지(source forge), 깃허브(github), 그리고 아파치 스톰 커뮤니티를 통해 실질적인 빅데이터 분석 개발에서 마주할 수 있는 문제를 해결할 때 강력한 문제 해결 능력을 제공하고 있어 스톰을 배울 절호의 기회가 될 것이다.
이 책에서 다루는 내용
■ 개발 환경 구축과 이를 이용한 스톰 클러스터 테스트
■ 규칙 기반 데이터 프로세싱 단계를 포함한 데이터 스트림 처리
■ 분산 원격 절차 호출 구축
■ 자바, 클로저, 루비, C++를 이용한 다중 언어 스톰 토폴로지 배포
■ 카산드라와 하둡을 스톰과 연동
■ 캐스케이딩을 이용한 배치 프로세스 기반 용어 중요도 연산 알고리즘 구현
■ 예측 카운팅 모델과 분류 모델의 생성과 설치
■ 스톰을 클라우드에 지속적 통합과 설치에 대한 문제 해결
이 책의 대상 독자
실시간 프로세싱에 관심이 있거나 실시간 프로세싱 개발을 할 때 쓰는 스톰의 사용 방법을 학습하려는 개발자에게는 이상적인 책이다. 이 책은 독자가 자바 개발자라고 가정한다. 클로저, C++, 루비 등의 개발 경력이 있다면 유용하지만 필수적인 사항은 아니다. 하둡이나 유사한 기술에 대한 경력이 있으면 상당히 도움이 된다.
『빅데이터 분석 도구 R 프로그래밍』 소개
『빅데이터 분석 도구 R 프로그래밍』은 통계 프로그래밍 언어인 R의 활용과 R을 사용한 소프트웨어 개발, R의 언어적 측면까지 쉽게 배울 수 있는 R에 관한 최고의 책. 통계학을 잘 몰라도 프로그래밍에 관한 초보적인 지식만 있다면 쉽게 익힐 수 있다. 이 책에서는 R에서 사용하는 기본적인 데이터 구조부터 함수형 프로그래밍과 객체지향 프로그래밍 개념, 수학적 시뮬레이션, 그리고 복잡한 데이터를 단순하고 유용한 형태로 재배치하는 R의 활용법 등에 대한 내용까지 다양하게 다룬다.
이 책에서 다루는 내용
■ 복잡한 데이터 세트와 함수를 시각화하는 예술적인 그래프 만들기
■ 병렬 R과 벡터화를 통한 좀더 효율적인 코드 작성
■ 코드 속도 및 기능 향상을 위한 R과 C/C++, 파이썬과의 인터페이스
■ 텍스트 분석, 이미지 수정 등을 위한 패키지 찾기
■ 개선된 디버깅 기술을 활용해 귀찮은 버그 찾아 고치기
이 책의 대상 독자
많은 사람이 R을 주로 임시변통으로 사용한다. 히스토그램을 그리거나 회귀분석을 한다든가, 통계 기능 등 다양한 용도로 사용하는 식이다. 그러나 이 책은 R로 소프트웨어를 개발하는 사람들을 위해 기획됐다. 이 책은 전문적인 소프트웨어 개발자부터 대학에서 프로그래밍 수업을 한 번쯤 들어 본 사람까지 모두를 대상으로 한다. 그 중에서도 ‘특정한 목적을 갖고 R 코드를 작성하려는 사람’이라면 꼭 읽어야 할 책이다. 하지만 어려운 통계학 지식은 그다지 필요하지 않다.
이 책은 다음과 같은 사람들에게 도움이 될 것이다.
■ 병원이나 정부 기관에서 일하면서 정기적으로 통계 보고서를 작성해야 하고 이를 자동화한 프로그램을 개발하려는 분석가
■ 새로이 혹은 기존 방식의 절차를 통합해 통계 방법론을 개발, 이를 코드화해 일반 연구 커뮤니티에서 쓰려는 학계 연구원
■ 마케팅, 소송 지원, 언론, 출판, 그 외 복잡한 데이터를 표현하는 그래픽 코드를 개발해야 하는 관련 전문가
■ 통계 분석이 포함된 프로젝트를 진행하는 소프트웨어 개발 경험이 있는 전문 프로그래머
■ 통계 컴퓨팅 수업을 듣는 학생
목차
목차
- 『실전 LOG 분석과 체계적인 관리 가이드』
- 1장 로그와 나무, 숲: 전체 그림
- 2장 로그
- 3장 로그 데이터 소스
- 4장 로그 저장 기법
- 5장 사례 연구: syslog-ng
- 6장 비밀 로깅
- 7장 분석 목표와 계획, 준비, 검색 대상
- 8장 간단한 분석 기법
- 9장 필터링과 정규화, 상관 관계
- 10장 통계적 분석
- 11장 로그 데이터 마이닝
- 12장 보고와 요약
- 13장 로그 데이터 시각화
- 14장 로깅 법칙과 실수
- 15장 로그 분석과 수집 도구
- 16장 로그 관리 절차: 로그 검토, 대응, 단계적 보고
- 17장 로깅 시스템 공격
- 18장 프로그래머를 위한 로깅
- 19장 로그와 컴플라이언스
- 20장 로그 분석 시스템 계획
- 21장 클라우드 로깅
- 22장 로그 표준과 미래 동향
- 『아파치 Kafka 따라잡기』
- 1장 카프카 소개
- 2장 카프카 설치
- 3장 카프카 클러스터 설정
- 4장 카프카 디자인
- 5장 생산자 작성
- 6장 소비자 작성
- 7장 카프카 연동
- 8장 카프카 도구
- 『Storm 실시간 빅데이터 분석 플랫폼』
- 1장 개발 환경 설정
- 2장 로그 스트림 프로세싱
- 3장 트라이던트를 이용한 어휘 중요도 측정
- 4장 분산 원격 절차 호출
- 5장 다중언어 토폴로지
- 6장 스톰과 하둡의 통합
- 7장 실시간 머신 러닝
- 8장 지속적인 배포
- 9장 AWS를 활용한 스톰 구동
- 『빅데이터 분석 도구 R 프로그래밍』
- 1장 시작하기
- 2장 벡터
- 3장 행렬과 배열
- 4장 리스트
- 5장 데이터 프레임
- 6장 팩터와 테이블
- 7장 R 프로그래밍 구조
- 8장 R에서 수학과 시뮬레이션 하기
- 9장 객체 지향 프로그래밍
- 10장 입력과 출력
- 11장 문자열 처리
- 12장 그래픽
- 13장 디버깅
- 14장 성능 향상: 속도와 메모리
- 15장 타 언어와 R을 인터페이스하기
- 16장 병렬 R
- 부록 AR 설치하기
- 부록 B 패키지 설치 및 사용