Splunk 실시간 운영 인텔리전스 [기업용 환경 구축을 위한]
- 원서명Splunk Operational Intelligence Cookbook (ISBN 9781849697842)
- 지은이조쉬 다이쿤(Josh Diakun), 폴 존슨(Paul R Johnson), 데릭 모크(Derek Mock)
- 옮긴이양원국
- ISBN : 9788960777248
- 35,000원
- 2015년 06월 25일 펴냄
- 페이퍼백 | 456쪽 | 188*235mm
- 시리즈 : acorn+PACKT, 데이터 과학
책 소개
요약
실시간 운영 데이터에서 가치를 뽑아내는 운영 인텔리전스 플랫폼의 대표 주자인 스플렁크(Splunk)를 실제 실무에서 볼 수 있을 법한 예제 데이터를 사용해 설명함으로써 스플렁크를 적용하는 일을 한층 더 쉽게 만들어 주고 강력한 스플렁크 엔터프라이즈의 기능을 바로 체감하게 해준다.
이 책에서 다루는 내용
■ 운영 인텔리전스 데이터 검색, 리포트화, 시각화
■ 참조와 워크플로우를 사용해 운영 데이터의 가치를 높임
■ 모델 데이터 가속화, 피봇 기반의 리포트 작성
■ 실시간 경고, 스크립트 경고 등의 인텔리전스 중심의 경고 구축
■ 장기 추세, 리포트, 분석 데이터 요약화
■ 제대로 동작하는 스플렁크 운영 인텔리전스 애플리케이션 구축
■ 고급 자바스크립트 차트를 연동하고 스플렁크 API 사용
이 책의 대상 독자
초보자에서 숙련자까지 스플렁크 엔터프라이즈 플랫폼을 가치 있는 운영 인텔리전스 도구로 사용하려는 모든 사람을 대상으로 한다. 책의 예제는 모든 업무 영역(IT, 보안, 생산, 마케팅 등)에 종사하는 사람들의 흥미를 끌 수 있을 것이다.
이 책에 담긴 예제는 모든 사람이 쉽게 따라갈 수 있도록 쓰였고 초보자에게 쉽지 않은 개념과 기능을 차근차근 알려준다. 기능에 대해 더 알고 싶다면 스플렁크 엔터프라이즈의 모든 기능에 대해 알려주는 방대한 문서가 http://docs.splunk.com/Documentation/Splunk에 있으니 찾아보길 바란다.
정규식을 사용하고 파이썬이나 XML 언어를 이용하는 부분이 있을 수도 있다. 이런 개념을 꼭 알아둬야 하는 건 아니지만 알고 있으면 유익할 수 있다.
이 책의 구성
1장 ‘시작: 데이터 입력’에서는 스플렁크로 데이터를 넣는 다양한 방법을 소개한다. 파일과 디렉터리로부터 데이터 수집, TCP/UDP 포트 입력, 유니버셜 포워더(Universal Forwarder), 스크립트 사용과 모듈러 입력 등을 다룬다. 책 전체에서 참조할 데이터 집합을 소개하고 각 예제에서 사용할 예제 데이터를 만드는 법을 알려줄 것이다.
2장 ‘데이터 파고들기: 검색과 리포트’에서는 첫 예제 세트를 소개한다. 1장에서 소개한 데이터를 기반으로, 스플렁크 SPL을 사용해 데이터를 검색하는 법을 안내하는 예제와 정보를 제공한다. 필드 추출, 필드 값에 기반을 둔 범용 이벤트 묶기, table, top, chart, stats 명령을 사용한 기본 리포트를 만들 것이다.
3장 ‘대시보드와 시각화: 가치 있는 데이터 제공’에서는 3장의 예제 결과로 만들 수 있는 리포트를 기반으로 시각화를 구축하는 법을 안내한다. 스플렁크의 강력한 시각화를 통해 데이터와 리포트에 생명을 불어넣어 본다. 단일 값, 차트(바, 파이, 라인, 영역) 스캐터 차트, 게이지 차트를 소개한다.
4장 ‘운영 인텔리전스 애플리케이션 구축’에서는 3장에서 다룬 시각화에 대한 이해를 바탕으로 대시보드 개념을 소개한다. 이번 장의 예제에서는 대시보드의 목적에 대한 윤곽을 그리고 대시보드를 적절히 사용하는 법을 알려준다. 대시보드 편집기로 대시보드를 만들고 이벤트 데이터 검색 폼을 만드는 등의 작업을 한다.
5장 ‘인텔리전스 확장: 데이터 모델과 피봇’에서는 트랜잭션, 서브 검색, 동시성, 연관 등 고급 검색 명령어와 함께, 좀 더 깊이 있는 내용을 소개한다. 여러 소스에서 얻은 데이터를 집중화하고 여러 이벤트 데이터 간의 관계를 알아내는 능력을 얻게 된다.
6장 ‘파고들기: 고급 검색’에서는 분석할 데이터를 확장하는 목적의 워크플로우 액션과 참조(lookup)의 개념을 소개한다. 예제에서 주요 기능을 적용할 수 있게 하여 데이터 분석에 대한 이해를 넓혀준다.
7장 ‘데이터 확장: 참조와 워크플로우’에서는 실시간 경고(real-time alert)와 일정 경고(scheduled alert)가 운영 인텔리전스와 감시를 완성하는 핵심 자산이 되는지 설명한다. 사전 대응 경고의 개념과 장점을 소개하고 언제 적용해야 최선인지 알려준다. 이전 장들에서 얻은 지식을 기반으로 경고를 생성하는 방법을 알아본다.
8장 ‘사전 대응 준비: 경고 생성’에서는 가속 리포트를 위한 요약 인덱스의 개념을 설명하고 비즈니스 인사이트를 얻는 데 드는 시간을 줄여본다. 요약 인덱스로 리포트 속도를 높이고 집중 통계 정보를 장기 보관하는 일반적 상황에 대한 예제를 간단히 소개한다.
9장 ‘인텔리전스 속도 향상: 데이터 요약화’에서는 스플렁크 엔터프라이즈 6 버전에서 추가된 새롭고 강력한 기능 두 가지를 소개한다. 데이터 모델과 피봇 도구다. 데이터 모델 구축의 개념과 피봇 도구를 사용해 구축한 모델을 바탕으로 정보 리포트를 빠르게 설계하는 법을 알아본다.
10장 ‘그 밖의 내용: 사용자화, 웹 프레임워크, REST API, SDK’는 책의 마지막 장으로, 스플렁크의 강력한 네 가지 기능을 소개한다. 스플렁크로 강력하고 풍부한 상호작용 경험을 만들어준다. 핵심 스플렁크 기능을 뛰어넘는 가능성을 열어주고 강력한 D3 시각화를 사용해 자신만의 운영 인텔리전스 애플리케이션을 만드는 법을 알려준다. 그 외 스플렁크 REST API 질의 방법과 스플렁크 SDK로 검색을 실행하는 기본 파이썬 애플리케이션에 대해서도 알아본다.
목차
목차
- 1장 시작: 데이터 입력
- 소개
- 파일과 디렉터리 인덱싱
- 네트워크 포트로 데이터 수집
- 스크립트 입력 사용
- 모듈러 입력사용
- 유니버셜 포워더를 사용해 데이터 수집
- 책의 예제 데이터 적재
- 필드 추출 정의
- 이벤트 타입과 태그 정의
- 요약
- 2장 데이터 파고들기: 검색과 리포트
- 소개
- 원본 데이터를 읽을 수 있게 하기
- 가장 많이 접속한 웹 페이지 찾기
- 가장 많이 사용하는 웹 브라우저 찾기
- 가장 많이 참조한 웹사이트 식별
- 웹 페이지 응답 코드 도표화
- 웹 페이지 응답시간 통계 보이기
- 가장 많이 조회한 상품 목록
- 애플리케이션의 기능 성능 도표화
- 애플리케이션 메모리 사용률 도표화
- 총 데이터베이스 연결 수 계산
- 요약
- 3장 대시보드와 시각화: 가치 있는 데이터 제공
- 소개
- 운영 인텔리전스 대시보드 생성
- 가장 접근을 많이 한 웹 페이지를 파이 차트로 보여주기
- 순 방문자수 보여주기
- 게이지를 사용해 에러 발생 횟수 보이기
- 타입과 호스트별 메소드 요청의 수를 도표화
- 응답시간, 조회, 메소드 요청 타임 차트 생성
- 크기와 응답시간이 동떨어진 요청을 식별하는 스캐터 차트 사용
- 애플리케이션 기능 통계 에어리어 차트 생성
- 카테고리별 평균 소비시간을 바 차트로 나타내기
- 시간에 따른 아이템 조회와 구매 라인 차트를 생성
- 요약
- 4장 운영 인텔리전스 애플리케이션 구축
- 소개
- 운영 인텔리전스 애플리케이션 생성
- 대시보드와 리포트 추가
- 대시보드를 더 효과적으로 배치
- 동적으로 활성 리포트에서 드릴다운
- 웹 활동을 검색하는 폼 만들기
- 웹 페이지 활동 리포트를 폼에 연결
- 방문자의 위치를 지도로 보여주기
- 대시보드 PDF 배달 일정 만들기
- 요약
- 5장 인텔리전스 확장: 데이터 모델과 피봇
- 소개
- 웹 접근 로그 데이터 모델 생성
- 애플리케이션 로그 데이터 모델 만들기
- 데이터 모델 가속화
- 총 판매 트랜잭션 피봇
- 지정학적 위치로 구매 피봇
- 가장 느린 웹 페이지 응답 피봇
- 상위 에러 코드 차트 피봇
- 요약
- 6장 파고들기: 고급 검색
- 소개
- 웹사이트의 평균 세션 시간 계산
- 다중 티어 웹 요청의 평균 실행시간 계산
- 최대 동시 체크아웃 나타내기
- 웹 요청 관계 분석
- 웹사이트 트래픽양 예측
- 크기가 정상이 아닌 웹 요청 찾기
- 잠재 세션 위장 식별
- 요약
- 7장 데이터 확장: 참조와 워크플로우
- 소개
- 제품 코드 설명 참조
- 수상한 IP 주소 표시
- 세션 상태 테이블 생성
- IP 주소로 호스트 이름 추가
- 주어진 IP 주소에 대한 ARIN 검색
- 주어진 에러에 대해 구글 검색
- 애플리케이션 에러 티켓 생성
- 외부 테이터베이스로부터 인벤토리 찾기
- 요약
- 8장 사전 대응 준비: 경고 생성
- 소개
- 비정상적인 웹 페이지 응답시간 경고
- 체크아웃 중 에러를 실시간으로 경고
- 비정상 사용자 행동 경고
- 실패를 경고하고 스크립트 대응 발생
- 예상 판매가 재고를 초과할 때 경고
- 요약
- 9장 인텔리전스 속도 향상: 데이터 요약화
- 소개
- 시간 주기로 세션 카운트 계산 대 완료한 트랜잭션 카운트 계산
- 도시별 구매 수 되채움
- 시간에 따른 최대 동시 세션 수 표시
- 요약
- 10장 그 밖의 내용: 사용자화, 웹 프레임워크, REST API, SDK
- 소개
- 애플리케이션 탐색기 사용자화
- 웹 히트 힘 방향 그래프 추가
- 제품 구매 히트맵 달력 추가
- 유일한 페이지 조회를 구하는 스플렁크 REST API 원격 질의
- 유일한 IP 주소를 반환하는 파이썬 애플리케이션 생성
- 제품 이름을 포맷하는 사용자 검색 명령어 만들기
- 요약