Top

Splunk 실시간 운영 인텔리전스 [기업용 환경 구축을 위한]

  • 원서명Splunk Operational Intelligence Cookbook (ISBN 9781849697842)
  • 지은이조쉬 다이쿤(Josh Diakun), 폴 존슨(Paul R Johnson), 데릭 모크(Derek Mock)
  • 옮긴이양원국
  • ISBN : 9788960777248
  • 35,000원
  • 2015년 06월 25일 펴냄
  • 페이퍼백 | 456쪽 | 188*235mm
  • 시리즈 : acorn+PACKT, 데이터 과학

책 소개

요약

실시간 운영 데이터에서 가치를 뽑아내는 운영 인텔리전스 플랫폼의 대표 주자인 스플렁크(Splunk)를 실제 실무에서 볼 수 있을 법한 예제 데이터를 사용해 설명함으로써 스플렁크를 적용하는 일을 한층 더 쉽게 만들어 주고 강력한 스플렁크 엔터프라이즈의 기능을 바로 체감하게 해준다.

이 책에서 다루는 내용

■ 운영 인텔리전스 데이터 검색, 리포트화, 시각화
■ 참조와 워크플로우를 사용해 운영 데이터의 가치를 높임
■ 모델 데이터 가속화, 피봇 기반의 리포트 작성
■ 실시간 경고, 스크립트 경고 등의 인텔리전스 중심의 경고 구축
■ 장기 추세, 리포트, 분석 데이터 요약화
■ 제대로 동작하는 스플렁크 운영 인텔리전스 애플리케이션 구축
■ 고급 자바스크립트 차트를 연동하고 스플렁크 API 사용

이 책의 대상 독자

초보자에서 숙련자까지 스플렁크 엔터프라이즈 플랫폼을 가치 있는 운영 인텔리전스 도구로 사용하려는 모든 사람을 대상으로 한다. 책의 예제는 모든 업무 영역(IT, 보안, 생산, 마케팅 등)에 종사하는 사람들의 흥미를 끌 수 있을 것이다.
이 책에 담긴 예제는 모든 사람이 쉽게 따라갈 수 있도록 쓰였고 초보자에게 쉽지 않은 개념과 기능을 차근차근 알려준다. 기능에 대해 더 알고 싶다면 스플렁크 엔터프라이즈의 모든 기능에 대해 알려주는 방대한 문서가 http://docs.splunk.com/Documentation/Splunk에 있으니 찾아보길 바란다.
정규식을 사용하고 파이썬이나 XML 언어를 이용하는 부분이 있을 수도 있다. 이런 개념을 꼭 알아둬야 하는 건 아니지만 알고 있으면 유익할 수 있다.

이 책의 구성

1장 ‘시작: 데이터 입력’에서는 스플렁크로 데이터를 넣는 다양한 방법을 소개한다. 파일과 디렉터리로부터 데이터 수집, TCP/UDP 포트 입력, 유니버셜 포워더(Universal Forwarder), 스크립트 사용과 모듈러 입력 등을 다룬다. 책 전체에서 참조할 데이터 집합을 소개하고 각 예제에서 사용할 예제 데이터를 만드는 법을 알려줄 것이다.

2장 ‘데이터 파고들기: 검색과 리포트’에서는 첫 예제 세트를 소개한다. 1장에서 소개한 데이터를 기반으로, 스플렁크 SPL을 사용해 데이터를 검색하는 법을 안내하는 예제와 정보를 제공한다. 필드 추출, 필드 값에 기반을 둔 범용 이벤트 묶기, table, top, chart, stats 명령을 사용한 기본 리포트를 만들 것이다.

3장 ‘대시보드와 시각화: 가치 있는 데이터 제공’에서는 3장의 예제 결과로 만들 수 있는 리포트를 기반으로 시각화를 구축하는 법을 안내한다. 스플렁크의 강력한 시각화를 통해 데이터와 리포트에 생명을 불어넣어 본다. 단일 값, 차트(바, 파이, 라인, 영역) 스캐터 차트, 게이지 차트를 소개한다.

4장 ‘운영 인텔리전스 애플리케이션 구축’에서는 3장에서 다룬 시각화에 대한 이해를 바탕으로 대시보드 개념을 소개한다. 이번 장의 예제에서는 대시보드의 목적에 대한 윤곽을 그리고 대시보드를 적절히 사용하는 법을 알려준다. 대시보드 편집기로 대시보드를 만들고 이벤트 데이터 검색 폼을 만드는 등의 작업을 한다.

5장 ‘인텔리전스 확장: 데이터 모델과 피봇’에서는 트랜잭션, 서브 검색, 동시성, 연관 등 고급 검색 명령어와 함께, 좀 더 깊이 있는 내용을 소개한다. 여러 소스에서 얻은 데이터를 집중화하고 여러 이벤트 데이터 간의 관계를 알아내는 능력을 얻게 된다.

6장 ‘파고들기: 고급 검색’에서는 분석할 데이터를 확장하는 목적의 워크플로우 액션과 참조(lookup)의 개념을 소개한다. 예제에서 주요 기능을 적용할 수 있게 하여 데이터 분석에 대한 이해를 넓혀준다.

7장 ‘데이터 확장: 참조와 워크플로우’에서는 실시간 경고(real-time alert)와 일정 경고(scheduled alert)가 운영 인텔리전스와 감시를 완성하는 핵심 자산이 되는지 설명한다. 사전 대응 경고의 개념과 장점을 소개하고 언제 적용해야 최선인지 알려준다. 이전 장들에서 얻은 지식을 기반으로 경고를 생성하는 방법을 알아본다.

8장 ‘사전 대응 준비: 경고 생성’에서는 가속 리포트를 위한 요약 인덱스의 개념을 설명하고 비즈니스 인사이트를 얻는 데 드는 시간을 줄여본다. 요약 인덱스로 리포트 속도를 높이고 집중 통계 정보를 장기 보관하는 일반적 상황에 대한 예제를 간단히 소개한다.

9장 ‘인텔리전스 속도 향상: 데이터 요약화’에서는 스플렁크 엔터프라이즈 6 버전에서 추가된 새롭고 강력한 기능 두 가지를 소개한다. 데이터 모델과 피봇 도구다. 데이터 모델 구축의 개념과 피봇 도구를 사용해 구축한 모델을 바탕으로 정보 리포트를 빠르게 설계하는 법을 알아본다.

10장 ‘그 밖의 내용: 사용자화, 웹 프레임워크, REST API, SDK’는 책의 마지막 장으로, 스플렁크의 강력한 네 가지 기능을 소개한다. 스플렁크로 강력하고 풍부한 상호작용 경험을 만들어준다. 핵심 스플렁크 기능을 뛰어넘는 가능성을 열어주고 강력한 D3 시각화를 사용해 자신만의 운영 인텔리전스 애플리케이션을 만드는 법을 알려준다. 그 외 스플렁크 REST API 질의 방법과 스플렁크 SDK로 검색을 실행하는 기본 파이썬 애플리케이션에 대해서도 알아본다.

저자/역자 소개

지은이의 말

장비(machine)에서 엄청난 양의 데이터를 만들어내는 기술 중심의 세계에서 스플렁크는 빅데이터 지능화 플랫폼인 스플렁크 엔터프라이즈로 업계를 이끌어왔다. 강력한 스플렁크 엔터프라이즈 플랫폼을 사용해 누구든지 장비 데이터를 실질적인 가치를 가진 정보로 만들어낼 수 있다. 이 책은 독자에게 스플렁크를 안내하고, 데이터에서 가치 있고 강력한 운영 인텔리전스를 끌어내는 스플렁크 엔터프라이즈 6의 다양한 기능에 대한 실무 지식을 가져다 줄 것이다.
쉽게 따라 할 수 있는 단계별 예제를 사용해 독자의 환경에서 얻을 수 있는 운영 데이터를 효과적으로 모으고 분석하며 리포트를 만드는 방법을 알려줄 것이다. 정보 리포트를 신속히 전달하고 스플렁크 엔터프라이즈의 다양한 시각화를 적용해 대시보드로 데이터를 의미 있게 보여주는 법을 설명하는 예제들을 담고 있다. 이 책의 마지막에서는 강력한 운영 지능화 애플리케이션을 구축하고 스플렁크 엔터프라이즈 플랫폼에 있는 다양한 주요 기능을 적용해볼 것이다.
이 책과 이 책에서 소개하는 쉽게 따라 할 수 있는 예제는 스플렁크 엔터프라이즈 플랫폼과 운영 인텔리전스의 장점을 소개하고 가르치는 데 활용할 수도 있다.

지은이 소개

조쉬 다이쿤(Josh Diakun)

데이터 기반 운영 프로세스에 힘쓰는 IT 운영 및 보안 전문가다. 엔터프라이즈급 IT 환경 관리와 설계 부문에서 10년 이상의 경험을 쌓았다. 지난 5년 동안 보안과 운영 인텔리전스 플랫폼으로 스플렁크를 적용하는 일을 관리해왔다. 가장 최근에는 데이터 인텔리전스 솔루션과 서비스를 제공하는 벤처인 디스커버드 인텔리전스(Discovered Intelligence)를 설립하는 일을 도왔다. 또한 스플렁크 토론토 사용자 모임의 공동창립자다.

폴 존슨(Paul R Johnson)

정보 보안, 운영, 컴플라이언스 영역에서 데이터 정보에 대한 10년 이상의 경력을 쌓았다. 데이터 인텔리전스 서비스와 솔루션 전문 회사인 디스커버 인텔리전스를 돕고 있다. 포춘 선정 10대 기업에서 IT 위험 정보 위원회를 이끌었고 전 세계 스플렁크 적용을 관리했다. 스플렁크 토론토 사용자 모임의 공동 창립자로, 캐나다 토론토에서 일하며 살고 있다.

데릭 모크(Derek Mock)

소프트웨어 개발자이자 설계자이고 통합 커뮤니케이션과 클라우드 기술 전문가다. 대기업 규모의 구축과 SaaS 애플리케이션 운용 및 개발에 대한 15년 이상의 경험을 가지고 있다. 지난 4년 동안 운영 인텔리전스를 이룩하는 중심 도구로 스플렁크를 이용해왔다. 스플렁크 토론토 사용자 모임의 공동 창립자로, 캐나다 토론토에서 일하며 살고 있다.

옮긴이의 말

최근 빅데이터 분야가 주목을 끌며 데이터의 가치에 대한 관심이 높아지면서 큰 수혜를 입은 회사 중 하나가 스플렁크다. 빅데이터 분석 방식을 사용하려면, 실제 가지고 있는 데이터양에 상관없이 인프라를 구성하고 관리하는 데 기본적으로 일정 수준 이상의 지식이 요구되고 데이터 사용자가 데이터로 가치를 얻어내기 위해 새롭게 배워야 할 부분이 많다. 그러나 빅데이터 방법론을 반드시 사용해야 할 정도로 실제 이용하는 데이터의 양이 큰 경우는 생각보다 많지 않다.
스플렁크는 일반 데스크톱 프로그램과 유사한 방식으로 설치한다. 데이터를 입력해 실제로 데이터를 이용하는 경험을 손쉽게 얻을 수 있고, 마찬가지로 실제 기업용 환경에 구축해 사용해보기도 쉽다. 또한 커뮤니티 기반의 플러그인과 자체 제공 플러그인을 활용해 사용 영역을 쉽게 확장할 수 있으며 하둡이나 다른 NoSQL 또는 기존 레거시와 쉽게 연동할 수 있다.
스플렁크는 효과적인 UI와 파이프 기반의 직관적 언어, 잘 짜인 작업 흐름을 가지고 있어 사용하기 쉽다. 심지어 사용자가 몇 번의 클릭만으로 데이터에서 리포트를 만들어낼 수 있다. 특히 이처럼 사용 장벽이 낮기 때문에 데이터 사용자가 데이터 이용법을 배우는 것에 노력을 낭비하는 대신, 데이터에서 가치를 끌어내는 데 더욱 집중하게 해준다는 것이 가장 큰 장점이다.
실시간 운영 데이터 분석을 통해 가치를 끌어내려는 조직이라면 스플렁크 사용을 반드시 고려해봐야 할 것이다.

옮긴이 소개

양원국

티맥스소프트에서 APM 솔루션을 개발했고 그 후 빅데이터 전문회사인 KT NexR에 근무하면서 대량 데이터 처리에 오픈소스 기술을 적용하고 운용하는 업무를 맡았다. 현재는 프리랜서로 활동 중이다. 역서로는 『아파치 Kafka 따라잡기』(에이콘출판, 2014), 『Hadoop과 Solr을 이용한 기업용 검색 시스템 구축』(에이콘출판, 2014), 『하이브 완벽 가이드』(공역)(한빛미디어, 2013), 전자책 『처음 시작하는 임팔라』가 있다.

목차

목차
  • 1장 시작: 데이터 입력
    • 소개
    • 파일과 디렉터리 인덱싱
    • 네트워크 포트로 데이터 수집
    • 스크립트 입력 사용
    • 모듈러 입력사용
    • 유니버셜 포워더를 사용해 데이터 수집
    • 책의 예제 데이터 적재
    • 필드 추출 정의
    • 이벤트 타입과 태그 정의
    • 요약

  • 2장 데이터 파고들기: 검색과 리포트
    • 소개
    • 원본 데이터를 읽을 수 있게 하기
    • 가장 많이 접속한 웹 페이지 찾기
    • 가장 많이 사용하는 웹 브라우저 찾기
    • 가장 많이 참조한 웹사이트 식별
    • 웹 페이지 응답 코드 도표화
    • 웹 페이지 응답시간 통계 보이기
    • 가장 많이 조회한 상품 목록
    • 애플리케이션의 기능 성능 도표화
    • 애플리케이션 메모리 사용률 도표화
    • 총 데이터베이스 연결 수 계산
    • 요약

  • 3장 대시보드와 시각화: 가치 있는 데이터 제공
    • 소개
    • 운영 인텔리전스 대시보드 생성
    • 가장 접근을 많이 한 웹 페이지를 파이 차트로 보여주기
    • 순 방문자수 보여주기
    • 게이지를 사용해 에러 발생 횟수 보이기
    • 타입과 호스트별 메소드 요청의 수를 도표화
    • 응답시간, 조회, 메소드 요청 타임 차트 생성
    • 크기와 응답시간이 동떨어진 요청을 식별하는 스캐터 차트 사용
    • 애플리케이션 기능 통계 에어리어 차트 생성
    • 카테고리별 평균 소비시간을 바 차트로 나타내기
    • 시간에 따른 아이템 조회와 구매 라인 차트를 생성
    • 요약

  • 4장 운영 인텔리전스 애플리케이션 구축
    • 소개
    • 운영 인텔리전스 애플리케이션 생성
    • 대시보드와 리포트 추가
    • 대시보드를 더 효과적으로 배치
    • 동적으로 활성 리포트에서 드릴다운
    • 웹 활동을 검색하는 폼 만들기
    • 웹 페이지 활동 리포트를 폼에 연결
    • 방문자의 위치를 지도로 보여주기
    • 대시보드 PDF 배달 일정 만들기
    • 요약

  • 5장 인텔리전스 확장: 데이터 모델과 피봇
    • 소개
    • 웹 접근 로그 데이터 모델 생성
    • 애플리케이션 로그 데이터 모델 만들기
    • 데이터 모델 가속화
    • 총 판매 트랜잭션 피봇
    • 지정학적 위치로 구매 피봇
    • 가장 느린 웹 페이지 응답 피봇
    • 상위 에러 코드 차트 피봇
    • 요약

  • 6장 파고들기: 고급 검색
    • 소개
    • 웹사이트의 평균 세션 시간 계산
    • 다중 티어 웹 요청의 평균 실행시간 계산
    • 최대 동시 체크아웃 나타내기
    • 웹 요청 관계 분석
    • 웹사이트 트래픽양 예측
    • 크기가 정상이 아닌 웹 요청 찾기
    • 잠재 세션 위장 식별
    • 요약

  • 7장 데이터 확장: 참조와 워크플로우
    • 소개
    • 제품 코드 설명 참조
    • 수상한 IP 주소 표시
    • 세션 상태 테이블 생성
    • IP 주소로 호스트 이름 추가
    • 주어진 IP 주소에 대한 ARIN 검색
    • 주어진 에러에 대해 구글 검색
    • 애플리케이션 에러 티켓 생성
    • 외부 테이터베이스로부터 인벤토리 찾기
    • 요약

  • 8장 사전 대응 준비: 경고 생성
    • 소개
    • 비정상적인 웹 페이지 응답시간 경고
    • 체크아웃 중 에러를 실시간으로 경고
    • 비정상 사용자 행동 경고
    • 실패를 경고하고 스크립트 대응 발생
    • 예상 판매가 재고를 초과할 때 경고
    • 요약

  • 9장 인텔리전스 속도 향상: 데이터 요약화
    • 소개
    • 시간 주기로 세션 카운트 계산 대 완료한 트랜잭션 카운트 계산
    • 도시별 구매 수 되채움
    • 시간에 따른 최대 동시 세션 수 표시
    • 요약

  • 10장 그 밖의 내용: 사용자화, 웹 프레임워크, REST API, SDK
    • 소개
    • 애플리케이션 탐색기 사용자화
    • 웹 히트 힘 방향 그래프 추가
    • 제품 구매 히트맵 달력 추가
    • 유일한 페이지 조회를 구하는 스플렁크 REST API 원격 질의
    • 유일한 IP 주소를 반환하는 파이썬 애플리케이션 생성
    • 제품 이름을 포맷하는 사용자 검색 명령어 만들기
    • 요약

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안