Top

Splunk 7 에센셜 3/e [데이터셋 활용, 보고서 제작, 강력한 정보 공유를 통한 머신 데이터 파헤치기]

  • 원서명Splunk 7 Essentials - Third Edition: Demystify machine data by leveraging datasets, building reports, and sharing powerful insights (ISBN 9781788839112)
  • 지은이J-P 콘트레라스(J-P Contreras), 에릭슨 델가도(Erickson Delgado), 벳시 페이지 시그먼(Betsy Page Sigman)
  • 옮긴이이미정
  • ISBN : 9791161752983
  • 24,000원
  • 2019년 05월 07일 펴냄
  • 페이퍼백 | 248쪽 | 188*235mm
  • 시리즈 : acorn+PACKT, 데이터 과학

책 소개

소스 코드 파일은 여기에서 내려 받으실 수 있습니다.

요약

스플렁크는 머신 데이터용 검색, 보고, 분석 소프트웨어 플랫폼으로서, 현재 전 세계 여러 기업에 도입돼 데이터에서 가치를 찾는 일에 핵심적으로 사용되고 있다. 이 책은 스플렁크 7의 기본 기능을 능숙하게 사용하고자 하는 초보자를 대상으로 한다. 스플렁크에 대한 사전 지식이 없어도 충분히 따라갈 수 있도록 쉽게 서술됐다. 데이터에서 인사이트를 얻고자 하는 데이터/비즈니스 분석가 또는 시스템 관리자를 위한 책이다.

이 책에서 다루는 내용

■ 스플렁크 설치 및 설정 방법
■ 스플렁크 인덱스를 사용한 이벤트 데이터 저장, 소스로 이벤트 분류, 데이터 필드 추가 방법
■ 스플렁크 검색 처리 언어의 기본 명령어와 모범 사례
■ 강력한 실시간 대시보드, 사용자 입력 대시보드 생성 방법
■ 경고와 예약 보고서를 통한 주도적 대응 방법
■ 페즈의 조언: 스플렁크 기능과 애드온을 활용한 모범 사례
■ 조직 단위로 스플렁크 도입 시 보안 및 배포와 관련된 고려 사항
■ 스플렁크 온라인 커뮤니티에서 제공하는 풍부한 자료 활용 방법

이 책의 대상 독자

스플렁크 7이 제공하는 기능을 능숙하게 사용하고자 하는 초보자를 대상으로 한다. 데이터/비즈니스 분석가나 시스템 관리자가 되고 싶다면, 바로 이 책이 정답이다. 스플렁크에 대한 사전 지식은 필요하지 않다.

이 책의 구성

1장, ‘스플렁크 시작하기’에서는 스플렁크를 조직에 도입할 때 필요한 기본 개념을 다룬다. 다양한 스플렁크 커뮤니티와 온라인 에코시스템에 대해 언급한다.
2장, ‘데이터 가져오기’에서는 포워더(forwarder), 인덱스(index), 이벤트(event), 이벤트 타입(event type), 필드(field), 소스(source), 소스타입(sourcetype)과 같은 필수 개념을 배운다.
3장, ‘검색 처리 언어’에서는 데이터 분석을 위한 검색 명령어의 사용법을 다룬다.
4장, ‘보고서, 경고, 검색 최적화’에서는 이벤트 타입을 사용해 데이터를 분류하는 방법과 룩업을 사용해 데이터를 보완하는 방법, 태그로 데이터를 정규화하는 방법을 설명한다.
5장, ‘동적 대시보드 만들기’에서는 토큰을 검색 패널에 적용하는 방법을 통해 완전한 기능을 갖춘 폼 기반 대시보드(form-based dashboard)를 만들어본다. 이를 통해 입력 내용을 변경하면 대시보드 데이터가 영향을 받도록 만들 수 있다.
6장, ‘데이터 모델과 피벗’에서는 직관적인 피벗 편집기를 사용해 영역 차트, 원형 차트, 시계열 스파크라인이 포함된 단일값 등 세 가지 시각화 차트를 만들어본다.
7장, ‘HTTP 이벤트 수집기’에서는 HTTP 이벤트 수집기(HTTP event collector), HEC에 대해 설명하고, 이를 활용해 애플리케이션에서 스플렁크로 직접 데이터를 전송하는 방법을 알아본다.
8장, ‘모범 사례 및 고급 쿼리’에서는 고급 스플렁크 사용자를 위한 기술들을 소개한다.
9장, ‘스플렁크 도입하기’에서는 이제까지 이 책에서 언급한 내용들을 조직에 적용해볼 수 있는 방안에 대해 설명한다.

저자/역자 소개

지은이의 말

스플렁크는 머신 데이터용 검색, 보고, 분석 소프트웨어 플랫폼이다. IT 운영, 정보보안, 사물인터넷(IoT, Internet of Things) 같은 분야에서 점점 더 많은 조직이 정보에 입각한 의사 결정을 내리기 위해 스플렁크를 도입하고 있다.
이 책은 머신 데이터로부터 분석 결과와 보고서를 얻고자 하는 모든 사람을 대상으로 한다. 처음 두 장에서는 스플렁크 설치 방법과 샘플 머신 데이터 생성기인 Eventgen의 설정방법을 간단하게 설명한다. 그런 다음 머신 데이터를 검색하고 필드를 추가해서 분석 결과를 통해 가치를 찾아내는 방법을 설명하고, 이후 다양한 보고서(report)와 대시보드(dashboard), 경고(alert)를 만드는 방법을 소개한다. 또한 현업 사용자를 위한 스플렁크만의 데이터 모델생성 기능인 피벗(Pivot)을 소개하는데, 이 기능을 사용해서 포인트-앤-클릭(point-and-click) 방식으로 쉽게 데이터를 시각화하는 방법을 설명한다.
그리고 스플렁크의 강력한 기능 중 하나인 HTTP 이벤트 수집기(HTTP event collector)를 테스트해본다. 스플렁크의 핵심 기능들을 다루고 난 후에는 실제 스플렁크를 모범적으로 사용하는 사례와 더불어 이 책에서 배운 내용을 토대로 스플렁크를 구축하는 방법과 관련된 정보를 소개한다. 이 책 곳곳에 페즈의 조언(Tips from the Fez)이라는 단락을 구성해서 SplunkTrust 커뮤니티 회원의 견해와 모범적인 적용 사례에 대한 권고안을 참고하도록 했다.

지은이 소개

J-P 콘트레라스(J-P Contreras)

스플렁크 공인 관리자이자 영업 엔지니어로 20년 이상 고급 데이터 분석 솔루션과 성과 평가 솔루션을 고객에게 제안하는 일을 하고 있다. 그가 조직한 컨설팅 팀이 수상한 이력이 있으며, 기업이 데이터 분석을 통해 통찰을 얻도록 지원하고 있다.
현재는 고객이 스플렁크를 직접 구축하고 스플렁크 커뮤니티가 제공하는 모든 자료를 활용할 수 있게 돕고 있다. 2001년 시카고에 있는 드폴대학 켈스타트 경영대학원(DePaul University's Kellstadt Graduate School of Business)에서 전자 상거래로 MBA를 받았다. 드폴대학의 평생 교육 프로그램에서 교육을 담당하고 있으며 드폴대학의 드리하우스 경영대학원(Driehaus School of Business) 자문위원회 회원이다.

에릭슨 델가도(Erickson Delgado)

데이터 마이닝과 데이터 분석을 좋아하는 엔터프라이즈 아키텍트다. 스플렁크 버전 4.0부터 지금까지 스플렁크를 사용해오고 있다. 필리핀의 스타트업과 협력해 오픈소스 인프라 구축을 지원했다.
파이썬(Python)과 노드JS(node.js)을 활용한 애플리케이션 개발 경험이 있으며, Go와 C/C++를 통한 복구 프로그래밍에 관심이 많다. 최근 몇 년간 데브옵스(DevOps)를 업무에 적용하는 데 힘쓰고 있다. 바다 낚시, 산악 자전거, 로봇 제작, 여행 등으로 스트레스를 풀고, 현재 올랜도에 거주 중이다.

벳시 페이지 시그먼(Betsy Page Sigman)

워싱턴 DC 조지타운대학(Georgetown University) 맥도너 경영대학원(McDonough School of Business)의 저명한 교수다. 지난 16년간 통계, 프로젝트 관리, 데이터베이스, 전자 상거래 분야의 강의를 맡아 왔으며, 우수 강의로 수상한 이력이 있다.
그 전에는 조지메이슨대학(George Mason University)에 몸담았다. 최근에는 에 글을 기고했다. 기술 문제와 빅데이터에 대한 언론 평론가로도 활동하고 있다.

옮긴이의 말

스플렁크를 한 문장으로 정의하자면 "머신 데이터의 수집, 저장, 분석, 시각화를 위한 단일 플랫폼" 입니다. 문자 그대로 날마다 새로운 기술, 새로운 소프트웨어가 쏟아지고 사라지는 요즘 같은 시대에, 스플렁크는 단일 플랫폼으로 15년간 꾸준히 성장가도를 달리고 있는 흔치 않은 솔루션입니다. (2003년에 이미 빅데이터의 시대를 예견한 소프트웨어였다니, 놀랍지 않으신가요?) 시대의 흐름을 놓치지 않으면서 데이터 플랫폼 본연의 역할에 집중하는, 빅데이터 플랫폼 분야에서 독보적인 소프트웨어라 할 수 있습니다. 또한 스플렁크가 제공하는 유연성과 확장성은 비슷한 역할을 하는 많은 소프트웨어와 스플렁크를 구분 짓는 가장 큰 장점이 아닐까 합니다. 스플렁크의 사상 역시 강조하고 싶습니다. 스플렁크라는 단일 플랫폼 안에서 데이터가 수집되고, 저장되며, 분석을 거쳐 시각적으로 가치 있는 결과가 반환되는 과정을 경험해본 사용자는(그것도 매우 짧은 시간 안에) 스플렁크의 매력에 흠뻑 빠질 수 밖에 없을 것이라고 감히 확신합니다.
자의든 타의든 여러 목적으로 이 책을 펼쳤을 독자 여러분을 응원합니다. 스플렁크에 처음 입문하시는 분에게 이 책은 좋은 출발점이 될 것입니다. 원서는 버전 7.0.1을 기준으로, 이 책은 7.2.5 버전을 기준으로 번역했습니다. 버전이 높아지면서 책에 실린 UI 와 실제 화면이 약간 다를 수 있지만 내용을 이해하는 데는 무리가 없을 것으로 생각합니다. 또한 대부분의 국내 독자가 한국어 OS를 사용할 것이라는 판단 하에, 한글 버전의 웹 페이지를 기준으로 번역을 했습니다(스플렁크 화면은 OS 언어 설정을 따라갑니다). 때때로 한글 웹 화면의 메뉴나 설정 화면에 자동으로 번역된 어색한 한국어는 교정하지 않고 화면상에 보이는 그대로 옮겼습니다. 웹 브라우저 URI 에서 koKR 을 enUS로 변경하면 영문 웹 페이지로 전환할 수 있으니 참고하시길 바랍니다. 특정 주제에 대해 깊이 있는 내용을 알고 싶으시다면, 스플렁크 공식 메뉴얼을 찾아보시길 권합니다. 영문이라는 치명적인 단점이 있지만 체계적으로 정리된 방대한 문서들은 스플렁크를 깊이 이해하는 데 큰 도움이 될 것입니다.

옮긴이 소개

이미정

성균관대학교 전자전기 컴퓨터공학부를 졸업하고, 한동대학교 정보통신공학 석사학위를 이수했다.
삼성전자 LSI 사업부를 시작으로, 오라클, 한컴MDS, 인포메티카를 거쳐 현재 스플렁크 코리아의 세일즈 엔지니어로 재직 중이다. 에이콘출판사에서 출간한 『Pig를 이용한 빅데이터 처리 패턴』(2014), 『Splunk 6 핵심 기술』(2015), 『빅데이터 마이닝』(2017), 『파이썬으로 배우는 대규모 머신 러닝』(2017)을 번역했다.

목차

목차
  • 1장. 스플렁크 시작하기
    • 스플렁크 계정
      • 스플렁크 계정 생성하기
    • Windows에 스플렁크 설치하기
    • Linux에 스플렁크 설치하기
      • 처음으로 로그인하기
      • 간단한 검색 실행하기
    • 스플렁크 앱 만들기
    • Eventgen으로 데이터 생성하기
      • CLI로 Eventgen 설정하기
    • 스플렁크 제어하기
    • Eventgen 설정하기
    • Destinations 앱 살펴보기
    • 첫 번째 대시보드 만들기
    • 요약

  • 2장. 데이터 가져오기
    • 스플렁크와 빅데이터
      • 스트리밍 데이터
      • 분석 데이터 지연
      • 데이터의 희소성
    • 스플렁크 데이터 소스
      • 머신 데이터
      • 웹 로그
      • 데이터 파일
      • 소셜 미디어 데이터
      • 관계형 데이터베이스 데이터
      • 그 외 데이터 종류
    • 인덱스 생성하기
    • 버킷
    • 로그 파일 입력하기
    • 스플렁크 이벤트와 필드
    • 새로운 필드 추출하기
    • 요약

  • 3장. 검색 처리 언어
    • 검색의 구조
      • 검색 파이프라인
    • 시간 수정자
    • 검색 결과 필터링하기
    • 검색 명령어 - stats
    • 검색 명령어 - top/rare
    • 검색 명령어 - chart와 timechart
    • 검색 명령어 - eval
    • 검색 명령어 - rex
    • 요약

  • 4장. 보고서, 경고 및 검색 최적화
    • 이벤트 타입을 활용한 데이터 분류
    • 태그를 활용한 데이터 표준화
    • 룩업을 활용한 데이터 보강
    • 보고서 생성과 스케줄링
    • 경고 생성하기
    • 검색과 보고서 가속화
    • 스케줄링 옵션
    • 요약 인덱싱
    • 요약

  • 5장. 동적 대시보드
    • 효과적인 대시보드 만들기
    • 대시보드 종류
      • 비즈니스 요구사항 파악하기
      • 동적 폼 기반 대시보드
      • 패널 옵션
      • 칼럼 오버레이 조합형 차트 - 조회 대 응답 시간
    • 폼 입력
    • 시간 범위 입력 만들기
    • 라디오 입력 만들기
    • 드롭다운 입력 생성하기
    • 정적 실시간 대시보드
      • 색상 범위가 있는 단일값 패널
      • 복제를 통해 패널 생성하기
      • 추세선이 있는 단일값 패널
      • 선이 오버레이된 실시간 칼럼 차트
    • 단계구분도 만들기
    • 요약

  • 6장. 데이터 모델과 피벗
    • 데이터 모델 만들기
      • 객체에 속성 추가하기
      • 자식 객체 만들기
      • 정규 표현식을 기반으로 속성 생성하기
    • 데이터 모델 가속화
      • 피벗 편집기
      • 피벗과 차트 만들기
      • 영역 차트 만들기
      • 원형 차트 만들기
      • 추세선 스파크라인이 있는 단일값
    • 대시보드 재배치하기
    • 요약

  • 7장. HTTP 이벤트 컬렉터
    • HEC란?
    • 데이터가 HEC로 전달되는 방법
      • 데이터 로깅하기
      • 데이터와 함께 토큰 사용하기
      • 데이터 요청 보내기
      • 토큰 검증하기
      • 데이터 인덱싱하기
    • 요약

  • 8장. 모범사례 및 고급 쿼리
    • 테스트를 위한 인덱스
    • 인덱스 내에서 검색하기
    • 제한된 시간 범위 내에서 검색하기
    • 고속 모드를 통한 빠른 검색
    • 이벤트 샘플링 사용하기
    • fields 명령어를 사용해 검색 성능 향상시키기
    • 고급 검색
      • 하위 검색
      • append 사용하기
      • join 사용하기
      • eval 및 if 사용하기
      • case 함수와 함께 eval 및 match 사용하기
    • 요약

  • 9장. 스플렁크 도입하기
    • 조직에서 일반적으로 활용되는 사례
      • IT 운영
      • 사이버 보안
      • 소프트웨어 개발 및 지원 업무
      • 사물인터넷
    • 스플렁크 아키텍처 고려 사항
      • 조직에 도입하기 위한 스플렁크 아키텍처
      • 포워더
      • 스플렁크 클라우드
      • 스플렁크 가격 모델
    • 스플렁크 커뮤니티 및 온라인 자료

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안