Top

[빅데이터 분석과 최적화를 위한]
Splunk 6 핵심 기술

  • 원서명Mastering Splunk (ISBN 9781782173830)
  • 지은이제임스 밀러(James Miller)
  • 옮긴이이미정
  • ISBN : 9788960777156
  • 33,000원
  • 2015년 05월 29일 펴냄
  • 페이퍼백 | 364쪽 | 188*235mm
  • 시리즈 : acorn+PACKT, 데이터 과학

책 소개

요약

스플렁크(Splunk)는 점차 증대되는 방대한 양의 머신 데이터를 수집, 분석, 가시화하는 빅데이터를 위한 플랫폼이다. 이 책은 빅데이터를 다루는 데 있어 고급 전략을 학습하기 원하는 스플렁크 개발자를 위한 책으로서, 단순한 ‘따라 하기’ 식의 메뉴얼이 아닌, 상세 기능의 사용 방법뿐만 아니라 그 기능의 동작원리까지 상세하게 설명하는 스플렁크에 관한 실용적인 기술서다.

이 책에서 다루는 내용

■ 스플렁크 마스터가 되기 위해 가장 효과적으로 스플렁크를 시작하는 방법 설명
■ 고급 수준의 스플렁크 검색 문자열을 생성하는 기법
■ 데이터를 구조화하기 위한 고급 테이블, 차트, 필드 활용법
■ 스플렁크 룩업과 이를 엔터프라이즈 개발에 적용하는 방법
■ 데이터로 실용적인 대시보드 제작
■ 스플렁크 인덱스 및 인덱싱과 관련된 마스터 수준의 지식 설명
■ 스플렁크 사용자 정의 앱 제작과 중요성 인식
■ 스플렁크의 데이터 모니터링 및 경고 기능과 그 외 모니터링 툴에서 제공하는 기능 비교
■ 스플렁크 트랜잭션 이해와 데이터 최적화를 위한 트랜잭션의 사용 방안

이 책의 대상 독자

엔터프라이즈 아키텍처 관점에서 빅데이터를 다루는 고급 전략을 학습하기 원하는 스플렁크 개발자를 위한 책이다. 스플렁크에 관한 실용적인 정보를 얻게 될 것이다. 스플렁크에 대한 기본 지식이 있든 없든, 이 책은 전문적인 지식과 일반적인 단계별 스플렁크 솔루션 예제를 제공함으로써 독자를 스플렁크 전문가로 만들어줄 것이다.

이 책의 구성

1장, ‘스플렁크의 활용’에서는 스플렁크가 무엇인지, 그리고 스플렁크가 조직의 아키텍처 로드맵상에서 어떻게 활용될 수 있는지를 설명한다. 스플렁크 기술을 위해 고려해야 하는 표준 혹은 스플렁크의 일반적인 사용 사례와 함께 스플렁크가 발전해온 과정을 논의한다. 마지막으로, 스플렁크가 즉각적으로 적용되는 분야를 소개한다.

2장, ‘고급 검색’에서는 고급 검색과 관련된 내용 및 기술에 대해 설명하고 관련 예제를 함께 제공한다. 검색 연산자, 명령어 포맷과 태그, 서브검색, 매개변수를 이용한 검색, 매크로와 검색 결과를 활용한 효과적인 검색 기법을 중점적으로 다룬다.

3장 ‘테이블, 차트, 필드 정복’에서는 테이블, 차트, 필드를 활용하는 방법을 상세히 설명하고 실제 사례를 함께 제공한다.

4장 ‘룩업’에서는 스플렁크 룩업과 워크플로우를 다루는데, 필드와 스크립트 룩업을 포함한 룩업의 설계와 활용 측면에 대해 심도 있는 논의를 전개한다.

5장, ‘혁신적인 대시보드’에서는 스플렁크 대시보드의 기본 기능을 설명하고, 비즈니스 측면에서 효과적인 대시보드를 만들기 위해 스플렁크가 제공하는 고급 기능을 활용하는 방안을 논의한다.

6장, ‘인덱스와 인덱싱’에서는 인덱싱을 정의하고, 인덱싱의 기능과 중요성을 설명하며, 인덱싱의 기초 개념과 고급 개념을 단계적으로 살펴본다.

7장 ‘앱 개선’에서는 탐색, 검색, 공유 같은 스플렁크 애플리케이션 및 애드온(addon)과 관련된 심화된 내용을 다룬다. 추가 애플리케이션 예제를 찾는 소스도 함께 제공한다.

8장, ‘모니터링과 경고’에서는 스플렁크 기술 중 모니터링과 경고 기능에 대해 설명하고, 스플렁크와 그 외 모니터링 툴을 비교한다.

9장, ‘스플렁크 트랜잭션’에서는 엔터프라이즈 관점에서 스플렁크 트랜잭션을 정의하고 설명한다. 트랜잭션과 트랜잭션 타입, 트랜잭션의 고급 사용법, 트랜잭션의 설정 유형, 이벤트 그룹화, 동시발생 이벤트, 트랜잭션 시 주의사항 등을 다룬다.

10장, ‘엔터프라이즈를 위한 스플렁크’에서는 엔터프라이즈 관점에서 스플렁크를 소개한다. 명명 규칙, 문서화, 비전의 구현 같은 중요한 개발 모범 사례를 자세히 설명한다.

부록, ‘퀵 스타트’에서는 스플렁크 전문가가 되기 위해 활용할 수 있는 다양한 정보(인증 트랙에서부터 회사의 웹사이트와 지원 포털뿐만 아니라 그 외 부가적인 정보)를 제공한다. 또한 최신 스플렁크 버전을 찾고 기본설정으로 설치하는 과정을 함께 살펴본다.

본문에 쓰인 컬러 이미지는 여기에서 내려 받으세요.

저자/역자 소개

저자 서문

스플렁크는 점차 증대되는 방대한 양의 머신 데이터를 관리하는 최적의 기술 솔루션으로서, 온라인 서비스, 교육, 금융, 의료, 물류, 통신 등 빅데이터 분석이 필요한 산업군에서 없어서는 안 될 기술이다. 따라서 다양한 분야와 관련된 스플렁크 경험은 다가올 미래에도 의미 있게 사용될 것이다.

이 책은 먼저 스플렁크의 발전 방향과 조직의 아키텍처 로드맵상에서 스플렁크가 활용되는 방안을 설명한다. 이후 검색과 관련된 내용을 시작으로 스플렁크 테이블, 차트, 필드를 비롯한 기능을 활용하는 방법을 심도 있게 다룬다. 각 장을 거치면서 룩업, 인덱스, 대시보드와 관련된 모범 사례를 숙지하게 될 것이며, 현재 스플렁크 애플리케이션과 이에 대한 모니터링 기능을 발전시키는 방법의 원리를 파악하게 될 것이다. 마지막으로, 엔터프라이즈 관점에서 트랜잭션을 논의하는 것으로 이 책을 마무리한다. 데이터를 최적화하고 조직의 전략적 요구사항을 만족시키기 위해 스플렁크의 고급 기술을 적용하고 통합할 수 있게 될 것이다.

저자 소개

제임스 밀러(James Miller)

IBM이 공인한 유능한 시니어 프로젝트 리더이자 애플리케이션/시스템 아키텍트, 개발자로서 35년간 다양한 애플리케이션/시스템 디자인과 개발을 담당해왔다. 국가 재정 성과 관리(National Financial Practice Management) 수행 책임자, 마이크로소프트 공인 솔루션 전문가, 기술 리더, 기술 교육자, 최고 기술 전도사(practice evangelist) 같은 다양한 직함을 갖고 있다. 비즈니스 인텔리전스, 예측 분석, 웹 아키텍처와 디자인, 업무 분석, GUI 디자인과 테스트, 데이터베이스 모델링 및 시스템 분석 경험이 있으며, 사용자 기반, 서버 기반, 웹 기반, 메인프레임 기반 애플리케이션, 시스템 및 모델의 디자인과 개발에 참여했다.

비즈니스 업무 분석 및 리엔지니어링, 요구사항 문서화, 평가 및 프로젝트 계획/관리, 구조적 평가 및 최적화, 테스트 준비, 자원 관리를 포함한 솔루션 디자인 및 개발과 관련된 모든 일을 주도적으로 담당했다. 메인프레임 시스템(DB2, 로손(Lawson), 그레이트 플레인즈(Great Plains) 등)과 클라이언트/서버 간 혹은 SQL 서버와 웹 기반 애플리케이션 사이의 데이터 이관 같은 ETL 인프라 개발과 엔터프라이즈 및 데이터 소스 통합과 관련된 일에도 참여했다.

또한 온라인 거래 애플리케이션, 웨어하우스 처리 제어 및 관리 시스템, 제어 애플리케이션을 포함한 다양한 웹사이트의 디자인, 개발, QA, 배송을 담당하는 인터넷 애플리케이션 개발 매니저 역할은 물론, 자산가치가 4억 5,000만 달러인 기업의 CFO와 임원진을 위한 웹 기반 재무 보고 시스템의 디자인, 개발, 관리를 담당했다.

프로젝트와 팀 리더, 리더 개발자, 애플리케이션 개발 디렉터 같은 다양한 리더십 역할로서, 여러 가지 기술과 플랫폼을 활용해 많은 자원을 처리하고 관리했다.

『IBM Cognos TM1 Developer’s Certification Guide』의 저자이면서, ‘최고 사례 구축(Establishing a Center of Excellence)’ 등 모범 사례를 다룬 수많은 백서의 저자이기도 하다. 또한 개인적 경험과 업계에서의 모범 사례를 바탕으로 한 수많은 관련 주제의 글을 블로그에 올리고 있다.

옮긴이의 말

2005년 오라일리 미디어(O’Reilly Media)의 시장조사 연구 담당 로저 모갈라스(Roger Mougalas)가 ‘빅데이터’라는 용어를 처음으로 언급하고 연이어 같은 해 구글의 맵리듀스(MapReduce)를 기반으로 한 하둡(Hadoop)이 야후(Yahoo)에 의해 탄생함으로써 빅데이터의 역사가 시작됐다. 그러나 10년이 지난 지금에도 빅데이터에 쏟아지는 열렬하고도 지속적인 관심은, 그에 대한 비즈니스 측면의 기대치에 비해 제대로 된 활용 사례가 많지 않음을 반증하는 것이라 할 수 있다. 물론 IoT, M2M 같은 개념이 등장하면서 빅데이터의 영역이 확장됨에 따라 관심이 증폭됐다는 사실에는 이론의 여지가 없다.

스플렁크(Splunk)에 주목해야 하는 이유가 바로 여기에 있다. 스플렁크가 수집할 수 있는 데이터에는 거의 제한이 없다. 모든 비정형 데이터에 대한 수집은 물론, 분석과 시각화가 가능하다. 하둡은 데이터의 수집과 저장에, R은 데이터 분석에 특화된 솔루션인 반면, 스플렁크는 데이터의 수집, 분석, 시각화를 단일 플랫폼으로 처리할 수 있는 그야말로 빅데이터만을 위한 솔루션인 것이다. 실제 스플렁크는 주로 이기종 장비에서 발생하는 데이터를 다루는 IT 운영, FDS, 보안관제, 산업용 데이터 분석 등 다양한 적용 사례를 보유하고 있으며, IoT, M2M과 관련된 분야에서 역시 광범위하게 사용되고 있다.

이런 시점에서 스플렁크 6.0 버전에 대한 이 책 『Mastering Splunk』를 번역하게 되어 막중한 책임감을 느꼈다. 스플렁크 6.0 버전은 이전 버전에 비해 UI는 물론 인덱스 속도 개선 및 데이터 분석과 관련된 많은 기능이 추가됐으며, 하둡과 클라우드 환경을 지원하도록 발전됐다. 엔지니어라면 누구나 엄지손가락을 높이 치켜들 만큼 만족스러운 솔루션임을 확신하는 고로, 이 책을 통해 스플렁크가 제공하는 많은 기능을 현업에 적용할 수 있는 아이디어를 얻게 되리라 믿어 의심치 않는다.

이 책의 화면은 스플렁크 영어 버전을 기준으로 하고 있으나, 번역 시 스플렁크의 가능한 한 모든 메뉴와 내용은 한국어 버전을 기준으로 병기했다(참고로 스플렁크의 언어 설정은 인터넷 브라우저의 언어 설정에 따른다). 현업에서 실제 영어로 많이 사용되는 단어는 의미 전달이 중요하다는 판단에서 굳이 번역하지 않고 음독했다.

옮긴이 소개

이미정

성균관대 전자, 전기 컴퓨터공학부를 졸업하고, 한동대학교 정보통신공학 석사학위를 이수했다. 삼성전자 LSI 사업부 기술개발실에 근무했으며, 오라클 미들웨어 사업부에서 컨설턴트로 활동했다. 현재는 스플렁크 총판인 MDS 테크놀로지 IS 사업부에서 프리세일즈로 재직 중이다. 에이콘출판사에서 출간한 『Pig를 이용한 빅데이터 처리 패턴』(2014)을 번역 했다.

목차

목차
  • 1장 스플렁크의 활용
  • 스플렁크의 정의
    • 스플렁크 사용을 위한 준비
  • 범용 파일 처리
  • 기밀성과 보안
    • 스플렁크의 발전
  • 일반적인 사용 사례
    • 조사형 검색
    • 모니터링
    • 운영 환경에서의 가시성
    • 의사결정 지원(실시간 분석)
  • 스플렁크 사용 영역의 확장
    • 고객 관계 관리
    • 신기술
    • 지식 발견과 데이터 마이닝
    • 재해 복구
    • 바이러스 방지
    • 정형 데이터의 증대
    • 프로젝트 관리
    • 방화벽 애플리케이션
    • 엔터프라이즈 무선 솔루션
    • 하둡 기술
    • 미디어 조사
    • 소셜 미디어
    • 지리 정보 시스템
    • 모바일 기기 관리
  • 스플렁크의 실제 활용
  • 정리

  • 2장 고급 검색
  • 스플렁크에서의 검색
    • 검색 대시보드
    • 새로운 검색 대시보드
    • 스플렁크 검색 메커니즘
    • 스플렁크 퀵 레퍼런스 가이드
    • 스플렁크 검색 지원 기능
    • 기본적인 최적화
    • 고속 모드? 상세 모드? 아니면 스마트 모드?
    • 명령어 분류
    • 드문 검색과 조밀한 검색의 차이점
    • 연산자, 명령어 포맷, 태그 검색
    • 처리 과정
    • 불린 연산식
    • 인용부호와 이스케이프의 의미
    • 스플렁크에서 태그 달기
    • 트랜잭션 검색
  • 지식 관리
    • 실제 사례
  • 서브검색
    • 서브검색에 대한 출력 설정
    • 검색 작업 검사기
  • 매개변수를 이용한 검색
    • eval 문
  • 스플렁크 매크로
    • 자신만의 매크로 생성하기
    • 자신만의 매크로 사용하기
    • 스클렁크의 한계
  • 검색 결과
  • 기본적인 스플렁크 검색 예제
    • 추가 포맷화
  • 정리

  • 3장 테이블, 차트, 필드 정복
  • 테이블, 차트, 필드
    • 테이블 파헤치기
    • 검색 결과를 차트로 반환하기
  • 스플렁크 버킷화
    • timechart 명령어를 사용해 보고하기
    • timechart 명령어에서 필요한 인자
    • 버킷 시간 간격과 per * 함수
  • 드릴다운
    • 드릴다운 옵션
    • 기본적인 드릴다운 기능
    • 행 드릴다운
    • 셀 드릴다운
    • 차트 드릴다운
    • 범례
  • 피벗
    • 피벗 편집기
    • 피벗 엘리먼트로 작업하기
  • 분할
  • 컬럼 값
  • 피벗 테이블 포맷화
  • 간단한 예제
  • 스파크라인
  • 정리

  • 4장 룩업
  • 소개
  • 간단한 필드 룩업 설정
    • 스플렁크 웹에서 룩업 정의하기
    • 자동 룩업
    • 설정 파일
    • 설정 파일을 사용해 룩업 구현하기: 예제
    • 룩업 테이블 생성
    • dedup로 중복 관리하기
    • 동적 룩업
    • 스플렁크 웹 사용하기
  • 스플렁크 웹 대신 설정 파일 사용하기
    • 시간 기준 룩업
    • 중복 금지
  • 일반적인 명령어 정리
    • lookup 명령어
    • inputlookup과 outputlookup 명령어
    • inputcsv와 outputcsv 명령어
  • 정리

  • 5장 혁신적인 대시보드
  • 효과적인 대시보드 생성
    • 패널
    • 모듈
  • 검색 폼
    • 검색 폼 예제
  • 대시보드로 돌아가기
    • 패널 편집기
    • 시각화 자료 편집기
    • 대시보드 편집기 살펴보기
    • 대시보드 구성
    • 프레임워크 구성
    • 대시보드와 XML
    • 색상 입히기
  • 검색에 대해 더 자세히 알아보기
    • 인라인 검색
  • 동적 드릴다운
  • 실용적인 실시간 솔루션
  • 정리

  • 6장 인덱스와 인덱싱
  • 인덱싱의 중요성
  • 스플렁크 인덱스란?
    • 이벤트 처리
    • 인덱스 조합
    • 기본 인덱스
  • 인덱스, 인덱서, 클러스터
  • 스플렁크 인덱스 관리
    • 시작하기
  • 다중 인덱스 관리
    • 다중 인덱스의 사용 목적
    • 스플렁크 인덱스의 생성과 수정
    • 그 외 인덱싱 방법
    • 새 인덱스 사용
    • 인덱싱된 모든 이벤트를 전달하기
    • 특정 이벤트 전달하기
  • 인덱스 혹은 인덱싱된 데이터 삭제
    • 스플렁크 이벤트 삭제
    • 데이터 삭제
  • 인덱스 설정
  • 인덱스 데이터베이스 이동
  • 스플렁크 인덱스 배포
  • 크기 관련
    • 인덱스 단위 속성
  • 한계에 도달하는 경우
    • 최소 여유 디스크 공간 설정
  • 정리

  • 7장 앱 개선
  • 기본 애플리케이션
    • 앱 리스트
    • 앱 설치
    • 스플렁크 앱의 비활성화와 제거
  • 사용자 정의 앱 만들기
  • 앱 FAQ
  • 스플렁크 전체를 커스터마이징하기
  • 앱 개발을 위한 사전준비
    • 스플렁크 앱 개발 시작하기
    • 개발을 위한 앱 패키징
  • 정리

  • 8장 모니터링과 경고
  • 모니터링 대상
    • 레시피
    • 스플렁크, 데이터 바라보기
    • 모니터링 범주
  • 고급 모니터링
  • 데이터 위치의 중요성
  • 전달자 100% 활용하기
  • 앱을 사용할 수 있을까?
  • 스플렁크에서의 윈도우 입력
  • 모니터링 시작하기
    • 사용자 정의 데이터
    • 입력 데이터 타입화
  • 스플렁크는 모니터링 대상 데이터로 어떤 일을 하는가?
    • 스플렁크 데이터 파이프라인
  • 스플렁크
    • 앱 다운로드
    • 설치 시작하기
  • 스플렁크 배포 모니터 앱 살펴보기
  • 경고에 대한 모든 것
    • 경고를 위한 퀵 스타트업
  • 경고 수정
    • 설명 수정
    • 권한 수정
    • 경고 유형 및 트리거 수정
    • 액션 수정
    • 경고 비활성화
    • 경고 복제
    • 경고 삭제
  • 예약된 경고 혹은 실시간 경고
  • 확장된 기능
    • 스플렁크 가속화
    • 만료
    • 요약 인덱싱
  • 정리

  • 9장 스플렁크 트랜잭션
  • 트랜잭션과 트랜잭션 타입
    • 다시 트랜잭션으로!
  • 트랜잭션 검색
  • 스플렁크 트랜잭션 예제
    • 트랜잭션 명령어
    • 트랜잭션과 매크로 검색
    • 검색 매크로 다시 살펴보기
  • 트랜잭션의 고급 사용
    • 트랜잭션 타입 설정
    • 그룹화: 이벤트 그룹화와 상관관계
    • 동시발생 이벤트
    • 주의사항: transaction 대신 stats 사용하기
  • 정리

  • 10장 엔터프라이즈를 위한 스플렁크
  • 일반적인 개념
  • 모범 사례
  • 스플렁크 지식의 정의
    • 데이터 해석
    • 데이터 분류
    • 데이터 축적
    • 정규화
    • 모델링
  • 전략적 지식 관리
  • 지식 관리에 의한 스플렁크 객체 관리
  • 문서에서의 명명 규칙
    • 지식 객체에 대한 명명 규칙 생성하기
  • 테스트
    • 공유 전 테스트
    • 테스트 단계
    • 장착
  • 엔터프라이즈 비전
    • 평가와 구현
    • 구축, 사용, 반복
    • 관리와 최적화
    • 비전을 넘어서
    • 구조적 접근법
  • 정리

  • 11장 퀵 스타트
  • 스플렁크 학습
  • 인증
    • 지식 관리자
    • 관리자
    • 아키텍트
    • 부가적 인증
  • 스플렁크 문서
  • www.splunk.com
  • 스플렁크 답변
  • 스플렁크베이스
  • 지원 포털
  • Splexicon
  • ‘How-to’ 튜토리얼
  • 사용자 컨퍼런스, 블로그, 뉴스 그룹
  • 전문 서비스
  • 스플렁크 소프트웨어 얻기
    • 기권(disclaimer)
    • 디스크 공간 요구사항
    • 설치와 설정
  • 학습 환경
  • 정리

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안

정오표

정오표

2015. 6. 30

[p65 1행]
clientipmaxspan -> clientip maxspan

[p211 4행]
splunklaunch.conf -> splunk-launch.conf

[p217 아래에서 2행]
우측 상단 -> 좌측 상단

[p245 그림 아래 1행]
masteringsplunkdefaul/setup.xml -> masteringsplunk/default/setup.xml

2016. 9. 20 수정 사항

[p.59: 아래에서 12행]
시쿼스
->
시퀀스