전문 검색과 분석을 위한 Elasticsearch 서버 [아파치 루씬 기반의 고성능 엔터프라이즈 플랫폼]
- 원서명ElasticSearch Server Second Edition (ISBN 9781783980529)
- 지은이라팔 쿠크, 마렉 로고진스키
- 옮긴이박재호
- ISBN : 9788960776050
- 35,000원
- 2014년 09월 29일 펴냄 (절판)
- 페이퍼백 | 452쪽 | 188*235mm
- 시리즈 : acorn+PACKT, 오픈소스 프로그래밍
판매처
- 현재 이 도서는 구매할 수 없습니다.
책 소개
요약
이 책은 검색과 관련된 기본 프레임워크를 제공하는 아파치 루씬(Apache Lucene)을 기반으로 만들어진 전문 검색과 분석 엔진인 일래스틱서치(Elasticsearch)의 구조와 기능을 설명한다. 색인 구조 생성부터 시작해 질의, 패싯, 집계를 비롯해, 고가용성을 위한 클러스터 구성과 감시, 문제 해결에 필요한 각종 절차까지 설명한다. 시나리오와 예제를 동원해 다양한 상황에 대응하는 방법을 자세하고 실질적으로 도움이 되는 방식으로 설명하므로, 자료 색인과 검색은 물론이고 분석 과정에서 많은 힌트를 얻을 것이다. 검색이나 로그 저장/분석이 필요한 개발자라면 이 책으로 일래스틱서치에 입문해보자.
이 책에서 다루는 내용
■ 독자적인 색인을 구성하고 생성하는 방법
■ 분석 체인을 설정하고 다국어 자료를 처리하는 방법
■ 모든 질의 유형을 만들어내는 일래스틱서치의 질의 DSL 사용 방법
■ 필터를 효율적으로 활용하고 성능을 높이는 방법
■ 자동 완성 기능 구현
■ 패싯과 집계 프레임워크, 그 밖에 검색에서 더 많은 내용을 얻기 위해 유사 내용을 찾는 기능을 이용하고 고객의 검색 경험을 높이는 방법
■ 일래스틱서치 API와 외부 모니터링 소프트웨어로 클러스터 상태를 모니터링하는 방법
■ 게이트웨이와 탐색 모듈에 대한 기본 지식과 구성 방법
■ 주 샤드(shard)를 제어하고 레플리카(replica)의 균형을 잡는 방법
이 책의 대상 독자
이 책은 전문 검색 엔진과 일래스틱서치 세계에 처음 입문한 독자에게 적합하다. 일래스틱서치의 기초를 안내하며, 몇 가지 고급 기능을 사용하는 방법을 설명할 것이다. 일래스틱서치를 알고 사용해봤다면, 예제와 설명을 곁들여 모든 기능을 멋지게 개괄하기 때문에 이 책이 흥미로울 것이다.
아파치 솔라(Solr) 검색 엔진을 안다면, 아파치 솔라와 일래스틱서치의 몇 가지 기능을 비교하기 위해 이 책을 읽을 수도 있다. 이 책은 요구 사항에 더욱 적절한 도구를 찾기 위한 기초 지식을 제공한다.
이 책의 구성
1장 ‘일래스틱서치 클러스터 시작’에서는 전문 검색, 아파치 루씬, 텍스트 분석, 일래스틱서치 시작과 구성, 마지막으로 가장 기초적인 방법으로 자료를 색인하고 검색하는 방법을 다룬다.
2장 ‘자료 색인’에서는 색인 동작 원리, 색인 구조를 준비하기 위한 방법, 사용 가능한 자료 유형, 색인 속도 개선, 세그먼트 설명, 세그먼트 병합 동작 방식, 라우팅 설명을 다룬다.
3장 ‘자료 검색’에서는 일래스틱서치가 제공하는 전문 검색 기능을 소개한다. 질의 방법, 질의 과정의 동작 방식, 기본 질의와 복합 질의 유형을 다룬다. 이와 함께, 결과 필터링 방법, 강조 기능 사용, 반환된 결과에 대한 정렬도 다룰 것이다.
4장 ‘색인 구조 확장’에서는 복잡한 자료 구조 색인 방법을 설명한다. 트리와 같은 자료 타입 색인 방법, 다큐먼트 사이의 관계를 사용한 자료 색인, 색인 구조 변경을 다룰 것이다.
5장 ‘검색 결과 향상’은 아파치 루씬의 점수 계산, 일래스틱서치 점수 계산에 영향을 미치는 방법, 일래스틱서치의 스크립트 기능, 언어 분석을 다룬다.
6장 ‘전문 검색을 넘어서’에서는 집계 프레임워크 세부 기능, 패싯, 철자 교정과 자동 완성 구현 방법을 다룬다. 또한 독자들은 바이너리 파일 색인 방법, 지리위치 자료 처리 방법, 대규모 자료 집합의 효율적인 처리 방법을 배울 것이다.
7장 ‘일래스틱서치 클러스터 세부 사항’에서는 노드 탐색 메커니즘, 복구와 게이트웨이 모듈, 일래스틱서치에서 질의와 색인의 고가용성 대응 방안을 다룬다.
8장 ‘클러스터 관리’에서는 일래스틱서치 백업 기능, 클러스터 모니터링, 클러스터 균형 잡기, 샤드 이동을 다룬다. 또한 독자들은 미리 채우기 기능, 앨리어스, 플러그인 설치, 갱신 API를 사용한 클러스터 설정 변경 방법을 배울 것이다.
목차
목차
- 1장. 일래스틱서치 클러스터 시작
- 전문 검색
- 일래스틱서치 기초
- 클러스터 설치와 구성
- REST API로 자료 처리
- URI 요청 질의를 사용한 검색
- 요약
- 2장. 자료 색인
- 일래스틱서치 색인
- 매핑 구성
- 색인 과정에서 속도를 높이기 위한 배치 색인
- 추가적인 내부 정보로 색인 구조 확장
- 세그먼트 병합 소개
- 라우팅 개괄
- 요약
- 3장. 자료 검색
- 일래스틱서치 질의
- 질의 과정 이해
- 기본 질의
- 복합 질의
- 결과 필터링
- 강조
- 질의 검증
- 자료 정렬
- 질의 재작성
- 요약
- 4장. 색인 구조 확장
- 트리와 유사한 구조체 색인
- 평평하지 않은 자료 색인
- 중첩된 객체 활용
- 부모-자식 관계 활용
- 갱신 API로 색인 구조 변경
- 요약
- 5장. 검색 결과 향상
- 아파치 루씬의 점수 계산 소개
- 일래스틱서치의 스크립트 기능
- 다양한 언어로 내용 검색
- 질의 중요도로 점수에 영향을 미치기
- 색인 시점의 중요도 정의는 언제 의미가 있을까?
- 의미가 동일한 단어
- 질의 해설 기능 이해
- 요약
- 6장. 전문 검색을 넘어서
- 집계
- 패싯
- 제안 기능 사용
- 예상 검색
- 파일 다루기
- Geo
- 스크롤 API
- terms 필터
- 요약
- 7장. 일래스틱서치 클러스터 세부사항
- 노드 탐색
- 게이트웨이와 복구 모듈
- 질의와 색인의 고가용성을 위한 일래스틱서치 클러스터 준비
- 템플릿과 동적 템플릿
- 요약
- 8장. 클러스터 관리
- 일래스틱서치 타임머신
- 클러스터 상태 모니터링
- 클러스터 균형 잡기
- 샤드와 레플리카 할당 제어
- 색인 미리 채우기
- 색인 앨리어스와 일상 작업을 단순하게 만들기
- 요약