데이터 마이닝 4/e [실용적인 머신러닝 기술]
- 원서명Data Mining 4th Edition: Practical Machine Learning Tools and Techniques (ISBN 9780128042915)
- 지은이이안 위튼(Ian Witten), 아이베 프랭크(Eibe Frank), 마크 홀(Mark Hall), 크리스토퍼 팔(Christopher Pal)
- 옮긴이김성준
- ISBN : 9791161756424
- 50,000원
- 2022년 05월 31일 펴냄
- 페이퍼백 | 808쪽 | 188*235mm
- 시리즈 : 데이터 과학
책 소개
2023년 대한민국학술원 우수학술도서 선정도서
요약
머신러닝의 기초와 실제 데이터 마이닝에 적용하는 방법을 알려준다. 특히 4판에서는 데이터 준비, 분석 결과 해석, 결과 평가, 성공적인 데이터 마이닝 접근 방식의 핵심인 알고리듬에 이르기까지 데이터 마이닝을 진행하기 위해 알아야 할 모든 것을 다룬다.
이 책에서 다루는 내용
◆ 머신러닝 개념의 기본을 살펴보고 데이터 마이닝 프로젝트에 적용할 도구 및 기술에 관한 조언 제공
◆ 성능 개선을 위해 머신러닝의 입력 및 결과의 변형으로 구체적인 팁과 기술 제공
◆ 데이터 마이닝 작업용 머신러닝 알고리듬에 광범위하게 적용할 수 있는 WEKA 소프트웨어 툴킷 제공
이 책의 대상 독자
머신러닝 관행의 기본 원리와 아이디어에 관심이 있고 기술적으로 잘 알고 있는 일반 독자를 대상으로 한다. 또한 이 새로운 기술에 익숙해져야 하는 정보 전문가와 머신러닝이 무엇을 포함하는지 자세히 이해하려는 모든 사람에게 관심을 끌 것이다. 정보 시스템 실무자, 프로그래머, 컨설턴트, 개발자, 데이터 과학자, 정보 기술 관리자, 사양 작성자, 특허 심사관, 호기심 많은 사람, 학생, 교수 등 다양한 사용자를 위해 작성됐다.
이 책의 구성
1장, ‘데이터 마이닝… 이게 다 뭐죠?’에서는 예를 통해 머신러닝이 무엇인지, 어디에서 사용할 수 있는지 설명하고 실제 애플리케이션을 제공한다. 2장, ‘입력 - 콘셉트, 인스턴스, 속성’과 3장, ‘출력 - 지식의 표현’에서는 관련된 다양한 종류의 입력 및 출력 또는 지식 표현을 다룬다. 다양한 종류의 출력은 다양한 스타일의 알고리듬을 지시하며 4장, ‘알고리듬: 기본 방법’은 머신러닝의 기본 방법을 설명하며 이해하기 쉽도록 단순화했다. 여기에서 관련된 원칙은 복잡한 세부 사항이나 까다로운 구현 문제에 관여하지 않고 다양한 알고리듬으로 전달된다. 특정 데이터 마이닝 문제에 머신러닝 기술을 적용하는 데 진전을 이루려면 얼마나 잘하고 있는지 측정할 수 있어야 한다. 5장, ‘신뢰성: 학습에 대한 평가’를 통해 머신러닝에서 얻은 결과를 평가하고 성능 평가와 관련된 복잡한 문제를 해결할 수 있다.
2부에서는 데이터 마이닝을 위한 고급 머신러닝 기술을 소개한다. 가장 낮고 가장 상세한 수준인 6장, ‘트리 및 규칙’ 및 7장, ‘인스턴스 기반 및 선형 모델 확장’은 머신러닝 알고리듬 수행의 핵심적인 이슈를 세부적으로 잘 드러내며, 실무에 적용 시 필요한 복잡성을 내포하고 있다(하지만 몇 가지 알고리듬에 필요한 무거운 수학적 장치는 생략한다). 많은 독자가 이러한 세부 정보를 무시하고 싶어 할 수 있지만, 머신러닝 구조의 대부분 작업은 이 레벨에서 구현된다. 8장, ‘데이터 변환’은 머신러닝에 대한 입력 및 출력 엔지니어링과 관련된 실제 주제(예: 속성 선택 및 이산화)를 설명한다. 9장, ‘확률적 방법’과 10장, ‘딥러닝’에서는 각각 머신러닝 및 딥러닝의 확률적 방법을 설명한다. 11장, ‘지도 및 비지도 학습을 넘어서’는 준지도 및 다중 인스턴스 학습을 살펴보고, 12장, ‘앙상블 학습’에서는 다양한 학습 기술의 결과물을 결합한 ‘앙상블 학습’ 기술을 다룬다. 13장, ‘응용 영역, 그 너머의 세계’는 미래를 내다본다.
부록에서는 9장 및 10장의 자료 이해에 필요한 몇 가지 수학적 배경을 다룬다. 또 다른 부록에서는 1부 및 2부에 설명된 대부분의 아이디어를 구현하는 WEKA 데이터 마이닝 워크벤치(workbench)를 소개한다. 개념적 자료를 사용 방법의 실제적인 측면에서 명확하게 분리하고자 이를 실었다. 1부와 2부의 각 장 끝에는 관련 WEKA 알고리듬을 소개한다.
목차
목차
- 1부. 데이터 마이닝의 소개
- 1장. 데이터 마이닝… 이게 다 뭐죠?
- 2장. 입력 - 콘셉트, 인스턴스, 속성
- 3장. 출력 - 지식의 표현
- 4장. 알고리듬 - 기본 방식
- 5장. 신뢰성 - 학습에 대한 평가
- 2부. 고급 머신러닝 기술
- 6장. 트리와 규칙
- 7장. 인스턴스 기반 및 선형 모델의 확장
- 8장. 데이터 변환
- 9장. 확률적 방법
- 10장. 딥러닝
- 11장. 지도 및 비지도 학습을 넘어서
- 12장. 앙상블 학습
- 13장. 응용 영역, 그 너머의 세계
- 부록 A. 이론적 기초
- 부록 B. WEKA 워크벤치