Top

R 딥러닝 쿡북 [텐서플로, H2O, MxNet으로 구현하는]

  • 원서명R Deep Learning Cookbook: Solve complex neural net problems with TensorFlow, H2O and MXNet (ISBN 9781787121089)
  • 지은이PKS 프라카시(PKS Prakash), 아슈튜니 스리 크리슈나 라오(Achytuni Sri Krishna Rao)
  • 옮긴이정지완
  • ISBN : 9791161751689
  • 30,000원
  • 2018년 06월 11일 펴냄
  • 페이퍼백 | 352쪽 | 188*235mm
  • 시리즈 : acorn+PACKT, 데이터 과학

책 소개

소스 코드 파일은 여기에서 내려 받으실 수 있습니다.

본문에 쓰인 컬러 이미지는 여기에서 내려 받으세요.
요약

R에서 사용 가능한 딥러닝 패키지 MXNet, 텐서플로, H2O를 소개하고, 이를 사용해 딥러닝 모델을 구현한다. 주피터와 도커를 이용해 R 딥러닝 패키지를 설정하고 로지스틱 회귀, MLP 등 기초 개념을 이해한다. 데이터를 다운로드한 후 CNN, 오토인코더, 생성 모델, RNN, 강화 학습을 실제 예를 들어 설명하고, 직접 실습한다. 또한 사례연구로 텍스트 마이닝과 신호 처리에 적용해본다. 마지막으로 이전 학습 방법과 GPU 사용법도 다룬다.

이 책에서 다루는 내용

■ 텐서플로, H2O, MXNet을 사용한 다양한 응용 분야의 딥러닝 모델 개발
■ 심층 볼츠만 머신 분석
■ DBN 설정과 분석
■ 다양한 머신 러닝 알고리즘을 사용한 지도 학습 모델 개발
■ 다양한 종류의 기본 콘볼루션 함수 설정
■ 오토인코더를 사용한 특징 표현 이해
■ 딥러닝에서 가능한 생성 모델을 탐색
■ RNN을 사용한 순차 모델링 발견
■ 강화 학습 기초 이해
■ 텍스트 마이닝에 딥러닝을 적용하는 데 필요한 과정 학습
■ 신호 처리에 딥러닝을 적용하는 방법
■ 이전 학습을 사용한 딥러닝 모델 개발
■ GPU를 사용한 딥러닝 모델 훈련

이 책의 대상 독자

데이터 과학 전문가 혹은 분석가를 대상으로 한다. 머신 러닝 과제를 끝내고 이제 딥러닝 구현에 따라오는 불편을 해결하기 위해 접근이 쉬운 참고서를 원하는 사람에게 적합하다. 다른 딥러닝 전문가보다 앞서가고 싶은 사람에게 유용할 것이다.

이 책의 구성

1장. '시작하기'에서는 딥러닝 모델 개발에 사용되는 텐서플로, MxNet, H2O를 비롯한 다양한 패키지를 소개하고, 나중에 사용할 수 있도록 이 패키지들을 설정해 놓는다. 2장. 'R 딥러닝'에서는 인공 신경망(Neural Network)과 딥러닝의 기초 개념을 소개한다. 또한 R의 다양한 도구들로 신경망을 개발하는 여러 방법을 다룬다.
3장. 'CNN'에서는 이미지 처리와 분류를 통해 CNN 개발 방법을 다룬다.
4장. '오토인코더와 데이터 표현'에서는 다양한 방법으로 오토인코더의 기반을 개발하고, 데이터 압축과 노이즈 제거에 적용하는 방법을 다룬다.
5장. '딥러닝 생성 모델'에서는 오토인코더의 개념을 생성 모델로 확장한다. 나아가 볼츠만 머신(Boltzman machine), 제한 볼츠만 머신(RBM, Restricted Boltzman Machine), 심층 신경망(DBN, Deep Belief Network)를 개발해본다.
6장. '순환 신경망'에서는 다수의 순환 신경망(RNN, Recurrent Neural Networks)을 이용해 순차적 데이터셋을 처리하는 머신 러닝 모델 개발의 기반을 닦는다.
7장. '강화 학습'에서는 마르코프 결정 과정(MDP, Markov Decision Process) 강화 모델 개발의 기초를 제공하고, 모델 기반 학습과 모델이 없는 학습을 다룬다.
8장. '텍스트마이닝 딥러닝 응용'에서는 텍스트 마이닝 분야에서 딥러닝을 구현하는 방법을 엔드투엔드로 다룬다.
9장. '신호 처리 딥러닝 응용'에서는 신호 처리 분야에서 딥러닝이 활용되는 사례를 상세하게 분석한다.
10장. '이전 학습'에서는 VGG16, 인셉션(Inception) 등 미리 학습된 모델을 사용하는 방법과 GPU를 사용한 딥러닝 모델 학습 방법을 다룬다.

저자/역자 소개

지은이의 말

딥러닝은 머신 러닝에서 가장 자주 논의되는 분야 중 하나다. 딥러닝을 사용해 복잡한 함수를 모델링하고 횡단면 데이터, 순차 데이터, 이미지, 텍스트, 오디오, 영상을 포함한 다양한 데이터 소스와 구조를 이용해서 모델을 학습할 수 있다. 또한 R은 데이터 과학 커뮤니티에서 가장 인기 있는 언어 중 하나다. 딥러닝의 발전에 따라 딥러닝과 R 사이의 관계도 엄청나게 발전하고 있다. 이 책의 목적은 다양한 딥러닝 모델 개발 방법을 집중 훈련하는 것이다. 구조가 있는 데이터, 구조가 없는 데이터, 이미지 오디오 사례 연구를 통해 딥러닝을 적용한다. 또한 이전 학습(Transfer Learning)과 그래픽 처리장치(GPU, Graphics Processing Unit)의 성능을 이용해 딥러닝 모델의 계산 효율을 높이는 방법도 다룬다.

지은이 소개

PKS 프라카시(PKS Prakash)

데이터 과학자이자 작가다. 지난 12년 동안 신체 건강, 제조, 의약, 전자거래 분야 주요 기업에서 데이터 과학을 이용한 해결책을 개발했다. 현재 ZS 어소시에이츠(Associates)에서 근무 중이다. ZS는 세계에서 가장 큰 사업 서비스 회사 중 하나다. ZS는 고급 분석에 기반을 둔 데이터 주도 전략으로 고객이 사업에 성공하고 필요한 곳에 역량을 집중하게 돕는다. 데이터 주도 전략을 사용해 판매, 마케팅 부서의 경쟁력을 높일 수 있다.
위스콘신 메디슨(Wisconsin-Madison) 대학교에서 산업 및 시스템 엔지니어링으로 박사 학위를 취득했다. 그 후, 영국 워릭 대학교(University of Warwick)에서 두 번째 공학 박사 학위를 받았다. 미국 위스콘신 메디슨에서 석사 학위를 취득했고, 인도의 국립 제련 주조 공대(NIFFT, National Institute of Foundry and Forge Technology)에서 학사 학위를 받았다. 워릭 대학교에서 박사 과정 때 연구한 내용을 바탕으로 워릭 분석 회사(Warwick Analytics)를 공동 창업했다.
오퍼레이션 리서치(operational research)와 관리, 소프트 컴퓨팅(soft computing) 도구, 고급 알고리즘 등 폭넓은 연구 분야의 주요 학술지인 IEEE-Trans, EJOR, IJPR에 논문을 게재했다. 「Intelligent Approaches to Complex Systems」의 한 호를 편집했고, 『Evolutionary Computing in Advanced Manufacturing』(Wiley, 2011)에 감수자로 참여했으며 『R 데이터 구조와 알고리즘』(에이콘, 2017)의 공동 저자다.

아슈튜니 스리 크리슈나 라오(Achytuni Sri Krishna Rao)

데이터 과학자 겸 토목 공학자이고, 작가다. 지난 4년 동안 신체 건강, 의약, 제조 분야의 주요 기업에서 데이터 과학을 이용한 해결책을 개발했다. 현재 ZS 어소시에츠에서 데이터 과학 기술 고문으로 일하고 있다.
싱가포르 국립대학교(National University of Singapore)에서 기업 분석과 머신 러닝으로 석사 학위를 받았다. 인도 와랑갈 국립공과대학(National Institute of Technology Warangal)에서 학사 학위를 받았다.
토목 공학 분야에서 폭넓게 기고했고, 『R 데이터 구조와 알고리즘』(에이콘, 2017)의 공동 저자다.

옮긴이의 말

지난 7년간의 딥러닝 연구 발전 속도는 정말 놀랍습니다. 기계가 사진에서 사람, 동물, 물건을 확인하고 이름을 찾아주며, 일상적인 대화를 이해하고 외국어를 어느 정도 자연스럽게 번역하는 등 이전에는 미처 상상하지 못했던 일들을 해내고 있습니다. 아직은 보편적 인공지능을 달성하려면 갈 길이 까마득하지만 현재 가능한 기술로도 얼마든지 우리의 일상과 업무 환경을 바꿀 수 있습니다. 이 책은 이름에 걸맞게 구현된 코드 예시를 제공해주고 실습 후 코드에 담긴 이론을 설명해줍니다. 또한 책의 간결성 때문에 설명이 부족할 때는 담지 못한 개념을 어느 곳에서 더 알아봐야 할지도 알려줍니다.
이 책은 R 통계 언어를 사용하므로 프로그래밍 언어가 익숙하지 않은 사람도 쉽게 접근할 수 있습니다. 또한 다양한 R 패키지의 설치법과 사용법을 다루므로 딥러닝 패키지에 대한 전반적 지식을 얻게 도와줍니다. 현재 폭넓게 사용하는 CNN, 오토인코더, RNN, 전이 학습 등의 개념을 다루고 있기에 좋은 입문서가 될 것으로 생각합니다. 딥러닝을 만나는 즐거운 첫걸음이 되기를 기대합니다.

옮긴이 소개

정지완

머신 러닝 연구를 통해 인간의 사고 과정에 대한 이해를 넓히려 하는 연구자다. 현재 서울대 컴퓨터공학과 시각 학습 연구실에서 연구원으로 근무 중이며, 머신 QA와 자연어 처리에 관심을 두고 연구 중이다. 연세대학교에서 컴퓨터과학과를 이중 전공했으며, 영어영문학을 부전공했다.

목차

목차
  • 1장. 소개
    • R과 IDE 설치
    • 주피터 노트북 애플리케이션 설치
    • R 머신 러닝 기초 시작
    • R 딥러닝 도구/패키지 설치
    • R MXNet 설치
    • R 텐서플로 설치
    • R의 H2O 설치
    • 도커로 세 패키지 한 번에 설치

  • 2장. R 딥러닝
    • 로지스틱 회귀 시작
    • 준비
    • 데이터셋 도입
    • H2O 로지스틱 회귀
    • 텐서플로 로지스틱 회귀
    • 텐서플로 그래프 시각화
    • 다층 퍼셉트론 시작
    • H2O 인공 신경망
    • H2O 그리드 서치를 활용한 초매개변수 조정
    • MXNet 인공 신경망
    • 텐서플로 인공 신경망

  • 3장. CNN
    • 소개
    • 이미지 데이터셋 다운로드와 설정
    • CNN 분류기 구조 이해
    • 가중치와 편향 초기화 함수 정의
    • 새 콘볼루션 계층 생성 함수 정의
    • 콘볼루션 계층 평탄화 함수 정의
    • 과연결 계층 평탄화 함수 정의
    • 플레이스홀더 변수 정의
    • 첫 번째 콘볼루션 계층 생성
    • 두 번째 콘볼루션 계층 생성
    • 두 번째 콘볼루션 계층 평탄화
    • 첫 번째 완전 연결 계층 생성
    • 첫 번째 완전 연결 계층의 드롭아웃 적용
    • 드롭아웃을 사용한 두 번째 완전 연결 계층 생성
    • 소프트맥스 활성화를 사용한 클래스 예측
    • 최적화를 위한 손실 함수 정의
    • 경사 하강 손실 최적화
    • 텐서플로 세션에서의 그래프 실행
    • 테스트 데이터상 성능 평가

  • 4장. 오토인코더 데이터 표현
    • 소개
    • 오토인코더 설정
    • 데이터 정규화
    • 표준화 오토인코더 설정
    • 오토인코더 매개변수 조정
    • 적층 오토인코더 설정
    • 노이즈 제거 오토인코더 설정
    • 확률 인코더와 디코더 생성과 비교
    • 오토인코더 다양체 학습
    • 희소 분해 평가

  • 5장. 딥러닝 생성 모델
    • RBM과 주성분 분석 비교
    • 베르누이 분포 입력 값의 RBM 설정
    • RBM 훈련
    • RBM 역방향 혹은 재구성 단계
    • 재구성 CD 이해
    • 새 텐서플로 세션 초기화와 시작
    • RBM 결과 평가
    • RBM 협동 필터링 설정
    • RBM 전체 훈련 수행
    • DBN 설정
    • 피드포워드 역전달 신경망 구현
    • DRBM 설정

  • 6장. 순환 신경망
    • 기본 RNN 설정
    • 양방향 RNN 모델 설정
    • 심층 RNN 모델 설정
    • LSTM 기반 순차 모델 설정

  • 7장. 강화 학습
    • 소개
    • MDP 설정
    • 모델 기반 학습 수행
    • 모델 자유 학습 수행

  • 8장. 텍스트 마이닝 딥러닝 응용
    • 텍스트 데이터 전처리와 감정 추출
    • tf-idf를 사용한 문서 분석
    • LSTM 망을 사용한 감정 예측
    • text2vec를 사용한 응용

  • 9장. 신호 처리 딥러닝 응용
    • 음악 MIDI 파일 소개와 전처리
    • RBM 모델 개발
    • 새 악보 생성

  • 10장. 이전 학습
    • 소개
    • 사전 학습 모델 사용법 설명
    • 이전 학습 모델 설정
    • 이미지 분류 모델 개발
    • GPU 딥러닝 모델 학습
    • CPU와 GPU 성능 비교

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안