케라스부터 쿠버네티스까지 [머신러닝, 딥러닝 모델 개발부터 배포까지 단계별 가이드]
- 원서명Keras to Kubernetes: The Journey of a Machine Learning Model to Production (ISBN 9781119564836)
- 지은이다타라지 재그디시 라오(Dattaraj Jagdish Rao)
- 옮긴이김광일
- ISBN : 9791161755410
- 35,000원
- 2021년 06월 30일 펴냄 (절판)
- 페이퍼백 | 428쪽 | 188*235mm
- 시리즈 : 클라우드 컴퓨팅
판매처
- 현재 이 도서는 구매할 수 없습니다.
책 소개
소스 파일은 아래 깃허브 페이지에서 다운로드하실 수 있습니다.
(https://github.com/AcornPublishing/keras-kubernetes)
요약
케라스를 사용한 머신러닝 모델 개발부터 쿠버네티스에서의 모델 배포까지 전체 과정을 따라가면서 핵심 개념과 필요한 도구의 사용 방법 등을 소스 코드와 함께 쉽게 설명한다.
전반부에서는 지도학습, 비지도학습에서 강화학습에 이르기까지 머신러닝의 핵심 개념과 주요 알고리즘을 수학적 방법을 거의 사용하지 않고 설명했다. 이미지와 텍스트 데이터 같은 비정형 데이터를 다루기 위한 컴퓨터 비전, 신호 처리, 텍스트 처리 등의 전통적인 방법부터 최신 딥러닝 알고리즘의 기본 원리를 알기 쉬운 소스 코드와 함께 설명한다. 저자는 표준적인 머신러닝과 신경망 알고리즘에 그치지 않고 최신 알고리즘인 전이 학습, 생성적 대립 신경망 등을 알기 쉽게 설명한다. 머신러닝과 최신 딥러닝 알고리즘의 전체적인 모습을 가볍게 훑어보기 좋게 구성돼 있다.
후반부에서는 머신러닝 생명주기를 따라가며 필요한 도구와 고려할 사항을 알려주고, 최종적으로 쿠버네티스에 마이크로서비스로 배포하는 과정을 단계별로 친절하게 안내한다. 쿠버네티스와 관련 도구의 사용법을 익힘며 전체적인 감을 잡을 수 있게 구성돼 있다.
이 책에서 다루는 내용
■ 머신러닝을 배포하기 위한 케라스와 쿠버네티스 실습 예제
■ 데이터를 수집하고 관리하는 새로운 방법
■ 다양한 AI 학습 모델에 대한 개요
■ 예제를 수정 없이 재사용해 모델 배포
■ 분명하고 이해하기 쉬운 방향 제시
이 책의 대상 독자
소프트웨어 개발자와 데이터 과학자를 위한 것이다. 머신러닝 모델을 개발하고, 이것을 애플리케이션 코드에 연결하며, 도커 컨테이너로 패키징된 마이크로서비스(Microservice)로 배포하는 과정을 설명한다. 최신 소프트웨어는 많은 부분이 머신러닝에 의해 구동되고 있으며 데이터 과학자와 소프트웨어 개발자는 서로의 영역에 대해 많이 알수록 더 큰 이득을 볼 수 있다고 생각된다.
여러분이 소프트웨어 개발 또는 데이터 과학의 초보자이든 혹은 전문가이든 상관없이, 이 책에는 여러분을 위한 무엇인가가 있을 거라고 생각한다. 예제들을 잘 이해하기 위해서는 프로그래밍에 대한 사전 지식이 있으면 가장 좋겠지만 코드와 예제는 매우 일반적인 독자를 대상으로 하고 있다. 제시된 코드에는 상세한 코멘트가 달려 있으므로 따라가기 쉬울 것이다. 파이썬, 싸이킷런(Scikit-Learn) 그리고 케라스와 같은 특정 라이브러리를 사용했지만 R이나 MATLAB, Java, SAS, C++ 같은 다른 언어나 라이브러리로 코드를 변환하기 위한 동등한 함수들을 찾을 수 있을 것이다.
개념을 이해하고자 코드를 자세히 살펴볼 필요가 없도록 가능한 한 많은 이론을 제공하려고 노력했다. 여러분의 데이터에 개념을 적용하기 쉽도록 코드는 매우 실용적으로 작성됐다. 자유롭게 예제 코드를 복제해 자신의 데이터셋에 적용해보기를 권한다.
이 책의 구성
1장에서 5장까지 전반부에서는 머신러닝과 딥러닝에 중점을 둔다. 파이썬(Python) 코드를 사용해 머신러닝 모델을 작성하는 예를 보여주며, 이 과정을 자동화할 수 있는 도구의 예를 보여준다. 케라스(Keras) 라이브러리와 텐서플로(TensorFlow) 프레임워크를 사용해 이미지 분류 모델을 작성하는 예제를 보여준다. 이 로고 분류기 모델은 이미지에 들어 있는 코카콜라와 펩시콜라 로고를 식별하는 데 사용된다.
6장에서 10장까지에서는 이들 머신러닝 및 딥러닝 모델들을 실제로 프로덕션 환경에 배포하는 방법을 설명한다. 데이터 과학자들의 몇 가지 공통 관심사에 관해 얘기하며, 소프트웨어 개발자들이 이 모델들을 구현하는 방법을 논의한다. 앞에서 나온 로고 분류기를 쿠버네티스를 사용해 규모에 맞춰 배포하는 예를 설명한다.
목차
목차
- 1장. 빅데이터와 인공지능
- 데이터는 새로운 석유이며 AI는 새로운 전기다
- 기계들의 부상
- 처리 능력의 지수적 성장
- 애널리틱스의 새로운 유형
- 무엇이 AI를 그렇게 특별하게 하는가
- 인공지능의 응용
- 데이터에서 애널리틱스의 구축
- 애널리틱스의 유형: 응용 기준
- 애널리틱스의 유형: 의사 결정 로직 기반
- 애널리틱스 주도형 시스템의 구축
- 요약
- 데이터는 새로운 석유이며 AI는 새로운 전기다
- 2장. 머신러닝
- 데이터에서 패턴 찾기
- 막강한 머신러닝 커뮤니티
- 머신러닝 기법의 유형
- 비지도학습
- 지도학습
- 강화학습
- 간단한 문제의 해
- 비지도학습
- 지도학습: 선형회귀
- 경사하강 최적화
- 선형회귀에 경사하강법 적용하기
- 지도학습: 분류
- 더 큰 데이터셋의 분석
- 정확도에 대한 측도: 정밀도 및 재현율
- 분류 방법의 비교
- 편향 대 분산: 미적합 대 과적합
- 강화학습
- 모델 기반 강화학습
- 모델 프리 강화학습
- 요약
- 3장. 비정형 데이터 다루기
- 정형 데이터 대 비정형 데이터
- 이미지 인식
- 동영상 다루기
- 텍스트 데이터 다루기
- 소리 듣기
- 요약
- 4장. 케라스를 사용한 딥러닝
- 비정형 데이터의 처리
- 신경망
- 역전파와 경사하강법
- 뱃치 경사하강법과 확률적 경사하강법
- 신경망 아키텍처
- 텐서플로와 케라스
- 편향과 분산: 미적합과 과적합
- 요약
- 비정형 데이터의 처리
- 5장. 고급 딥러닝
- 심층 모델의 부상
- 새로운 종류의 네트워크 층
- 컨볼루션 층
- 풀링 층
- 드롭아웃 층
- 뱃치 정규화 층
- 패션 이미지 분류를 위한 심층 신경망 구축
- CNN 아키텍처와 하이퍼파라미터
- 사전 훈련된 VGG 모델로 예측하기
- 데이터 보강과 전이 학습
- 실제 분류 문제: 펩시콜라 대 코카콜라
- 순환 신경망
- 요약
- 6장. 최첨단 딥러닝 프로젝트
- 신경망 스타일 전이
- AI를 사용한 이미지 생성
- 오토인코더를 사용한 신용카드 부정 사용 탐지
- 요약
- 7장. 최신 소프트웨어 세계의 AI
- 소프트웨어의 최신 요구 사항 훑어보기
- AI가 최신 소프트웨어 개발에 어떻게 적합한가
- 간편한 웹 애플리케이션
- 클라우드 컴퓨팅의 부상
- 컨테이너와 CaaS
- 컨테이너가 있는 마이크로서비스
- 쿠버네티스: 인프라 관련 문제를 위한 CaaS 솔루션
- 요약
- 8장. AI 모델을 마이크로서비스로 배포하기
- 도커와 쿠버네티스를 사용한 간단한 마이크로서비스 구축
- 앱에 AI 스마트 추가하기
- 앱을 컨테이너로 패키징하기
- 저장소에 도커 이미지 푸시하기
- 앱을 쿠버네티스에 마이크로서비스로 배포하기
- 요약
- 9장. 머신러닝 개발 수명주기
- 머신러닝 모델 수명주기
- 1단계: 문제의 정의와 실제 참값 확립
- 2단계: 데이터의 수집, 정제 및 준비
- 3단계: 모델 구축 및 훈련
- 4단계: 모델 검증 및 하이퍼파라미터 튜닝
- 5단계: 프로덕션 환경으로 배포
- 피드백과 모델 업데이트
- 엣지 장치에 배포하기
- 요약
- 머신러닝 모델 수명주기
- 10장. 머신러닝 플랫폼
- 머신러닝 플랫폼 문제
- 데이터 수집
- 데이터 정제
- 애널리틱스 사용자 인터페이스
- 모델 개발
- 규모에 맞는 훈련
- 하이퍼파라미터 튜닝
- 자동 배포
- 로깅 및 모니터링
- 머신러닝 플랫폼 통합
- 요약
- 맺음말
- 머신러닝 플랫폼 문제