Top

오토케라스로 만드는 AutoML [몇 줄의 코딩으로 이용할 수 있는 딥러닝]

  • 원서명Automated Machine Learning with AutoKeras: Deep learning made accessible for everyone with just few lines of coding (ISBN 9781800567641)
  • 지은이루이스 소브레쿠에바(Luis Sobrecueva)
  • 옮긴이이진형
  • ISBN : 9791161757452
  • 25,000원 (eBook 20,000원)
  • 2023년 05월 31일 펴냄
  • 페이퍼백 | 208쪽 | 188*235mm
  • 시리즈 : 데이터 과학

책 소개

본문에 쓰인 컬러 이미지는 여기에서 내려 받으세요.

소스 코드 파일은 여기에서 내려 받으실 수 있습니다.
https://github.com/AcornPublishing/auto-ml-keras

요약

프로젝트에서 최첨단 AI 알고리듬을 개발하고 사용하는 방법을 알려주는 책이다. 자동화된 머신러닝에 대한 높은 수준의 소개로 시작하여 머신러닝 접근 방식을 시작하는 데 필요한 모든 개념을 설명한다. 그 다음 오토케라스를 사용하여 문서에 대한 감정 분석을 수행하는 방법을 다룬다. 또한 오토케라스로 토픽 분류를 위한 커스텀 모델을 구현하는 방법을 보여준다. 마지막으로 다중 모드 데이터 및 다중 작업, 오토모델로 모델을 사용자 정의하거나 오토케라스 확장 기능을 사용한 실험 결과 시각화와 같은 오토케라스의 고급 개념을 살펴본다. 이 책을 마치면 오토케라스로 회사에서 자신만의 머신러닝 모델을 설계할 수 있을 것이다.

이 책에서 다루는 내용

◆ 텐서플로 및 오토케라스로 딥러닝 워크스테이션 설정
◆ 오토케라스로 기계학습 파이프라인 자동화
◆ 오토케라스를 사용하여 이미지 및 텍스트 분류 모델 및 회귀 모델 구현
◆ 오토케라스를 사용하여 텍스트에 대한 감정 분석을 수행하여 부정적 또는 긍정적으로 분류
◆ 오토케라스를 활용하여 주제별로 문서 분류
◆ 가장 강력한 확장 기능을 사용하여 오토케라스를 최대 활용

이 책의 대상 독자

자동화된 ML 기술을 프로젝트에 적용하려는 머신러닝 및 딥러닝 애호가를 위한 책이다. 최대한 활용하려면 파이썬 프로그래밍에 대한 기본적인 사전지식이 필요하다.

이 책의 구성

1장, ‘자동화된 머신러닝 소개’에서는 AutoML 사용 방법의 유형 및 해당 소프트웨어 시스템에 대한 개요와 함께 자동화된 머신러닝의 주요 개념을 다룬다.
2장, ‘오토케라스 시작하기’에서는 오토케라스를 시작하는 데 필요한 모든 것을 다루고, 잘 설명된 기본 코드 예제를 통해 오토케라스를 실행한다.
3장, ‘오토케라스로 머신러닝 파이프라인 자동화하기’에서는 표준 머신러닝 파이프라인을 설명하고, 오토케라스로 파이프라인을 자동화하는 방법을 다룬 후, 모델을 학습시키기 전에 적용할 주요 데이터 준비의 모범 사례를 소개한다.
4장, ‘오토케라스를 사용한 이미지 분류 및 회귀’에서는 더 복잡하고 강력한 이미지 인식 모델을 만들고 오토케라스의 동작 방식을 조사하며 성능을 개선하기 위한 파인튜닝 방법을 살펴봄으로써 이미지 관련 문제에 오토케라스를 사용하는 것에 중점을 둔다.
5장, ‘오토케라스를 사용한 텍스트 분류 및 회귀’에서는 오토케라스를 이용한 텍스트(단어 시퀀스) 작업에 중점을 둔다. 또한 순환 신경망이 무엇이며 어떻게 작동하는지 설명한다.
6장, ‘오토케라스를 사용한 구조화된 데이터 작업’에서는 구조화된 데이터셋을 탐색하고, 변환하고, 특정 모델의 데이터 소스로 사용할 수 있다. 또한 구조화된 데이터를 기반으로 작업을 해결하기 위해 고유한 분류 및 회귀 모델을 생성한다.
7장, ‘오토케라스를 사용한 감정 분석’에서는 텍스트 분류 모델을 사용해 텍스트 데이터에서 감정을 추출하고, 감정 예측 모델을 구현해 텍스트 분류 개념을 실용적인 방식으로 적용한다.
8장, ‘오토케라스를 사용한 주제 분류’에서는 이전 장에서 배운 텍스트 기반 작업의 실용적인 측면에 중점을 둔다. 오토케라스로 주제 분류 모델을 생성한 다음, 주제 또는 범주 기반 데이터셋에 적용하는 방법을 알려준다.
9장, ‘다중 모드 및 다중 작업 데이터’에서는 오토모델 API로 다중 모드 및 다중 작업 데이터를 처리하는 방법을 설명한다.
10장, ‘모델 내보내기 및 시각화’에서는 오토케라스 모델을 내보내고 가져오는 방법과 모델을 학습시키는 동안 일어나는 일을 실시간으로 그래픽을 사용해 시각화하는 방법을 알려준다.

저자/역자 소개

지은이의 말

모든 사람이 딥러닝을 사용할 수 있을까? 의심할 여지없이 이 질문은 구글이나 아마존 같은 거대 기업이 제공하는 클라우드 서비스가 달성하고자 하는 목표다. 구글 AutoML 및 아마존 ML 서비스는 모든 기술 수준의 개발자가 머신러닝 기술을 쉽게 사용할 수 있도록 하는 클라우드 기반 서비스다. 클라우드 기반 서비스의 대안으로 사용할 수 있는 오토케라스는 무료 오픈소스이며, 환상적인 프레임워크다.
오토케라스는 나날이 성장하고 있으며 널리 알려진 딥러닝 프레임워크인 케라스의 지원을 받는 대규모 커뮤니티를 보유하고 있다. 그러나 문서와 블로그 기사를 제외하고는 현재까지 오토케라스 책이 거의 없다. 이 책은 그 공백을 메우기 위해 노력하고 있다.
이 책과 오토케라스 프레임워크는 클라우드 서비스의 대안을 찾는 초보자(단순히 입력 및 출력을 정의해 블랙박스로 사용)부터 자동화를 원하는 노련한 데이터 과학자에 이르기까지 광범위한 ML 전문가를 대상으로 한다. 검색 공간 매개변수를 자세히 정의하고 생성된 모델을 케라스로 내보내 수동 파인튜닝을 통해 탐색한다. 오토케라스를 처음 사용한다면 이런 용어와 개념이 이상하게 들릴 수 있지만 걱정하지 말자. 책에서 자세히 설명할 것이다.

지은이 소개

루이스 소브레쿠에바(Luis Sobrecueva)

현재 카비파이(Cabify)에서 근무하는 선임 소프트웨어 엔지니어이자 ML/DL 실무자다. OpenAI 프로젝트에 기여했으며 오토케라스 프로젝트에도 기여했다.

옮긴이의 말

머신러닝을 공부하는 사람들이 처음 책을 폈을 때 머신러닝이란 무엇인가, 또는 지도학습과 비지도학습은 무엇인가에 대해 배웠을 것입니다. 딥러닝 책으로 공부를 시작한 분들은 신경망, 미분, 역전파의 개념을 배웠을 것입니다. 개념도 물론 중요하지만 우리가 이러한 공부를 하는 이유는 실무에서 사용하기 위함입니다. 그런데 이런 이론적인 내용만 공부하다 보면 정작 AI를 비즈니스에 적용할 수 있는지 검토하는 데까진 더 오랜 시간이 걸립니다. 그래서 구글, 아마존, 마이크로소프트와 같은 클라우드 플랫폼 회사에서는 머신러닝을 비즈니스에서 빠르게 테스트하고 적용할 수 있도록 Vertex AI, Amazon SageMaker Autopilot, Azure Machine Learning Studio와 같은 AutoML 서비스를 제공하고 있습니다. 클라우드 플랫폼을 활용할 수 있다면 위에서 언급한 서비스를 이용하는 것이 좋습니다. 하지만 온프레미스 환경에서 작업을 해야 한다면 오토케라스가 좋은 대안이 될 수 있습니다.
이 책은 머신러닝 이론에 대해서는 간략하게 소개합니다. 그리고 비즈니스에서 겪는 문제를 분류, 회귀, 감정 분석, 주제 분류 등으로 나눠서 예측 모델을 만드는 방법을 설명합니다. 그리고 머신러닝 학습 과정을 관리하기 위해 머신러닝 파이프라인을 자동화하거나 머신러닝 모델링 과정을 모니터링하고 모델을 배포하는 방법을 다룹니다.
머신러닝과 딥러닝을 많이 경험해보지 못한 비즈니스 전문가, 학생, 개발자, 데이터 분석가분들도 데이터를 이용해 문제를 풀어야 하는 상황이라면 이 책에서 설명하는 오토케라스를 이용해 비즈니스 문제의 답을 빨리 찾을 수 있길 바랍니다.

옮긴이 소개

이진형

데이터에 숨어 있는 인사이트를 찾는 일을 좋아한다. 11번가에서 데이터 엔지니어와 데이터 과학자의 역할 사이에서, 판매자와 구매자 대상 개인화 추천 서비스를 제공하기 위해 데이터 파이프라인과 데이터 모델을 개발했다. 현재는 카드 혜택을 통합 관리하는 핀테크 스타트업 빅쏠에서 데이터 과학자로 일하고 있다.

목차

목차
  • 제1부 AutoML 기초

    • 1장. 자동화된 머신러닝 소개
      • 표준 ML 워크플로의 구조
        • 데이터 수집
        • 데이터 전처리
        • 모델 배포
        • 모델 모니터링
      • AutoML의 정의
        • 표준 접근 방식과의 차이점
      • AutoML의 유형
        • 피처 엔지니어링 자동화
        • 모델 선택 및 하이퍼파라미터 최적화 자동화
        • 신경망 아키텍처 선택 자동화
      • 요약
      • 더 읽을거리

    • 2장. 오토케라스 시작하기
      • 기술 요구사항
      • 딥러닝이란 무엇인가?
      • 신경망이란 무엇이며 어떻게 학습하는가?
      • 딥러닝 모델은 어떻게 학습하는가?
      • 왜 오토케라스인가?
        • 오토케라스 실험 실행 방법
      • 오토케라스 설치
        • 클라우드에 오토케라스 설치
        • 오토케라스 로컬 설치
      • Hello MNIST: 첫 번째 오토케라스 실험 구현
        • 필요한 패키지 가져오기
        • MNIST 데이터셋 가져오기
        • 숫자는 어떻게 분포하는가?
        • 이미지 분류 모델 만들기
        • 테스트 세트로 모델 평가
        • 모델 시각화
        • 이미지 회귀 분류 모델 만들기
        • 테스트 세트로 모델 평가
        • 모델 시각화
      • 요약

    • 3장. 오토케라스로 머신러닝 파이프라인 자동화하기
      • 텐서 이해하기
        • 텐서란 무엇인가?
        • 텐서의 유형
      • 딥러닝 모델을 제공하기 위한 데이터 준비
        • 신경망 모델을 위한 데이터 전처리 작업
      • 여러 형식으로 오토케라스에 데이터 로드
      • 학습 및 평가를 위한 데이터셋 분할
        • 데이터셋을 분할해야 하는 이유
        • 데이터셋을 분할하는 방법
      • 요약

  • 제2부 오토케라스 활용

    • 4장. 오토케라스를 사용한 이미지 분류 및 회귀
      • 기술 요구사항
      • CNN 이해하기
        • 합성곱 층
        • 풀링 층
        • CNN 구조
        • 기존 신경망 넘어서기
      • CIFAR-10 이미지 분류 모델 만들기
      • 강력한 이미지 분류 모델 생성 및 파인튜닝
        • 모델 성능 향상
        • 테스트 세트로 모델 평가
        • 모델 시각화
      • 사람의 나이를 알아내는 이미지 회귀 분석기 만들기
      • 강력한 이미지 회귀 분석기 생성 및 파인튜닝
        • 모델 성능 향상
        • 테스트 세트로 모델 평가
        • 모델 시각화
      • 요약

    • 5장. 오토케라스를 사용한 텍스트 분류 및 회귀
      • 기술 요구사항
      • 텍스트 데이터 작업
        • 토큰화
        • 벡터화
      • RNN 이해하기
      • 1차원 CNN(Conv1D)
      • 이메일 스팸 감지기 만들기
        • 스팸 예측기 만들기
        • 모델 평가
        • 모델 시각화
      • 소셜 미디어에서 뉴스 인기도 예측
        • 텍스트 회귀 모델 생성
        • 모델 평가
        • 모델 시각화
        • 모델 성능 향상
        • 테스트셋으로 모델 평가
      • 요약

    • 6장. 오토케라스를 사용한 구조화된 데이터 작업
      • 기술 요구사항
      • 구조화된 데이터 이해하기
      • 구조화된 데이터 작업
      • 타이타닉 생존자를 예측하기 위한 구조화된 데이터 분류 모델 만들기
        • 분류 모델 만들기
        • 모델 평가
        • 모델 시각화
      • 보스턴 주택 가격을 예측하기 위한 구조화된 데이터 회귀 분석 모델 만들기
        • 구조 데이터 회귀 분석 모델 만들기
        • 모델 평가
        • 모델 시각화
      • 요약

    • 7장. 오토케라스를 사용한 감정 분석
      • 기술 요구사항
      • 감정 분석기 만들기
      • 감정 예측 모델 만들기
      • 모델 평가
      • 모델 시각화
      • 특정 문장의 감정 분석
      • 요약

    • 8장. 오토케라스를 사용한 주제 분류
      • 기술 요구사항
      • 주제 분류 이해하기
      • 뉴스 주제 분류 모델 만들기
        • 분류 모델 만들기
        • 모델 평가
        • 모델 시각화
        • 모델 평가
      • 모델 검색 공간 사용자 정의
        • 요약

  • 제3부 고급 오토케라스

    • 9장. 다중 모드 및 다중 작업 데이터
      • 기술 요구사항
      • 다중 입력 또는 출력이 있는 모델 탐색
        • 오토모델이란 무엇인가?
        • 다중 모드란 무엇인가?
        • 다중 작업이란 무엇인가?
      • 다중 모드 / 다중 작업 모델 생성
        • 모델 생성
        • 모델 시각화
      • 검색 공간 사용자 정의
      • 요약

    • 10장. 모델 내보내기 및 시각화
      • 기술 요구사항
      • 모델 내보내기
        • 모델을 저장하고 불러오는 방법
      • 텐서보드로 모델 시각화
        • 콜백으로 모델 상태 기록
        • 텐서보드 설정 및 로드
        • TensorBoard.dev와 ML 실험 결과 공유
      • ClearML로 모델 시각화 및 비교
        • 코드에 ClearML 추가
        • 실험 비교
      • 요약
        • 마치며

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안