Top

생활 속 문제를 통해 배워보는 머신 러닝 [파이썬 머신 러닝 블루프린트]

  • 원서명Python Machine Learning Blueprints: Intuitive data projects you can relate to (ISBN 9781784394752)
  • 지은이알렉산더 콤스(Alexander T. Combs)
  • 옮긴이곽용훈
  • ISBN : 9791161750859
  • 30,000원
  • 2017년 11월 30일 펴냄
  • 페이퍼백 | 384쪽 | 188*235mm
  • 시리즈 : acorn+PACKT

책 소개

요약

이 책은 강력한 프로그래밍 언어인 파이썬을 기반으로 데이터를 통해 현실 문제를 파악하고 머신 러닝으로 해결하는 방법과 과정을 설명한다. 낮은 가격의 아파트 찾기나 저렴한 항공권 구하기와 같은 일상의 문제부터 챗봇(Chatbot) 및 추천 엔진 구축과 같은 기술 중심의 문제까지 친숙하고 다양한 사례를 다룬다. 실무 중심의 단계별 데이터 분석 및 모델링을 이해하고 실습할 수 있다.

이 책에서 다루는 내용

■ 파이썬 머신 러닝 에코시스템에 대한 이해
■ 선형 회귀를 수행하는 방법
■ 머신 비전(machine vision) 개념에 대한 소개
■ 고급 데이터 시각화 기술
■ 서드파티 API를 이용한 머신 러닝 모델 배치
■ 시계열 모델링 기술
■ 비지도 학습 모델 구축 방법

이 책의 대상 독자

이 책은 파이썬 기반의 머신 러닝 시스템을 구축하길 원하면서 데이터 과학에 대한 기본 지식을 갖춘 파이썬 프로그래머와 데이터 과학자, 아키텍트를 대상으로 한다.

이 책의 구성

1장. '파이썬 머신 러닝 에코시스템'에서는 내용이 깊고 활성화된 개발자 커뮤니티를 가진 파이썬과 과학계 출신의 여러 개발자에 대해서도 탐구한다. 이 때문에 파이썬은 과학적인 계산을 위한 풍부한 라이브러리를 제공한다. 주요 라이브러리의 특징을 살펴보고 가장 잘 활용할 수 있는 환경을 준비하는 것에 대해 다룬다.
2장. '저렴한 아파트 찾기 앱 구축하기'에서는 작지만 실제적인 예제인 저렴한 아파트를 찾는 애플리케이션의 구축을 시작으로 첫 번째 머신 러닝 애플리케이션을 구축하는 과정을 안내한다. 끝에서는 좀 더 쉽게 적당한 아파트를 찾는 애플리케이션을 만들게 된다.
3장. '저렴한 항공료 찾기 앱 구축하기'에서는 가격을 지속적으로 모니터링하는 애플리케이션을 구축하는 방법을 설명한다. 변칙적인 가격이 나타나면, 빠르게 조치할 수 있도록 알려준다.
4장. '로지스틱 회귀를 이용해 IPO 시장 예측하기'에서는 머신 러닝을 이용해 어떤 IPO가 면밀히 관찰할 가치가 있는지 여부를 결정한다.
5장. '맞춤형 뉴스피드 만들기'에서는 뉴스 취향을 이해하고 매일 개인적으로 맞춤화된 뉴스레터를 보내주는 시스템의 구축 방법을 다룬다.
6장. '콘텐츠 입소문 예측하기'에서는 가장 많이 공유된 콘텐츠를 검토해 사람들이 적게 공유하는 콘텐츠와 차별화되는 공통된 요소를 찾아본다.
7장. '머신 러닝으로 주식 시장 예측하기'에서는 트레이딩 전략을 구축하고 테스트하는 방법을 다룬다. 자신만의 시스템을 고안하려고 할 때 피해야 할 위험은 셀 수 없을 정도로 많다. 하지만 상당한 재미를 느낄 수 있으며, 가끔은 수익도 가져다준다.
8장. '이미지 유사도 엔진 구축하기'에서는 이미지 기반의 고급 딥러닝 애플리케이션을 만든다. 또한 딥러닝 알고리즘이 중요한 이유를 설명하고 왜 그것에 대한 과장 광고들이 많은지 살펴본다.
9장. '챗봇 구축하기'에서는 밑바닥에서부터 챗봇(Chatbot)을 만드는 방법을 설명한다. 이것을 통해 해당 분야의 역사와 앞으로의 전망에 대해 파악할 수 있다.
10장. '추천 엔진 구축하기'에서는 다양한 종류의 추천 시스템을 알아보고, 상업적으로 어떻게 수행되고 작동하는지 살펴본다. 또한 깃허브(GitHub) 저장소를 찾아주는 추천 엔진을 실행해본다.

저자/역자 소개

지은이의 말

머신 러닝은 데이터 중심 세상에서 빠르게 영역을 확대하고 있으며 로봇 공학과 의학에서부터 소매와 출판에 이르기까지 다양한 분야에 적용되고 있다. 이 책에서는 실제적인 머신 러닝 애플리케이션을 구축하는 방법을 단계별로 배운다. 쉽게 이해할 수 있는 프로젝트를 통해 다양한 형태의 데이터를 처리하는 방법을 살펴보고 지도 학습과 비지도 학습 같은 다양한 머신 러닝 기술을 언제 적용해야 하는지 배운다. 이 책에 나오는 각각의 프로젝트는 실제적이며 교육적인 가치를 제공한다. 예를 들어, 항공료 세일을 찾기 위해 클러스터링 기술을 사용하는 방법을 배우고, 저렴한 아파트를 찾기 위해 선형 회귀를 사용하는 법을 배운다. 이 책은 이해하기 쉽고 현실적인 방식으로 머신 러닝을 이용해 방대한 양의 데이터를 수집, 분석, 처리하는 것을 알려준다.

지은이 소개

알렉산더 콤스(Alexander T. Combs)

경험이 풍부한 데이터 과학자이자 전략가며 금융 데이터 추출과 자연어 처리, 정량적이고 통계적인 모델링을 개발한 경력을 가진 개발자이기도 하다. 현재 뉴욕에서 데이터 과학 집중 프로그램의 선임 강사로서 활동하고 있다.

옮긴이의 말

알파고(AlphaGo)와 4차 산업 혁명으로 인해 빅데이터 분석과 머신 러닝이 더욱 중요해졌고 대중의 관심도 상당히 높아지고 있다. 데이터 분석이나 머신 러닝을 잘 모르는 일반 대중들도 딥러닝이라는 용어를 익숙하게 느낄 정도로 각종 매체를 통해 자주 접하고 있으며, 오히려 이러한 친숙함이 데이터 분석과 머신 러닝을 통해 실제 현장의 문제를 푸는 데이터 분석가들을 곤란하게 할 때가 많다. 머신 러닝이라는 ‘마법 열쇠’만 있으면 모여 있는 데이터를 통해 자율 주행차도 만들고 바둑 분야에서 세계 랭킹 1위도 꺾을 수 있다는 인식을 갖도록 느끼게 만들었기 때문이다. 하지만 실제 업무 현장에서 문제를 풀기 위해서는 이런 마법 열쇠가 아닌 데이터에 대한 충분한 이해와 통계적 분석에 기반한 머신 러닝 모델링이 필요하다. 우선, 풀어야 할 문제와 해당 분야에 대한 이해를 기반으로 목적에 맞는 데이터를 수집해야 한다. 수집 후에는 데이터 정합성 검증 과정과 데이터 정제를 거쳐 분석이 가능한 형태의 데이터로 변환한다. 이렇게 전처리를 거친 데이터를 탐색적이고 통계적인 분석을 통해 데이터를 심층적으로 이해하게 되고, 이를 기반으로 문제를 풀기 위한 머신 러닝 알고리즘을 선택하게 된다. 반복적인 학습/검증 과정을 통해 머신 러닝 모델링을 구현하고, 이를 지속적으로 평가하고 개선하는 작업이 지속돼야 한다. 이 책에는 저렴한 가격의 아파트 찾기나 저렴한 항공권 구하기와 같은 일상의 문제부터 챗봇 및 추천 엔진 구축과 같은 기술 중심의 문제까지 친숙하고 다양한 사례가 포함돼 있다. 그리고 이러한 사례들을 강력한 라이브러리를 가진 파이썬을 통해 실제 업무와 비슷한 단계를 거쳐 풀어가고 있다. 이 책을 통해 데이터 분석 분야에서 파이썬이 지닌 편리함과 강력함을 이해하고 머신 러닝으로 실제 문제를 푸는 방법을 배운다면, 실제 업무 현장에서 다양한 문제들을 풀어낼 기반이 될 것이라고 생각한다.

옮긴이 소개

곽용훈

애플II 컴퓨터와의 만남을 시작으로 초등학교 때부터 컴퓨터 프로그래밍을 시작했다. 고려대학교 전자공학과를 졸업한 후 지난 20여 년간 IT 분야의 초기 스타트업부터 대기업까지 두루 몸담았으며 프로그래머에서 신사업 개발에 이르기까지 다양한 분야와 기술을 경험했다. 현재 LG전자에서 빅데이터 분석을 통한 고객 가치 창출 및 오퍼레이션 트랜스폼(Operation Transform)과 같은 실제 비즈니스적인 성과를 만들어내기 위해 노력하고 있다.

목차

목차
  • 1장. 파이썬 머신 러닝 에코시스템
    • 데이터 과학/머신 러닝 워크플로우
      • 수집
      • 점검 및 탐색
      • 정제 및 준비
      • 모델링
      • 평가
      • 배치
    • 파이썬 라이브러리와 기능
      • 수집
      • 점검
      • 준비
      • 모델링과 평가
      • 배치
    • 머신 러닝 환경 설정하기
    • 요약

  • 2장. 저렴한 아파트 찾기 앱 구축하기
    • 아파트 내역 데이터 구하기
      • import.io를 사용해 내역 데이터 끌어오기
    • 데이터 점검 및 준비
      • 데이터 분석
      • 데이터 시각화
    • 데이터 모델링
      • 예측
      • 모델 확장
    • 요약

  • 3장. 저렴한 항공료 찾기 앱구축하기
    • 항공료 데이터 구하기
    • 고급 웹 스크래핑 기술로 요금 데이터 가져오기
    • DOM분석을 통한 가격 데이터 추출
      • 클러스터링 기술로 이상 금액 찾기
    • IFTTT를 이용해 실시간 알림 보내기
    • 하나로 결합하기
    • 요약

  • 4장. 로지스틱 회귀를 이용해 IPO 시장 예측하기
    • IPO 시장
      • IPO란?
      • 최근 IPO 시장 성과
      • IPO 기초 전략
    • 피처 엔지니어링
    • 이진 분류
    • 피처 중요도
    • 요약

  • 5장. 맞춤형 뉴스피드 만들기
    • 포켓 앱으로 지도 학습 셋 생성하기
      • 포켓 크롬 확장 프로그램 설치하기
      • 포켓 API를 사용해 기사 가져오기
    • 기사 내용을 다운로드하기 위해 embed.ly API 사용하기
    • 기본적인 자연어 처리
    • 서포트 벡터 머신
    • 피드와 구글 시트, 이메일과 IFTTT 통합
      • IFTTT를 통해 뉴스피드와 구글 시트 설정하기
    • 개인화된 일간 뉴스레터 설정하기
    • 요약

  • 6장. 콘텐츠 입소문 예측하기
    • 구전성에 대한 연구
    • 공유 건수와 콘텐츠 가져오기
    • 공유성의 피처 탐색
      • 이미지 데이터 탐색
      • 헤드라인 탐색
      • 기사 내용 탐색
    • 콘텐츠 예측 스코어링 모델 구축
    • 요약

  • 7장. 머신 러닝으로 주식 시장 예측하기
    • 시장 분석의 유형
    • 주식 시장에 대한 연구
    • 거래 전략 개발하기
      • 분석 기간 확대
      • 서포트 벡터 회귀로 모델 만들기
      • 동적 시간 워핑 모델링
    • 요약

  • 8장. 이미지 유사도 엔진 구축하기
    • 이미지 기반의 머신 러닝
    • 이미지 작업
    • 유사한 이미지 찾기
    • 딥러닝의 이해
    • 이미지 유사도 엔진 구축하기
    • 요약

  • 9장. 챗봇 구축하기
    • 튜링 테스트
    • 챗봇의 역사
    • 챗봇 설계하기
    • 챗봇 구축하기
    • 요약

  • 10장. 추천 엔진 구축하기
    • 협업 필터링
      • 사용자 기반 필터링
      • 아이템 기반 필터링
    • 콘텐츠 기반 필터링
    • 하이브리드 시스템
    • 추천 엔진 구축하기
    • 요약

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안