Top

생활 속 문제를 통해 배워보는 머신 러닝 [파이썬 머신 러닝 블루프린트]

  • 원서명Python Machine Learning Blueprints: Intuitive data projects you can relate to (ISBN 9781784394752)
  • 지은이알렉산더 콤스(Alexander T. Combs)
  • 옮긴이곽용훈
  • ISBN : 9791161750859
  • 30,000원
  • 2017년 11월 30일 펴냄
  • 페이퍼백 | 384쪽 | 188*235mm
  • 시리즈 : acorn+PACKT

책 소개

소스 코드 파일은 여기에서 내려 받으실 수 있습니다.

요약

이 책은 강력한 프로그래밍 언어인 파이썬을 기반으로 데이터를 통해 현실 문제를 파악하고 머신 러닝으로 해결하는 방법과 과정을 설명한다. 낮은 가격의 아파트 찾기나 저렴한 항공권 구하기와 같은 일상의 문제부터 챗봇(Chatbot) 및 추천 엔진 구축과 같은 기술 중심의 문제까지 친숙하고 다양한 사례를 다룬다. 실무 중심의 단계별 데이터 분석 및 모델링을 이해하고 실습할 수 있다.

이 책에서 다루는 내용

■ 파이썬 머신 러닝 에코시스템에 대한 이해
■ 선형 회귀를 수행하는 방법
■ 머신 비전(machine vision) 개념에 대한 소개
■ 고급 데이터 시각화 기술
■ 서드파티 API를 이용한 머신 러닝 모델 배치
■ 시계열 모델링 기술
■ 비지도 학습 모델 구축 방법

이 책의 대상 독자

이 책은 파이썬 기반의 머신 러닝 시스템을 구축하길 원하면서 데이터 과학에 대한 기본 지식을 갖춘 파이썬 프로그래머와 데이터 과학자, 아키텍트를 대상으로 한다.

이 책의 구성

1장. '파이썬 머신 러닝 에코시스템'에서는 내용이 깊고 활성화된 개발자 커뮤니티를 가진 파이썬과 과학계 출신의 여러 개발자에 대해서도 탐구한다. 이 때문에 파이썬은 과학적인 계산을 위한 풍부한 라이브러리를 제공한다. 주요 라이브러리의 특징을 살펴보고 가장 잘 활용할 수 있는 환경을 준비하는 것에 대해 다룬다.
2장. '저렴한 아파트 찾기 앱 구축하기'에서는 작지만 실제적인 예제인 저렴한 아파트를 찾는 애플리케이션의 구축을 시작으로 첫 번째 머신 러닝 애플리케이션을 구축하는 과정을 안내한다. 끝에서는 좀 더 쉽게 적당한 아파트를 찾는 애플리케이션을 만들게 된다.
3장. '저렴한 항공료 찾기 앱 구축하기'에서는 가격을 지속적으로 모니터링하는 애플리케이션을 구축하는 방법을 설명한다. 변칙적인 가격이 나타나면, 빠르게 조치할 수 있도록 알려준다.
4장. '로지스틱 회귀를 이용해 IPO 시장 예측하기'에서는 머신 러닝을 이용해 어떤 IPO가 면밀히 관찰할 가치가 있는지 여부를 결정한다.
5장. '맞춤형 뉴스피드 만들기'에서는 뉴스 취향을 이해하고 매일 개인적으로 맞춤화된 뉴스레터를 보내주는 시스템의 구축 방법을 다룬다.
6장. '콘텐츠 입소문 예측하기'에서는 가장 많이 공유된 콘텐츠를 검토해 사람들이 적게 공유하는 콘텐츠와 차별화되는 공통된 요소를 찾아본다.
7장. '머신 러닝으로 주식 시장 예측하기'에서는 트레이딩 전략을 구축하고 테스트하는 방법을 다룬다. 자신만의 시스템을 고안하려고 할 때 피해야 할 위험은 셀 수 없을 정도로 많다. 하지만 상당한 재미를 느낄 수 있으며, 가끔은 수익도 가져다준다.
8장. '이미지 유사도 엔진 구축하기'에서는 이미지 기반의 고급 딥러닝 애플리케이션을 만든다. 또한 딥러닝 알고리즘이 중요한 이유를 설명하고 왜 그것에 대한 과장 광고들이 많은지 살펴본다.
9장. '챗봇 구축하기'에서는 밑바닥에서부터 챗봇(Chatbot)을 만드는 방법을 설명한다. 이것을 통해 해당 분야의 역사와 앞으로의 전망에 대해 파악할 수 있다.
10장. '추천 엔진 구축하기'에서는 다양한 종류의 추천 시스템을 알아보고, 상업적으로 어떻게 수행되고 작동하는지 살펴본다. 또한 깃허브(GitHub) 저장소를 찾아주는 추천 엔진을 실행해본다.

저자/역자 소개

지은이의 말

머신 러닝은 데이터 중심 세상에서 빠르게 영역을 확대하고 있으며 로봇 공학과 의학에서부터 소매와 출판에 이르기까지 다양한 분야에 적용되고 있다. 이 책에서는 실제적인 머신 러닝 애플리케이션을 구축하는 방법을 단계별로 배운다. 쉽게 이해할 수 있는 프로젝트를 통해 다양한 형태의 데이터를 처리하는 방법을 살펴보고 지도 학습과 비지도 학습 같은 다양한 머신 러닝 기술을 언제 적용해야 하는지 배운다. 이 책에 나오는 각각의 프로젝트는 실제적이며 교육적인 가치를 제공한다. 예를 들어, 항공료 세일을 찾기 위해 클러스터링 기술을 사용하는 방법을 배우고, 저렴한 아파트를 찾기 위해 선형 회귀를 사용하는 법을 배운다. 이 책은 이해하기 쉽고 현실적인 방식으로 머신 러닝을 이용해 방대한 양의 데이터를 수집, 분석, 처리하는 것을 알려준다.

지은이 소개

알렉산더 콤스(Alexander T. Combs)

경험이 풍부한 데이터 과학자이자 전략가며 금융 데이터 추출과 자연어 처리, 정량적이고 통계적인 모델링을 개발한 경력을 가진 개발자이기도 하다. 현재 뉴욕에서 데이터 과학 집중 프로그램의 선임 강사로서 활동하고 있다.

옮긴이의 말

알파고(AlphaGo)와 4차 산업 혁명으로 인해 빅데이터 분석과 머신 러닝이 더욱 중요해졌고 대중의 관심도 상당히 높아지고 있다. 데이터 분석이나 머신 러닝을 잘 모르는 일반 대중들도 딥러닝이라는 용어를 익숙하게 느낄 정도로 각종 매체를 통해 자주 접하고 있으며, 오히려 이러한 친숙함이 데이터 분석과 머신 러닝을 통해 실제 현장의 문제를 푸는 데이터 분석가들을 곤란하게 할 때가 많다. 머신 러닝이라는 ‘마법 열쇠’만 있으면 모여 있는 데이터를 통해 자율 주행차도 만들고 바둑 분야에서 세계 랭킹 1위도 꺾을 수 있다는 인식을 갖도록 느끼게 만들었기 때문이다. 하지만 실제 업무 현장에서 문제를 풀기 위해서는 이런 마법 열쇠가 아닌 데이터에 대한 충분한 이해와 통계적 분석에 기반한 머신 러닝 모델링이 필요하다. 우선, 풀어야 할 문제와 해당 분야에 대한 이해를 기반으로 목적에 맞는 데이터를 수집해야 한다. 수집 후에는 데이터 정합성 검증 과정과 데이터 정제를 거쳐 분석이 가능한 형태의 데이터로 변환한다. 이렇게 전처리를 거친 데이터를 탐색적이고 통계적인 분석을 통해 데이터를 심층적으로 이해하게 되고, 이를 기반으로 문제를 풀기 위한 머신 러닝 알고리즘을 선택하게 된다. 반복적인 학습/검증 과정을 통해 머신 러닝 모델링을 구현하고, 이를 지속적으로 평가하고 개선하는 작업이 지속돼야 한다. 이 책에는 저렴한 가격의 아파트 찾기나 저렴한 항공권 구하기와 같은 일상의 문제부터 챗봇 및 추천 엔진 구축과 같은 기술 중심의 문제까지 친숙하고 다양한 사례가 포함돼 있다. 그리고 이러한 사례들을 강력한 라이브러리를 가진 파이썬을 통해 실제 업무와 비슷한 단계를 거쳐 풀어가고 있다. 이 책을 통해 데이터 분석 분야에서 파이썬이 지닌 편리함과 강력함을 이해하고 머신 러닝으로 실제 문제를 푸는 방법을 배운다면, 실제 업무 현장에서 다양한 문제들을 풀어낼 기반이 될 것이라고 생각한다.

옮긴이 소개

곽용훈

애플II 컴퓨터와의 만남을 시작으로 초등학교 때부터 컴퓨터 프로그래밍을 시작했다. 고려대학교 전자공학과를 졸업한 후 지난 20여 년간 IT 분야의 초기 스타트업부터 대기업까지 두루 몸담았으며 프로그래머에서 신사업 개발에 이르기까지 다양한 분야와 기술을 경험했다. 현재 LG전자에서 빅데이터 분석을 통한 고객 가치 창출 및 오퍼레이션 트랜스폼(Operation Transform)과 같은 실제 비즈니스적인 성과를 만들어내기 위해 노력하고 있다.

목차

목차
  • 1장. 파이썬 머신 러닝 에코시스템
    • 데이터 과학/머신 러닝 워크플로우
      • 수집
      • 점검 및 탐색
      • 정제 및 준비
      • 모델링
      • 평가
      • 배치
    • 파이썬 라이브러리와 기능
      • 수집
      • 점검
      • 준비
      • 모델링과 평가
      • 배치
    • 머신 러닝 환경 설정하기
    • 요약

  • 2장. 저렴한 아파트 찾기 앱 구축하기
    • 아파트 내역 데이터 구하기
      • import.io를 사용해 내역 데이터 끌어오기
    • 데이터 점검 및 준비
      • 데이터 분석
      • 데이터 시각화
    • 데이터 모델링
      • 예측
      • 모델 확장
    • 요약

  • 3장. 저렴한 항공료 찾기 앱구축하기
    • 항공료 데이터 구하기
    • 고급 웹 스크래핑 기술로 요금 데이터 가져오기
    • DOM분석을 통한 가격 데이터 추출
      • 클러스터링 기술로 이상 금액 찾기
    • IFTTT를 이용해 실시간 알림 보내기
    • 하나로 결합하기
    • 요약

  • 4장. 로지스틱 회귀를 이용해 IPO 시장 예측하기
    • IPO 시장
      • IPO란?
      • 최근 IPO 시장 성과
      • IPO 기초 전략
    • 피처 엔지니어링
    • 이진 분류
    • 피처 중요도
    • 요약

  • 5장. 맞춤형 뉴스피드 만들기
    • 포켓 앱으로 지도 학습 셋 생성하기
      • 포켓 크롬 확장 프로그램 설치하기
      • 포켓 API를 사용해 기사 가져오기
    • 기사 내용을 다운로드하기 위해 embed.ly API 사용하기
    • 기본적인 자연어 처리
    • 서포트 벡터 머신
    • 피드와 구글 시트, 이메일과 IFTTT 통합
      • IFTTT를 통해 뉴스피드와 구글 시트 설정하기
    • 개인화된 일간 뉴스레터 설정하기
    • 요약

  • 6장. 콘텐츠 입소문 예측하기
    • 구전성에 대한 연구
    • 공유 건수와 콘텐츠 가져오기
    • 공유성의 피처 탐색
      • 이미지 데이터 탐색
      • 헤드라인 탐색
      • 기사 내용 탐색
    • 콘텐츠 예측 스코어링 모델 구축
    • 요약

  • 7장. 머신 러닝으로 주식 시장 예측하기
    • 시장 분석의 유형
    • 주식 시장에 대한 연구
    • 거래 전략 개발하기
      • 분석 기간 확대
      • 서포트 벡터 회귀로 모델 만들기
      • 동적 시간 워핑 모델링
    • 요약

  • 8장. 이미지 유사도 엔진 구축하기
    • 이미지 기반의 머신 러닝
    • 이미지 작업
    • 유사한 이미지 찾기
    • 딥러닝의 이해
    • 이미지 유사도 엔진 구축하기
    • 요약

  • 9장. 챗봇 구축하기
    • 튜링 테스트
    • 챗봇의 역사
    • 챗봇 설계하기
    • 챗봇 구축하기
    • 요약

  • 10장. 추천 엔진 구축하기
    • 협업 필터링
      • 사용자 기반 필터링
      • 아이템 기반 필터링
    • 콘텐츠 기반 필터링
    • 하이브리드 시스템
    • 추천 엔진 구축하기
    • 요약

관련 블로그 글

파이썬을 사용한다면 꼭 필요한 문제별 맞춤 솔루션





파이썬은 네덜란드 개발자 귀도 반 로섬(Guido van Rossum)이 만든 언어로,

C 언어를 기반으로 빠른 속도, 안정성, 확장성을 제공하는 오픈소스 프로그래밍 언어다.

 

문법이 간결하고 직관적이기 때문에 초보자도 쉽게 배울 수 있는데,

그 때문에 수많은 개발자, 엔지니어, 데이터 과학자, 취미로 개발하는 사람 등 모두가 선호하는 프로그래밍 언어기도 하다.

 



 파이썬의 특징


 간결한 문법으로 입문자가 이해하기 쉽다.

 라이브러리가 풍부해 다양한 용도로 확장할 수 있다.

 프로토타입을 작성해 실제 작동 여부를 바로 확인할 수 있다.

 라이브러리를 사용해 린 속도를 보완할 수 있다.

유지보수 및 관리가 쉽다.

 높은 가독성과 생산성


 



파이썬은 현재 가장 많은 관심을 받는 언어 중 하나이며,

누구든 쉽게 배울 수 있고 필요한 목적에 따라 다양하게 활용할 수 있기 때문에

웹 개발뿐만 아니라 데이터 분석, 머신 러닝, 그래픽, 학술 연구 등 여러 분야에서 활용되고 있다

또한 파이썬은 대형 글로벌 기업부터 스타트업까지 다양하고 안정적으로 활용되고 있으며,

여러 업계에서 선호하는 언어로 꾸준히 성장하고 있다.

 

 






이미 파이썬의 기초와 활용을 다루는 책은 많다.

하지만 실제로 파이썬을 사용하면서 맞닥뜨릴 수 있는 상황을 제시하고 해결 방법을 알려주는 책은 많지 않다.

이 책은 기초 개념부터 복잡한 응용까지 광범위한 파이썬 3 프로그램 구현 방법을 설명한다.

자료 구조, 객체지향, 함수형 프로그래밍, 통계 프로그래밍 등 주제별로 효율적인 파이썬 프로그래밍 기법을 다루고 있다.



웹 개발자, 프로그래머, 엔터프라이즈 프로그래머, 엔지니어, 빅데이터 과학자를 대상으로 하며,

각각의 레시피별로 특정 문제 및 이슈를 해결하는 방법을 보여주는 접근 방식을 취하고 있어

상황 별로 문제 해결책을 제시하고 있기 때문에 굳이 처음부터 읽지 않고 필요한 부분만 선택적으로 읽어도 무방하다.



이 책에서 제시하는 일련의 레시피를 따라 하면서 구체적인 상황에서의 프로그래밍 언어 도는 표준 라이브러리의 기능을 더 쉽게 이해할 수 있으며,

특정 주제별로 파이썬 언어 기능에 관한 통찰력을 얻을 수 있다.

보자라면 이 책으로 파이썬을 시작할 수 있으며, 중급 이상이라면 지식 기반을 확장할 수 있다.


준비가 됐다면, <모던 파이썬 쿡북>과 함께 즐겁게 파이썬 개발을 시작해보자!



모던 파이썬 쿡북은 아래의 인터넷서점에서 만나실 수 있습니다

CC

크리에이티브 커먼즈 라이센스 이 저작물은 크리에이티브 커먼즈 코리아 저작자표시 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안