The Hundred-Page Machine Learning Book [수식과 간결한 설명을 바탕으로 하는 핵심 머신 러닝]

원서명The Hundred-Page Machine Learning Book (ISBN 9781999579500)
지은이안드리 부르코프(Andriy Burkov)
옮긴이남기혁, 이용진, 윤여찬

ISBN : 9791161753409
25,000원
2019년 08월 30일 펴냄
페이퍼백 | 216쪽 | 188*235mm
시리즈 : 데이터 과학

판매처

책 소개
저자/역자 소개
목차
정오표
도서 오류 신고

책 소개

요약

머신 러닝에 관련된 기초 수학 정의와 선형 회귀, 로지스틱 회귀, SVM을 기초 신경망부터 CNN, RNN에 이르는 주제를 담은 책으로, 1960년대의 초창기 기술부터 지금까지 나온 머신 러닝 기법 중에서 실전에서 유용하면서 머신 러닝 입문자가 기초를 다지는 데 딱 필요한 만큼 설명하는 책이다.
프로젝트 초반에 주어지는 문제를 머신 러닝으로 해결할 수 있는지 알아보고, 어떤 기법을 적용해야 하는지 판단하는 데 필요한 지식을 제시한다.

이 책에 쏟아진 찬사

“저자는 머신 러닝에 관한 내용을 100페이지에 담아내는, 굉장히 유용하면서도 불가능에 가까울 정도로 힘든 작업을 했다. 이론뿐만 아니라 실전 기법 측면에서 현업 종사자에게 꼭 필요한 주제만으로 잘 구성했으며, 머신 러닝 서적 중에서 거의 유일한 100페이지(원서 기준)짜리 책이라는 것을 이해하는 독자라면 이 책을 통해 기초를 탄탄하게 다질 수 있다.”
ㅡ 피터 노빅(Peter Norvig)/ 구글 리서치 디렉터이자 전 세계에서 가장 인기 있는 인공지능 교과서인 『Artificial Intelligence: A Modern Approach』의 저자

“이 책이 다루는 다양한 주제를 단 100페이지(+α)에 담았다니 굉장히 놀랍다. 부르코프는 수식도 거침없이 소개하는데, 머신 러닝을 간략하게 소개하는 책에서는 거의 찾아볼 수 없는 이 점이 이 책의 매력이다. 개인적으로 핵심 개념을 단 몇 마디로 정리하는 설명 방식이 매우 마음에 든다. 이 책은 머신 러닝에 입문하는 사람만이 아니라 어느 정도 익숙한 이들에게도 이 분야의 다양한 주제를 접할 수 있다는 점에서 큰 도움이 될 것이다.”
ㅡ 오렐리앙 제롱(Aurélien Géron)/ 시니어 AI 엔지니어이자 아마존 베스트셀러인 『Hands-On Machine Learning with Scikit-Learn and TensorFlow』의 저자

“세계 최고의 전문 엔지니어가 소개하는 뛰어난 머신 러닝 입문서다.”
ㅡ 카롤리스 우르보나스/ 아마존 데이터 사이언스 부서장

“대학원에서 통계학을 전공하면서 머신 러닝을 배우려 할 때 있었으면 좋았을 책이다.”
ㅡ 차오 한/ 루시드웍스 R&D 부서장, VP

“안드리는 자잘한 내용을 잘라내고 첫 페이지부터 본론으로 들어가는 식으로 이 책을 정말 잘 구성해냈다.”
ㅡ 수짓 바라크헤디/ 이베이 엔지니어링 부서장

“엄청난 시간을 투자하지 않고도 일상 업무에 머신 러닝을 적용하려는 엔지니어를 위한 훌륭한 책”
ㅡ 디팍 아가왈/ 링크드인 AI 담당 VP

“머신 러닝을 처음 배우기에 좋은 책”
ㅡ 빈센트 폴렛/ 뉘앙스 연구 부서장

추천의 글

최근 20년 사이에 우리가 다룰 수 있는 데이터의 양은 폭발적으로 늘어났으며, 이에 따라 통계학과 머신 러닝 응용에 대한 관심도 덩달아 급증했다. 그 파급 효과는 상당하다. 10년 전, 내가 선택 과목인 통계 학습을 개설할 때 MBA 과정의 모든 학생이 강의실을 가득 채울 정도로 인기가 많아서 동료 교수들이 깜짝 놀랄 정도였다(당시 개설된 선택 과목 중 대부분은 수강생 채우기에 급급했기 때문이다). 현재는 ‘비즈니스 애널리틱스(Business Analytics)’라는 석사 과정을 제공하고 있는데, 이 과정은 우리 학교의 특화된 석사 과정 중에서도 가장 규모가 크며, 지원자 수는 MBA 과정 지원자 수에 맞먹을 정도다. 그동안 이 과정의 과목 수가 많이 늘어났음에도 모든 수업마다 수강생이 가득 차서 불만이라는 의견은 여전히 나오고 있다. 이는 우리 학교에서만 볼 수 있는 현상이 아니다. 데이터 사이언스와 머신 러닝 전공자에 대한 수요가 늘어나면서 이 분야의 학위 과정이 급속도로 늘고 있다.
이렇게 수요가 급증하는 배경에는 단순하지만 불가피한 한 가지 사실이 있다. 바로 머신 러닝 기법은 사회 과학, 경영학, 생물학, 의학을 비롯한 수많은 분야에서 기존과는 상당히 다른 접근 방식을 제공한다는 것이다. 그로 인해 머신 러닝을 배경으로 하는 전문가의 수요가 엄청나게 늘어났다. 그런데 이러한 기술을 학생에게 가르치기는 쉽지 않다. 기존에 나온 자료들은 대부분 실전과는 동떨어진 이론 위주인 데다, 오래전 통계학에서 다루던 피팅(fitting) 알고리즘과 이에 기반한 예측기만 다루기 때문이다. 정작 현실에서 마주치는 문제를 풀기 위해 다양한 기법을 구현해야 하는 연구원이나 엔지니어들에게 도움이 되는 자료는 드물다. 이들은 주어진 문제에 적합한 기법을 선정할 수 있도록 다양한 기법의 가정과 장단점을 파악해야 한다. 하지만 피팅 알고리즘에 관한 이론적 배경이나 세부 사항은 이러한 요구 사항과 다소 거리가 있다. 내가 『ISLR(An Introduction to Statistical Learning: with Applications in R)』을 집필한 동기는 바로 이들을 위한 자료를 제공하기 위해서였다. 이 책에 대한 열광적인 호응만 봐도 실제로 그런 독자층이 적지 않다는 사실을 입증한다.
안드리 부르코프의 책도 성격이 비슷하다. 『ISLR』과 마찬가지로, 이론에 관한 세부 사항은 가볍게 넘기고 다양한 기법을 구현하는 데 필요한 핵심만 전달하고 있다. 이 책은 ‘데이터 사이언스를 위한' 간략한 매뉴얼 같다. 예상컨대 학교에서뿐만 아니라 실전에서도 반드시 참고할 만한 필독서로 자리매김할 것이다. 100페이지(실제로는 이보다 살짝 많은) 분량으로 구성돼 있어서 단숨에 읽기에도 충분하다. 분량은 적지만, 고전 선형 회귀와 로지스틱 회귀부터 SVM과 딥러닝, 부스팅, 랜덤 포레스트와 같은 최신 주제까지 머신 러닝의 핵심 주제를 거의 모두 망라해 다룬다. 각각의 주제는 결코 부족하지 않은 수준으로 설명하고 있으며, 더 깊이 알고 싶은 독자를 위해 이 책의 위키 사이트에 관련 자료도 제공하고 있다. 고급 수학과 통계 이론을 알아야만 이 책을 읽을 수 있는 것은 아니며, 심지어 프로그래밍 경험이 없어도 된다. 따라서 머신 러닝 기법을 알고 싶은 사람이라면 누구나 이 책을 읽을 수 있다. 머신 러닝 박사 과정을 시작하는 사람이라면 반드시 이 책을 읽어야 한다. 숙련된 독자도 레퍼런스처럼 활용하기에 좋다. 또한 이 책은 몇 가지 알고리즘에 대해 파이썬 코드도 함께 제공한다(파이썬은 현재 머신 러닝 분야에서 가장 인기 있는 프로그래밍 언어다). 나는 머신 러닝을 본격적으로 배우고 싶은 입문자뿐만 아니라, 어느 정도 머신 러닝에 대한 경험이 있으면서 실력을 쌓으려는 전문가에게도 이 책을 강력히 추천한다.

ㅡ 가레스 제임스(Gareth James) /USC(서던캘리포니아 대학) 데이터 사이언스 및 오퍼레이션학과 교수 베스트셀러 『An Introduction to Statistical Learning: with Applications in R』의 공저자

개인적으로 지난 수년 간 설명해 온 말이며, 내 저서 제목처럼 “인공지능이란 없다(Artificial Intelligence does not exist).” 최소한 지난 10년 동안 들어왔던 ‘우리 대신 생각해주는 기계’는 순전히 할리우드식 판타지이자, 가장 비이성적인 공포라고 볼 수 있다. 기계는 우리가 학습하라고 제시한 것 외에는 학습하지 않는다. 생각하지도 않고, 숙고하지도 않는다. 르네 데카르트가 1637년에 한 말인 “생각한다. 고로 나는 존재한다(Cogito, ergo sum).”에 따르면 생각해야 존재할 수 있는 것이다. 따라서 기계는 존재하지 않는다.
태곳적부터 우리는 일상생활에 필요한 작업을 하거나 문제 해결을 도와줄 기계나 로봇을 만들고자 노력해왔으며, 이런 기계나 로봇이 우리처럼 행동하거나 문제를 풀도록 가르쳤다. 그러다가 1950년대 후반에 들어서 인공지능과 머신 러닝이란 단어가 ‘뉴런을 수학적으로 모델링한 것’이라는 의미로 등장하면서부터 상황은 급변하기 시작했다. 용어에는 오해의 소지가 다분했지만 분야 자체는 상당히 흥미로웠다. 특히 빅데이터 시대가 도래하면서 아직 초기 단계에 불과하기는 하지만 머신 러닝은 뛰어난 도구를 개발하는 데 공헌했다.
따라서 머신 러닝은 실제로 존재하고 응용 분야는 나날이 확장되고 있으며, 이러한 도구들, 즉 우리를 도와주는 ‘비서들’은 가까운 미래에 더욱 다양하게 등장할 것이다. 머신 러닝의 응용 분야는 지금도 활발히 적용되고 있는 이미지 분야부터 헬스케어와 DNA 연구에 이르기까지 다양하게 확장하고 있다. 특히 DNA 연구에서 머신 러닝은 유전자의 기능 조합을 분석하기 위한 다양한 방법을 제시했다. 머신 러닝은 운송 영역에도 적용돼 인식과 계획 관련 기술을 좀 더 정교하게 발전시켜서 매일 출퇴근하는 동안 안전하고 안락한 교통 수단을 제공해줄 수도 있고, 기발한 방식으로 개체들을 연결해 일상생활을 윤택하게 만들어줄 것이다.
머신 러닝이 인간의 삶에 갑자기 들이닥치면서 우리 모두 머신 러닝에 어떤 식으로든 관심을 가질 수밖에 없게 됐다. 그중 일부는 머신 러닝의 작동 원리만큼은 확실하게 이해해야 한다. 또 어떤 이들은 가장 적합한 알고리즘을 선택하고 시스템을 배치하는 단계에서 치명적인 편향이 발생하지 않도록 데이터셋을 올바르게 정의하고, 만들고, 고를 수 있을 정도로 다양한 머신 러닝 기법을 깊이 있게 이해해야 한다. 그 외의 사람들도 최소한 머신 러닝 기술의 한계와 잠재적인 위험을 잘 파악해서 차분한 마음으로 활용할 수 있어야 한다.
안드리 부르코프의 책에서는 바로 이러한 것들을 설명하고 있다. 복잡한 수학 이론에서 헤매지 않고 꼭 필요한 기초만 강조함으로써, 고전 통계 기법부터 최신 딥러닝 기법에 이르기까지 머신 러닝이 제공하는 다양한 기법을 빠르게 습득할 수 있다. 이 책은 사람들이 헷갈리기 쉬운 개념과 용어들을 명확하고 간결하고 논리적으로 정리해준다. 나아가 실전에서 알고리즘을 효과적으로 구현할 수 있도록 파이썬 코드 예제도 제시하고 있다.
입문자부터 실력 있는 전문가에 이르기까지 다양한 독자가 이 책을 레퍼런스로 삼아 머신 러닝의 모든 측면을 확실히 이해하고 마스터할 수 있을 것이다.

ㅡ 뤽 줄리아 박사(Dr. Luc JULIA) /삼성 이노베이션 CTO & SVP 베스트셀러 『L'intelligence artificielle n'existe pas』의 저자

이 책의 대상 독자

이 책은 1960년대부터 지금까지 개발된 머신 러닝에 관련된 기술 중에서도 활용 가치가 높다고 증명된 것만 소개한다. 머신 러닝을 처음 배우는 독자들은 이 책에 나온 내용만 잘 익혀도 이 분야를 이해하고 질문을 제대로 던질 수 있게 된다.
머신 러닝에 대한 경험을 어느 정도 갖춘 현업 엔지니어는 이 책에 나온 내용을 가이드로 삼아서 실력을 더욱 향상시킬 수 있다. 이 책은 또한 프로젝트 초반에 브레인스토밍을 하는 데도 유용하다. 특히 프로젝트에서 해결해야 할 비즈니스적인 문제나 기술적인 문제에 ‘머신 러닝’을 적용할 수 있는지, 만약 그렇다면 어떤 기법을 적용해야 하는지를 파악하는 데 도움이 된다.

이 책의 활용 방법

머신 러닝을 처음 학습하는 독자는 반드시 처음부터 끝까지 빠짐없이 모두 읽길 바란다. 그중 특정한 주제에 대해 깊이 알고 싶다면, 각 절에 나온 QR 코드를 따라가보길 바란다.
QR 코드 페이지에는 참고 문헌, 비디오, Q&A, 코드 예제, 튜토리얼을 비롯한 다양한 자료가 있다. 이 내용은 저자를 비롯한 전 세계 독자들이 꾸준히 업데이트한다.

상세 이미지

저자/역자 소개

지은이의 말

이 책을 시작하기에 앞서 분명히 밝힐 사실이 있다. 바로 기계(머신, machine)는 학습하지 않는다는 것이다. 흔히 말하는 ‘머신 러닝(기계 학습, machine learning)’은 주어진 입력 집합(훈련 데이터, training data)에 대해 정해진 값을 출력하는 수학 공식을 찾는 것을 말한다. 이러한 수학 공식은 훈련에 사용하지 않은 다른 데이터에 대해서도 정답에 가까운 결과를 출력한다. 단, 입력이 훈련 데이터의 통계 분포와 같거나 비슷해야 한다.
그렇다면 기계가 학습할 수 없는 이유는 무엇일까? 입력이 조금이라도 달라지면 정답과 완전히 다른 오답을 출력할 가능성이 높기 때문이다. 동물은 이렇게 학습하지 않는다. 화면을 똑바로 쳐다보면서 비디오 게임을 하는 방법을 배웠다면, 화면의 방향을 틀어도 게임을 할 수 있다. 하지만 머신 러닝에서는 화면을 똑바로 쳐다본 상태로 훈련시켜서 나온 알고리즘을 기울인 화면에 대해서도 훈련시키지 않는 한, 기울인 화면에서는 제대로 게임을 하지 못한다. 그렇다면 왜 ‘머신 러닝’이라 부르는 것일까? 흔히 그렇듯이 마케팅을 위한 의도가 다분하다. 머신 러닝이란 표현은 컴퓨터 게임과 인공지능(artificial intelligence) 분야를 개척한 미국의 아더 새뮤얼(Arthur Samuel)이 1959년 IBM에 근무하면서 만들었다. 2010년 대에 IBM이 경쟁사와 차별화하기 위해 ‘인지 컴퓨팅(cognitive computing)’이란 용어를 내세웠던 것처럼, 과거에도 고객과 우수한 직원을 유치하기 위해 ‘머신 러닝’이라는 차별화된 용어를 사용했던 것이다.
인공지능이 진짜 지능이 아니듯이, 머신 러닝도 학습이 아니다. 하지만 머신 러닝은 현재 구체적으로 프로그래밍하지 않고도 다양한 일을 처리할 수 있는 머신을 개발하는 과학과 공학을 의미한다고 널리 알려져 있다. 그래서 여기서 말하는 ‘학습’은 동물의 학습 과정과 같지 않고, 일종의 비유인 셈이다.

지은이 소개

안드리 부르코프(Andriy Burkov)

두 아이의 아빠이자 캐나다 퀘벡 시에서 머신 러닝 전문가로 활동하고 있다. 9년 전 AI 분야로 박사 학위를 취득한 후 6년 동안 가트너에서 머신 러닝 수석 개발자로 일하고 있다.
전문 분야는 자연어 처리다. 현재 팀에서 표층 학습 기법과 심층 학습 기법을 모두 적용해 최첨단 텍스트 추출 및 정규화 시스템을 개발하고 있다.

옮긴이의 말

제 학부 시절에 머신 러닝은 과거에 잠시 주목받았지만 대학원 전공으로 삼기에는 전망이 좋지 않다는 인식이 지배적이었습니다. 그러나 졸업 후 몇 년도 채 지나지 않아서 분위기가 완전히 달라진 것을 보니 어안이 벙벙할 정도입니다. 이제는 전문가가 되기 위해서가 아니라, 기본 교양으로 머신 러닝을 배워야 하는 시대가 됐습니다. 특히 현재 기술의 효과와 한계를 명확히 이해하는 것이 무엇보다 중요합니다. 자칫 공상 과학 소설과 현실을 혼동하거나, 본의 아니게 과장과 거짓말을 할 위험도 있기 때문입니다. 개인적으로는 처음부터 정의와 의미를 정확히 짚고 넘어가는 것이 도움이 된다고 생각합니다. 물론 수식 하나 없이 친구가 얘기해주는 것 같은 설명이 처음에는 편하더라도 결국 딱딱한 정의와 수식을 찾아가게 됩니다. 프로그램에 대한 최고의 문서가 코드이듯, 아쉽지만 머신 러닝도 기반 수학 이론에 익숙해질 필요가 있다고 느꼈습니다.
이 책은 머신 러닝에 대해 어렴풋이 들어본 입문자가 핵심 이론을 확실히 익히면서 최근 동향에 대해 감을 잡기에 좋습니다. 원서가 100페이지 정도의 적은 분량으로 중요한 내용만 다루고 있어서 언제든 책상 곁에 두고 틈틈이 참고하기에 좋습니다. 압축된 표현과 수식에 당황할 수 있지만, 군더더기 없어서 오히려 본질에 집중할 수 있습니다. 책은 얇지만 원서 웹사이트와 깃허브에서 풍부한 관련 자료와 다양한 파이썬 예제를 제공하고 있습니다. 이전에 번역했던 다른 책과 마찬가지로 빠른 이해와 정확한 전달에 우선순위를 뒀습니다. 그래서 용어나 표현도 가급적 널리 사용하는 것을 따르거나 부득이한 경우 음차 표기했습니다. 특히 이 분야는 오래전에 정립된 통계학 용어와 영문 용어가 혼재돼 있습니다. 좀 아쉽더라도 익숙함을 기준으로 용어를 통일했습니다. 최대한 자연스럽게 표현하고 본래 의미도 보존하려 노력했지만, 미처 걸러내지 못한 미흡한 부분이 있다면 미리 양해를 구합니다.

옮긴이 소개

남기혁

고려대 컴퓨터학과에서 학부와 석사 과정을 마친 후 한국전자통신연구원에서 선임 연구원으로 재직하고 있으며, 현재 ㈜프리스티에서 네트워크 제어 및 검증 소프트웨어 개발 업무를 맡고 있다. 한빛미디어에서 출간한 『Make: 센서』(2015), 『메이커 매뉴얼』(2016), 『이펙티브 디버깅』(2017), 에이콘출판사에서 출간한 『GWT 구글 웹 툴킷』(2008), 『해킹 초보를 위한 USB 공격과 방어』(2011), 『자바 7의 새로운 기능』(2013), 『iOS 해킹과 보안 가이드』(2014), 『Neutron 오픈스택 네트워킹』(2015), 『실전 IoT 네트워크 프로그래밍』(2015), 『애플 워치 WatchKit 프로그래밍』(2015), 『현대 네트워크 기초 이론』(2016), 『도커 컨테이너』(2017), 『스마트 IoT 프로젝트』(2017), 『파이썬으로 배우는 인공지능』(2017), 『메이커를 위한 실전 모터 가이드』(2018), 『트러블슈팅 도커』(2018), 『Go 마스터하기』(2018), 『자율 주행 자동차 만들기』(2018) 등을 번역했다.

이용진

포스텍 컴퓨터공학과 석사 과정에서 머신 러닝을 전공했으며, 2003년 한국데이터마이닝학회에서 ‘Best Student Paper’를 수상했다. 2004년부터 한국전자통신연구원에서 근무 중이다. 워싱턴대학교의 전기공학과에서 박사 과정을 밟는 동안 인공지능, 고급 선형 대수, 컨벡스 최적화 과목의 수업 조교를 맡았다. 현재는 한국전자통신연구원에서 심층 신경망과 강화 학습 관련 연구를 수행하고 있다.