OpenCV 컴퓨터 비전 프로젝트 [증강현실부터 자동차 번호판, 얼굴 인식, 3D 머리 포즈 추적까지]

원서명Mastering OpenCV with Practical Computer Vision Projects (ISBN 9781849517829)
지은이다니엘 렐리스 바지우(Daniel Lélis Baggio), 셰르빈 이마미(Shervin Emami), 다비드 밀란 에스크리바(David Millán Escrivá), 크베드체니아 아이에브젠(Khvedchenia Ievgen), 노린 마흐무드(Naureen Mahmood), 제이슨 사라기(Jason Saragih), 로이 실크롯(Roy Shilkrot)
옮긴이이문호

ISBN : 9788960778337
35,000원
2016년 03월 18일 펴냄 (절판)
페이퍼백 | 460쪽 | 188*235mm
시리즈 : acorn+PACKT, 오픈소스 프로그래밍

판매처

현재 이 도서는 구매할 수 없습니다.

파일다운로드

책 소개
저자/역자 소개
목차
정오표
도서 오류 신고

책 소개

요약

OpenCV에 대한 기본 지식을 갖췄으며, 관심 있는 프로젝트를 시도하면서 컴퓨터 비전 이론을 적용하려는 독자를 위한 책이다. 컴퓨터 비전 분야의 실시간 모바일 앱, 증강현실, 3D 모양 재구성, 자동차 번호판 인식, 3D 머리 포즈 추적, 얼굴 검출, 얼굴 추적, 얼굴 인식 등 다양한 OpenCV 기반 프로젝트 구현 과정을 이론과 연계해 상세하게 설명함으로써 현장에서 접할 수 있는 문제를 해결하는 데 지름길을 제공한다.

이 책에서 다루는 내용

간단한 얼굴, 눈, 피부 검출, 피셔 얼굴, 얼굴 인식, 3D 머리 방향과 복잡한 얼굴 특징 추적을 이용한 얼굴 분석

SVM과 신경망을 포함한 인공지능(AI)을 이용해 자동차 번호판 검출과 광학 문자 인식(OCR)

간단한 인공 마커나 복잡한 자연 영상으로 데스크톱과 아이폰 및 아이패드용 증강현실 구현

3D SfM 카메라 재투영 방법을 이용해 평면 2D 카메라를 이동한 후 3D 객체 모델 생성

실시간 데스크톱 컴퓨터 비전 애플리케이션을 안드로이드와 iOS 모바일 앱으로 훨씬 적합하게 재설계

엑스박스 키넥트 센서로 동적 입력인 몸 전체를 사용해 인간-컴퓨터 상호작용 실행

이 책의 대상 독자

이 책은 자신의 기술에 컴퓨터 비전 기술을 더 추가하려는 노련한 OpenCV 전문가뿐만 아니라 실전 컴퓨터 비전 프로젝트를 개발하기 위한 OpenCV 기본 지식을 가진 개발자에게도 완벽한 책이다. 실전 단계별 지침을 통해 OpenCV C++ 인터페이스를 사용하여 실제 문제를 해결하려는 컴퓨터과학 대학 고학년이나 대학원생, 연구자, 컴퓨터 비전 전문가를 대상으로 한다.

이 책의 구성

1장, '안드로이드용 만화 생성기와 피부 변환기'에서는 완벽한 지침서와 피부색 변환기를 비롯해 가능한 여러 가지 가능한 만화 유형과 실제 카메라 영상으로부터 만화나 그림을 자동으로 만드는 데스크톱 애플리케이션과 안드로이드 앱 모두에 대한 완벽한 튜토리얼과 소스코드를 다룬다.

2장, '아이폰과 아이패드의 마커 기반 증강현실'에서는 각 단계에 대한 설명과 소스코드로 아이패드와 아이폰 기기용 마커 기반 증강현실(AR) 애플리케이션을 구축하는 방법을 알아본다.

3장, '비마커 증강현실'에서는 비마커 AR에 대한 설명과 소스코드로 비마커 증강현실 데스크톱 애플리케이션을 개발하는 방법에 대해 다룬다.

4장, 'OpenCV를 활용한 SfM 탐색'에서는 OpenCV의 SfM 개념 구현을 통해 SfM을 소개한다. 독자는 다중 2D 영상과 카메라 위치 추정으로부터 3D 기하학을 재구성하는 방법을 배운다.

5장, 'SVM과 신경망을 활용한 번호판 인식'에서는 완벽한 지침서와 서포트 벡터 머신(SVM, Support Vector Machine)과 신경망을 이용해 자동차 번호판 인식 애플리케이션을 구축하는 는 소스코드를 다룬다. 독자는 학습하고 영상이 번호판인지 아닌지 결정하는 패턴 인식 알고리즘을 익히고 예측하는 방법을 배운다. 특징 집합을 문자로 분류할 때 도움이 될 것이다.

6장, '비강체 얼굴 추적'에서는 완벽한 지침서와 사람 얼굴에서 복잡한 부분들을 모델링하고 추적하는 동적 얼굴 시스템을 구축에 대한 튜토리얼과 소스코드를 다룬다.

7장, 'AAM과 POSIT을 활용한 3D 머리 포즈 추정'에서는 능동 외양 모델(AAM, Active Apperance Model)이 무엇인지 이해할 때 필요한 모든 배경과 OpenCV로 서로 다른 얼굴 표현이 있는 얼굴 프레임 집합을 이용해 AAM을 생성하는 방법을 살펴본다. 또한 AAM이 제공하는 맞춤 기능을 통해 주어진 프레임과 어떻게 정합하는지에 대해 설명한다. 그 다음에는 3D 머리 포즈자세를 찾을 수 있는 POSIT 알고리즘을 적용한다.

8장, '고유얼굴과 피셔 얼굴을 활용한 얼굴 인식'에서는 완벽한 지침서와 영상 내의 회전된 얼굴과 다양한 조명 조건을 제어하는 기본 얼굴과, 눈 검출을 포함한 실시간 얼굴 인식 애플리케이션에 대한 튜토리얼과 소스코드를 다룬다.

9장, '마이크로소프트 키넥트를 이용한 플루이드 월 개발'에서는 키넥트 센서를 이용해 플루이드 월이라고 불리는 대화식 유체 시뮬레이션 개발을 완벽하게 다룬다. OpenCV의 옵티컬 플로우 방법과 유체 해석기를 통합해 키넥트 데이터를 다루는 방법도 설명한다.

저자/역자 소개

지은이의 말

이 책은 9장으로 구성되어 있으며, 각 장은 OpenCV의 C++ 인터페이스를 기반으로 한 전체 코드를 포함하며, 시작부터 끝까지 프로젝트의 모든 내용을 담은 지침서다. 각 장은 저자들이 OpenCV 커뮤니티에 해당 주제에 대해 잘 작성해 기여했던 것 중에서 선택했으며, 주요 OpenCV 개발자 중 한 명이 이 책을 감수했다. OpenCV 함수의 기본을 설명하지는 않지만, 여러 가지 3D 카메라 프로젝트(증강현실, 움직임에 따른 3D 구조, 키넥트 상호작용)와 다양한 얼굴 분석 프로젝트(피부 검출, 간단한 얼굴과 눈 검출, 복잡한 얼굴 특징 추적, 3D 머리 방향 추정과 얼굴 인식)를 포함한 전체 문제를 해결하기 위해 OpenCV를 어떻게 적용하는지를 보여주는 첫 번째 책이다. 그러므로 기존 OpenCV 책들과 훌륭한 동반자가 될 것이다.

지은이 소개

다니엘 렐리스 바지우(Daniel Lélis Baggio)

상파울로에 있는 InCor(Instituto do Coração, 심장연구소)에서 의학 영상 처리로 컴퓨터 비전 분야에서 일하기 시작했고, 혈관 초음파 영상 분할을 연구했다. GPGPU에 주력했으며, 엔디비아의 쿠다(CUDA)로 작업해 분할 알고리즘을 이식했다. 에치(ehci, http://code.google.com/p/echi) 프로젝트를 통해 내추럴 유저 인터페이스 그룹에서 6 자유도 머리 추적에 참여하기도 했다. 현재 브라질 공군에서 근무하고 있다.

셰르빈 이마미(Shervin Emami)

이란 태생으로 호주에서 10대 초반에 전자공학을 독학했고, 로봇공학(로보틱스?)을 취미로 삼았다. 15살에 첫 로봇을 만들면서 RAM과 CPU 작업을 어떻게 하는지 공부했다. 즉시 로봇을 제어하는 전체 Z80 마더보드를 설계하고 만든 후 0과 1에 대응하는 두 개의 누름 버튼을 사용해 순수 이진 기계 코드로 소프트웨어를 작성하는 개념으로 모두를 놀라게 했다. 어셈블리어는 물론 고급 컴파일러 같이 훨씬 쉬운 방법으로 컴퓨터 프로그램을 작성하는 방법을 배운 후 컴퓨터 프로그래밍에 빠졌으며, 그 후 거의 매일 데스크톱, 로봇과 스마트폰을 프로그래밍했다. 10대 후반에 C와 어셈블리 코드로 최적화한 3만 줄짜리였던 3D 모델러 Draw3D(http://draw3d.shervinemami.info)를 만들었으며, 당시의 모든 시장 제품보다 3D 그래픽스를 더 빠르게 렌더링했다. 그러나 3D 하드웨어 가속을 활용할 수 있게 됨에 따라 그래픽스 프로그래밍에 흥미를 잃었다.

학부 시절 때 컴퓨터 비전 과목을 택했으며, 상당한 관심을 보였다. 2003년, 첫 학위 논문에서 카메라 입력을 지원하는 OpenCV(베타 3)를 사용해서 고유 얼굴(Eigenfaces)에 기반을 둔 실시간 얼굴 검출 프로그램을 만들었다. 2005년, 석사학위 논문에서 OpenCV(v0.96)를 이용해 여러 모바일 로봇의 시각 내비게이션 시스템을 개발했다. 2008년부터 아부다비와 필리핀에서 프리랜서 컴퓨터 비전 개발자로 일하고 있으며, 다음과 같은 수많은 단기 상업적인 프로젝트에서 OpenCV를 사용했다.

■ 하르(Haar) 또는 고유 얼굴을 이용한 얼굴 검출

■ 신경망, EHMM이나 고유 얼굴을 이용한 얼굴 인식

■ AAM과 POSIT를 활용해 단일 사진에 있는 얼굴의 3D 위치와 방향 검출

■ 단일 사진만 활용한 3D 얼굴 회전

■ 단일 사진 내 임의의 3D 방향을 활용한 얼굴 전처리와 인공조명

■ 성별 인식

■ 얼굴 표현 인식

■ 피부색 검출

■ 홍채 검출

■ 눈동자 검출

■ 시선 추적

■ 시각 돌출 추적

■ 히스토그램 정합

■ 신체 크기 검출

■ 셔츠와 비키니 검출

■ 지폐 인식

■ 비디오 안정화

■ 아이폰에서의 얼굴 인식

■ 아이폰에서의 음식 인식

■ 아이폰에서의 마커 기반 증강현실(당시의 아이폰 증강현실 앱에서 두 번째로 빨랐다)

OpenCV는 셰르빈 가족의 식탁에 일용할 양식을 제공했다. 이런 이유로 포럼에서 정기적으로 조언하고 사이트(http://shervinemami.info/openCV.html)에 OpenCV 강의록을 자유롭게 올렸으며, OpenCV로 다시 기부했다. 2011년, 이 책을 집필하기 위해 다른 공개 OpenCV 웹사이트 주인장에게 연락했다. 엔디비아에서 모바일 디바이스용 컴퓨터 비전 최적화를 위해 일하기도 했으며, 안드로이드용 최적화 버전을 만들기 위해 공식 OpenCV 개발자와 긴밀하게 작업했다. 2012년, 향후 OpenCV가 기반이 될 모바일 디바이스용 컴퓨터 비전의 하드웨어 가속 표준화를 위한 크로노스 OpenVL 위원회에도 참여했다.

다비드 밀란 에스크리바(David Millán Escrivá)

8살 때 8086 PC에서 베이직 언어로 기본 방정식의 2D 플로팅이 가능한 첫 프로그램을 만들었다. 2005년, 컴퓨터 비전이 바탕인 인간-컴퓨터 상호작용 분야에서 OpenCV(v0.96)로 상을 받았으며, 발렌시아 공과대학에서 학업을 마쳤다. 오픈소스이자 3D 소프트웨어 프로젝트인 블렌더에 참여했고, 컴퓨터 그래픽스 소프트웨어 개발자로서 첫 상업 영화인 〈프리버즈: 밍쿠와 찌아의 도시 대탈출〉을 제작했다.

컴퓨터 비전, 컴퓨터 그래픽스와 패턴 인식 분야에서 경험을 쌓고, 다른 프로젝트와 스타트업에서 컴퓨터 비전, 광학 문자 인식, 증강현실의 지식을 활용하면서 근무했으며, 이제 IT 분야에서 10년 이상의 경력을 쌓았다.

OpenCV, 일반적인 컴퓨터 비전, 광학 문자 인식 알고리즘에 관한 연구 논문과 지침서를 펴내는 DamilesBlog(http://blog.damiles.com)를 운영 중이다. 리 필립스가 집필해 팩트출판사에서 출간한 『gnuPlot Cookbook』을 감수했다.

크베드체니아 아이에브젠(Khvedchenia Ievgen)

우크라이나의 컴퓨터 비전 전문가다. 하르만 인터내셔널에서 카메라 기반 드라이버 보조 시스템 연구 개발로 경력을 시작했다. 그 후에는 ESG의 컴퓨터 비전 컨설턴트로 일했다. 현재는 증강현실 애플리케이션 개발에 중점을 둔 개인 사업을 하는 개발자다. Computer Vision Talks 블로그(http://computer-vision-talks.com)를 운영하고 있으며, 컴퓨터 비전과 증강현실에 관계 있는 연구 논문과 튜토리얼을 게재한다.

노린 마흐무드(Naureen Mahmood)

텍사스 A&M 대학교의 시각화 학부를 최근 졸업했다. 다양한 프로그래밍 환경, 애니메이션 소프트웨어와 마이크로컨트롤러 전자공학에서 경험을 쌓았다. 센서 기반 전자공학과 소프트웨어 엔지니어링을 이용한 대화식 애플리케이션을 만들었다. 애니메이션 특수 효과에 사용하는 물리 기반 시뮬레이션 개발에도 참여했다.

제이슨 사라기(Jason Saragih)

호주 캔버라에 있는 호주 국립 대학교에서 2004년에 기계공학 공학석사 학위를 받았고(우등생으로), 2008년에 컴퓨터과학 박사학위를 취득했다. 2008년부터 2010년까지 피츠버그에 있는 카네기멜론 대학교의 로봇 연구소에서 박사 후 과정을 수료했다. 2010년부터 2012년까지 연구 과학자로서 연방 과학 산업 기구(CSIRO)에서 근무했다. 현재는 호주 기술 스타트업 회사인 비주얼 피쳐스(Visual Features)의 수석 연구 과학자다. 컴퓨터 비전 분야, 특히 변형 가능한 모델 등록 및 모델링 주제에 많이 공헌했다. 과학 커뮤니티에서 널리 사용하는 두 개의 비영리적인 오픈소스 라이브러리 개발자로서 DeMoLib와 FaceTracker 모두 OpenCV를 비롯한 범용 컴퓨터 비전 라이브러리를 이용한다.

로이 실크롯(Roy Shilkrot)

연구자이자 컴퓨터 비전과 컴퓨터 그래픽스 분야의 전문가다. 텔아비브파야 아카데믹 대학에서 컴퓨터과학 학사학위를 취득했다. 현재 캠브리지에 있는 매사추세츠 공과대학(MIT)의 미디어 연구소에서 박사 과정을 밟고 있다. 스타트업 회사와 대기업에서 소프트웨어 엔지니어로 7년간 경험을 쌓았다. MIT 미디어 연구소에 연구 조교로 들어가기 전에 통신 솔루션 공급자인 컴버스의 혁신 연구소에서 기술 전략가로서 근무했다. 또한, 컨설턴트를 잠시 해보기도 했으며, 레드몬드에 있는 마이크로소프트 연구소에서는 인턴으로 일했다.

옮긴이의 말

지금 생각해도 까마득한 2012년 겨울, 이 책의 원서인 『Mastering OpenCV with Practical Computer Vision Projects』의 목차를 보자마자 OpenCV로 컴퓨터 비전 애플리케이션을 제대로 만들고 싶은 독자에게 한 줄기 빛이 될 것이라 믿어 의심치 않았고 이 책에 대해 큰 책임을 느꼈다. 번역에 대한 부담감이 밀려오면서 한편으로는 “이런 책이 우리나라에서 출간됐다면 얼마나 좋았을까”라는 씁쓸하면서도 부러운 마음을 감출 수 없었다. 다른 분야도 그렇겠지만, 우리나라에서는 안타깝게도 자신이 힘들게 만든 소스를 자유롭게 활용하길 바라는 마음으로 온라인에 공개하고, 노하우를 함께 공유해 더 나은 결과를 얻을 수 있는 환경이 아직까지 무르익지 않았다.
컴퓨터 비전은 실제로 이론서에서 무수하게 접하는 영상 처리부터 증강현실, 패턴 인식, 신경망 등 다양한 분야를 아우르는 이론에 대해 많은 이해가 필요한 분야다. 아무리 노련한 전문가라도 구현 환경이 서로 다른 상황에서 이론을 어떻게 실무에 적용할지 한계에 부딪칠 때가 많을 진데, 하물며 OpenCV를 갓 뗀 입문자에게는 어디서부터 시작해야 하는지에 대한 안내서가 없어 시작부터 커다란 벽과 마주하게 된다. 이러다 보니 특히 실무에 즉시 활용할 수 있는 책이 국내외에 거의 없어 좌절할 수도 있다. 고생해가면서 만든 결과가 너무 아까워 남에게 잘 공유하지 않아 누군가가 또다시 같은 길을 반복하는 것이 작금의 현실이 아닌가 싶다.
이 책은 저자 세르빈이 컴퓨터 비전 분야에서 OpenCV를 이용해 만든 프로그램 소스를 공개하며 기고하는 열정적인 전문가이자 블로거인 여덟 저자를 섭외하고 협업해 세계 각지에 흩어져 있는 어려운 현실을 딛고 공동 집필한 책이다. 글로만 두리뭉실 접했을 카메라 응용, 증강현실, 자동차 번호판 인식, 얼굴 검출, 얼굴 추적, 얼굴 인식에 이어 안드로이드/iOS 앱 개발 프로젝트까지 제공하고 있어, 독자에게 “컴퓨터 비전은 결국 사람이 하는 분야다.”라는 불변의 진리를 일깨워주는 책이라고 할 수 있다.
이 책은 흔히 볼 수 있는 따라 하기 방식의 책이 아니다. OpenCV를 설치하면 딸려 나오는 예제의 부족함을 많이 채워주면서, 독자가 관심 분야에 맞는 장을 골라 읽으며 이론을 실무 프로젝트로 풀어 나갈 수 있도록 지름길을 제시한다. 특히 얼굴 검출부터 얼굴 추적, 얼굴 인식 과정까지 상세하게 다루고 있으며, 함수 위주의 기존 OpenCV 책과 상당히 차별화되어 있다. 다만 입문자가 쉽게 볼만한 책이 아니므로, C/C++로 OpenCV를 어느 정도 다룰 수 있게 해당 분야의 이론에 대한 선수 배경 지식을 미리 습득할 것을 권장한다. 그 전까지는 OpenCV의 기본을 설명한 OpenCV 책을 이론서와 함께 공부하면 더욱 좋다.
이 책과 더불어 최신 OpenCV 기반의 다양한 컴퓨터 비전 프로젝트 실습과 이론에 대해 깊이 있는 이해를 다룬 책인 『OpenCV By Example』과 『OpenCV Blueprints』를 참고한다면 자신만의 컴퓨터 비전 애플리케이션 프로젝트 개발에 더 많은 도움이 될 것이다.

옮긴이 소개

이문호

관심 분야는 정보 검색이며, 매일 4시간 이상 걸리는 출퇴근 시간에 다방면의 원서를 읽는 쏠쏠한 즐거움에 빠져 사는 아날로그 세대다. 현재 문헌정보학 박사 과정에 있으며, 온톨로지 플랫폼 관련 솔루션 개발에 전념하고 있다. 오픈소스 자바 검색 엔진인 루씬(Lucene)에 관한 첫 국내서인 『루씬 인 액션』(에이콘출판사, 2005)을 공역했으며, 오픈소스 영상 처리 라이브러리를 다룬 오픈소스 라이브러리 실무 시리즈 도서를 펴낸 저자로도 잘 알려져 있다. 『MATLAB을 활용한 실용 디지털 영상 처리』(홍릉과학출판사, 2005), 『오픈소스 OpenCV를 이용한 컴퓨터 비전 실무 프로그래밍』(홍릉과학출판사, 2007) 등 7권의 책을 저술했으며, 번역서로는 에이콘출판사에서 출간한 『OpenCV 2 Computer Vision Application Programming Cookbook 한국어판』(2012), 『EmguCV와 테서렉트 OCR로 하는 컴퓨터 비전 프로그래밍』(2014), 『OpenCV 프로그래밍』(2015), 『(개정판) OpenCV를 활용한 컴퓨터 비전 프로그래밍』(2015), 『matplotlib을 이용한 데이터 시각화 프로그래밍』(2015)이 있다.

1 안드로이드용 만화 생성기와 피부 변환기
웹캠에 접근
데스크톱 앱용 주 카메라 처리 반복문
흑백 스케치 생성
컬러 페인팅과 만화 생성
에지 필터를 이용한 ‘악마’ 모드 생성
피부 검출을 이용한 ‘에일리언’ 모드 생성
- 피부 검출 알고리즘
- 얼굴이 있는 곳 보여주기
- 피부색 변환기 구현
데스크톱에서 안드로이드로 이식
- OpenCV를 이용한 안드로이드 프로젝트 설정
  - 안드로이드의 영상 처리에 사용하는 컬러 포맷
  - 카메라의 입력 컬러 포맷
  - 띄우기 위한 결과 컬러 포맷
- 안드로이드 NDK 앱에 만화 생성기 코드 추가
  - 안드로이드 앱 검토
  - 사용자가 화면을 탭하면 영상을 만화로 생성
  - 영상을 파일로 저장하고 안드로이드 사진 갤러리에 저장
- 저장한 영상에 관한 안드로이드 통지 메시지 보여주기
  - 안드로이드 메뉴 바를 통해 만화 모드로 변경
- 스케치 영상에 있는 무작위 후추 잡음 줄이기
  - 앱에 FPS 보여주기
  - 여러 카메라 해상도 사용
  - 앱을 사용자 정의
요약
2 아이폰과 아이패드상의 마커 기반 증강현실
OpenCV를 이용한 iOS 프로젝트 생성
- OpenCV 프레임워크 추가
- OpenCV 헤더 인클루드
애플리케이션 구조
- 카메라 접근
마커 검출
- 마커 식별
  - 그레이스케일 변환
  - 영상 이진화
  - 외곽선 검출
  - 후보 검색
- 마커 코드 인식
  - 마커 코드 읽기
  - 마커 위치 정제
3D에서 마커 배치
- 카메라 보정
- 마커 포즈 추정
3D 가상 객체 렌더링
- OpenGL 렌더링 레이어 생성
- AR 장면 렌더링
요약
참고 문헌
3 비마커 증강현실
마커 기반 AR과 비마커 AR
비디오에 있는 임의 영상을 찾기 위한 특징 기술자 사용
- 특징 추출
- 패턴 객체 정의
- 특징점 정합
  - PattternDector.cpp
- 이상치 제거
  - 교차 정합 필터
  - 비율 판정법
  - 호모그래피 추정
  - 호모그래피 정제
- 클래스에 모두 넣기
패턴 포즈 추정
- PattternDetector.cpp
- 카메라 내부 행렬 얻기
  - Pattern.cpp
애플리케이션 인프라스트럭처
- ARPipeline.hpp
- ARPipeline.cpp
- OpenCV의 3D 시각화 지원 활성화
- OpenCV를 이용한 OpenGL 창 생성
- OpenCV를 이용한 비디오 캡처
- 증강현실 렌더링
  - ARDrawingContext.hpp
  - ARDrawingContext.cpp
- 시연
  - main.cpp
요약
참고 문헌
4 OpenCV를 활용한 SfM 탐색
SfM 개념
영상 쌍으로부터 카메라 모션 추정
- 풍부한 특징 기술자를 이용한 점 정합
- 옵티컬 플로우를 이용한 점 정합
- 카메라 행렬 찾기
장면 재구성
많은 시점으로부터 재구성
재구성 정제
PCL로 3D 점 구름 시각화
예제 코드 사용
요약
참고 문헌
5 SVM과 신경망을 활용한 번호판 인식
ANPR 소개
ANPR 알고리즘
번호판 검출
- 분할
- 분류
번호판 인식
- OCR 분할
- 특징 추출
- OCR 분류
평가
요약
6 비강체 얼굴 추적
개요
유틸리티
- 객체지향 설계
- 데이터 컬렉션: 영상과 비디오 주석
  - 학습 데이터 유형
  - 주석 도구
  - 사전 주석 데이터(MUCT 데이터 집합)
기하학적 제약
- 프로크러스티즈 분석
- 선형 모양 모델
- 국부-전역 표현 조합
- 학습 후 시각화
얼굴 특징 검출기
- 상관관계 기반 패치 모델
  - 식별 패치 모델 학습
  - 생성와 식별 패치 모델
- 전역 기하 변환 처리
- 학습과 시각화
얼굴 검출과 초기화
얼굴 추적
- 얼굴 추적기 구현
- 학습과 시각화
- 범용 모델과 개인 고유 모델
요약
참고 문헌
7 AAM과 POSIT를 활용한 3D 머리 포즈 추정
능동 외양 모델 살펴보기
능동 모양 모델
- PCA 감 잡기
- 삼각화
- 삼각 텍스처 워핑
모델 인스턴스 생성: 능동 외양 모델 활용
AAM 탐색과 맞춤
POSIT
- POSIT에 빠져 보기
- POSIT과 머리 모델
- 웹캠이나 비디오 파일에서 추적
요약
참고 문헌
8 고유 얼굴과 피셔 얼굴을 활용한 얼굴 인식
얼굴 인식과 얼굴 검출 소개
- 1단계: 얼굴 검출
  - OpenCV를 이용한 얼굴 검출 구현
  - 객체나 얼굴 검출을 위한 하르 혹은 LBP 검출기 적재
  - 웹캠 접근
  - 하르나 LBP 분류기를 이용한 객체 검출
- 얼굴 검출
- 2단계: 얼굴 전처리
  - 눈 검출
  - 눈 탐색 영역
- 3단계: 얼굴을 수집하고 학습
  - 학습하기 위한 전처리 얼굴 수집
  - 수집한 얼굴로 얼굴 인식 시스템 학습
  - 배운 지식 살펴보기
  - 평균 얼굴
  - 고윳값, 고유 얼굴과 피셔 얼굴
- 4단계: 얼굴 인식
  - 얼굴 식별: 얼굴로 사람 인식
  - 얼굴 검증: 요청 받은 사람이 맞는지 입증
- 마무리: 파일 저장과 적재
- 마무리: 멋진 대화형 GUI 개발
  - GUI 요소 그리기
  - 마우스 클릭을 확인하고 제어
요약
참고문헌
9 마이크로소프트 키넥트를 이용한 플루이드 월 개발
플루이드 월이란?
- 단일 컬러 모드
- 다중 컬러/다중 사용자 모드
- 흰 배경을 갖는 다중 사용자 모드
- 속도 벡터 모드
키넥트 센서
깊이와 사용자 추적 데이터를 검색하기 위해 키넥트 센서 설정
유체 시뮬레이션
- 시뮬레이션 렌더링
옵티컬 플로우
유체 시뮬레이션에서 키넥트 데이터와 옵티컬 플로우 통합
옵티컬 플로우를 이용한 키넥트 사용자 추적과 깊이
유체 방출과 시각화 모드
요약

도서 오류 신고

이름

e-mail

도서명

신고내용

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안

개인정보수집ㆍ이용에 동의합니다.

정오표

[본문 전체]
엔디비아
->
엔비디아

[p.24 : 5행]
기본을 설명하지 않지는 않지만
->
기본을 설명하지는 않지만

2016. 11. 11. 수정 사항

[p.385: 마지막행 ~ p.386: 1행, p.390: 아래에서 7행, p.401: 2행, p.402: 사진 위 2행, p.405: 아래에서 6행]
신뢰도 행렬, 신뢰도 미터
->
신뢰도 측정치

2016. 11. 14 수정 사항

[p.259: 마지막행]
베이커(Baker)와 콜리지스(Colleges)가
->
베이커와 동료 연구자들이