C++와 CUDA C로 구현하는 딥러닝 알고리즘 Vol.2 [복소수 영역에서의 오토인코더 이해와 구현]
- 원서명Deep Belief Nets in C++ and CUDA C Volume 2: Autoencoding in the Complex Domain (ISBN 9781514365991)
- 지은이티모시 마스터즈(Timothy Masters)
- 옮긴이이승현
- ISBN : 9791161750316
- 28,000원
- 2017년 08월 11일 펴냄
- 페이퍼백 | 256쪽 | 188*235mm
- 시리즈 : 데이터 과학
책 소개
저자 홈페이지: timothymasters.info
요약
전체 3권으로 이뤄지는 "C++과 CUDA C로 구현하는 딥러닝 신경망" 시리즈의 두 번째 책이다. 인코더와 디코더 구조를 기반으로 하면서 입력 정보를 다시 복원하는 구조의 오토인코더는 GAN 모델의 발전으로 인해 점차 그 활용도와 중요성이 커지고 있다. 1권에서 다뤘던 내용을 다시 언급하므로 1권의 내용을 충분히 숙지해주길 바란다.
먼저 기본적인 신호 처리 수준에서의 몰렛 웨이블릿 개념과 이를 이미지 처리로 확장했을 때의 푸리에 변환 개념 등을 살펴본다. 그다음 복소수 정의역에서의 오토인코딩 개념을 설명한다. 그리고 이러한 내용들을 복소수 영역에서의 신경망으로 확장해 활성화 함수와 그레디언트, SoftMax 레이어 등을 계산하는 과정으로 나눠 상세하게 살펴본다. 처음엔 단일 스레드 기반의 구현 방법부터 시작해서 마지막엔 멀티스레드 기반의 구현 방법으로 확장시킨다. 3장에서는 2장에서 각 레이어별로 구현한 내용을 GPGPU를 활용할 수 있도록 CUDA C로 구현하는 내용을 다룬다. 마지막 4장에서는 저자가 제공하는 DEEP 프로그램의 메뉴얼을 소개하면서, 사용자가 구현 결과를 미리 확인하면서 각 기능들의 실행 결과물을 쉽게 확인할 수 있도록 도와준다.
이 책에서 다루는 내용
■ 신호 처리와 이미지 처리를 위한 몰렛 웨이블릿 및 푸리에 변환
■ 오토인코딩의 기본 개념과 복소수 정의역에서의 오토인코딩 표현 이론 설명
■ 신경망 관점에서 활성화 레이어 및 그레디언트 계산 과정 설명
■ 단일 스레드 기반의 구현 방법부터 멀티스레드 기반의 구현 방법으로 확장
■ GPGPU를 활용할 수 있도록 CUDA C로 확장시켜 구현
■ DEEP프로그램의 상세한 사용자 매뉴얼 소개
■ DEEP을 이용해 구현 결과를 미리 확인하면서 각 기능들의 실행 결과물 확인
■ 필수 Deep Belief Nets 알고리즘을 구현한 C++ 코드와 윈도우 상에서 실행되는 멀티스레드 버전의 구현물과 더불어 nVidia 비디오 카드의 슈퍼 컴퓨팅 성능을 활용할 수 있도록 CUDA C 기반으로 구현한 코드 제공
이 책의 대상 독자
전체 3권으로 이뤄지는 "C++과 CUDA C로 구현하는 딥러닝 신경망" 시리즈의 두 번째 책으로 오토인코더에 대해 다룬 책이다. 그러므로 신경망에 대해 이미 기본적인 지식이 있으며, Deep Belief Nets에 대해 학습하고 실험해보면서 이를 실제 프로그램으로 구현해보고자 하는 독자를 대상으로 한다. 1권에서 다뤘던 내용을 다시 언급하기 때문에 먼저 1권의 내용을 충분히 숙지해주길 바란다.
이 책의 구성
이 책은 크게 네 부분으로 나뉜다. 첫 번째는 클래스의 생성적 모범(exemplar)을 찾아낼 수 있는 방식을 통해, 특징 셋에 클래스 레이블들을 내장시키는 기법에 대해 다룬다. 그다음에는 Deep Belief Nets에 효과적인 입력을 제공하기 위한 신호 전처리 및 이미지 전처리 기법을 다룬다. 복소수 정의역 피처를 만들어내는 전처리 방식에 각별히 신경을 쓸 것이다. 세 번째로 기본적인 오토인코더에 대한 개념을 다루면서, 복소수 정의역에서 전체적인 오토인코딩에 대해 강조한다.
이러한 기법은 특히 신호 처리나 이미지 처리와 관련된 여러 분야에서 유용하게 사용할 수 있다. 마지막으로 DEEP 프로그램의 운용 방법에 대해 다룬다. 이 프로그램은 내 홈페이지에서 무료로 다운로드할 수 있다.
목차
목차
- 1장. 소개
- 2장. 내장된 클래스 레이블
- 내장된 레이블들을 학습하는 코드
- 케이스 분류
- 클래스 조건적인 생성적 샘플링
- 3장. 신호 전처리
- 최소 변환
- 생성적 샘플들의 차이값 출력
- 함수의 경로
- 이동 윈도우에서의 푸리에 계수
- 몰렛 웨이블릿
- 주기, 너비, 지연(Lag)
- 몰렛 웨이블릿 구현 코드
- 최소 변환
- 4장. 이미지 전처리
- 2차원 공간에서의 푸리에 변환
- 2차원 공간에서의 데이터 윈도우
- 이미지의 푸리에 변환 구현 코드
- 푸리에 변환의 생성적 샘플 출력
- 2차원 공간에서의 푸리에 변환
- 5장. 오토인코딩
- 피드포워드 신경망에 대한 기본적인 수학 개념
- 오토인코더를 통한 탐욕적 훈련
- 복소수 개수에 대한 리뷰
- 복소수 정의역에서의 고속 내적 연산
- 복소수 정의역에서의 고유 값 분해
- 복소수 정의역의 활성화
- 활성화 함수의 도함수
- 로지스틱 활성화 함수와 도함수
- 그레디언트 계산
- 순수 실수 및 SoftMax 출력 오차
- 은닉층 가중치의 그레디언트
- 그레디언트 계산 구현 코드
- 전체 신경망과 도함수 계산
- 그레디언트 계산
- 멀티스레드 기반의 그레디언트 계산
- CUDA 그레디언트 계산
- 전체 알고리즘
- 디바이스 초기화
- 호스트에서 디바이스로 가중치 복사
- 활성화와 활성화 도함수
- 출력 활성화
- SoftMax 출력 변환
- 출력 델타
- SoftMax 출력의 델타
- 출력 그레디언트
- 첫 번째 은닉층의 그레디언트
- 중간 은닉층의 그레디언트
- 평균 제곱 오차
- 분류 작업에서 평가 기준으로 사용하는 로그 발생 가능 확률
- 분석
- 6장. DEEP 사용 매뉴얼
- 메뉴 옵션
- 파일 메뉴 옵션
- 테스트 메뉴 옵션
- 화면 출력 메뉴 옵션
- 데이터베이스 읽어들이기
- 시계열 데이터 읽어들이기(기본)
- 시계열 데이터 읽어들이기(경로)
- 시계열 데이터 읽어들이기(푸리에)
- 시계열 데이터 읽어들이기(Morlet)
- MNIST 이미지 읽어들이기
- MNIST 이미지 읽어들이기(푸리에)
- MNIST 레이블 읽어들이기
- 활성화된 파일에 쓰기
- 모든 데이터 삭제
- 모델 아키텍처
- 데이터베이스 입력과 목표치
- RBM 훈련 파라미터
- 감독 훈련된 훈련 파라미터
- 오토인코딩 훈련 파라미터
- 훈련
- 테스트
- 교차 검증
- 분석
- 수용 영역
- 생성적 샘플
- 내장된 모델에서 추출한 샘플
- 경로 시계열 데이터로에서 추출한 샘플
- DEEP.LOG 파일
- 메뉴 옵션