책 소개
2021년 대한민국학술원 우수학술도서 선정도서
요약
딥러닝을 포함한 머신러닝의 역사, 딥러닝과 통계 기반 머신러닝이 적용되는 영역, 딥러닝 디자인, 디자인 한계점과 해결 방법, 향후 연구 과제 등 코드 이면에 담겨있는 이야기를 전달하고자 여러 전문가가 참여했다. 문자 데이터의 컴퓨터 인식과 학습, 결과물 제시를 통해 만들 수 있는 자연어 처리 애플리케이션에 관심이 있다면 깊이 있는 지식과 혜안을 얻을 뿐만 아니라, 실무에 필요한 솔루션에 대해서도 아이디어를 얻을 수 있을 것이다.
추천의 글
"자연어 처리와 딥러닝 분야에서 국제적으로 인정받고 있는 리 덩 박사와 그가 이끄는 이 분야에서 가장 적극적인 연구 팀이 저술했다. 해당 분야 기술을 포괄적으로 안내하고 최신 연구를 소개하고 함께 자연어 처리 근본 문제를 해결할 수 있는 딥러닝 적용 방법을 설명한다. 자연어 처리를 위한 딥러닝 애플리케이션의 엄청난 진전에 발맞춰 교과서와 참고 자료를 필요로 하는 사람들이 급격히 늘고 있는 지금 이번 책의 출간은 매우 시의적절하다. 자연어 처리 기술이 필수적이자 원동력이면서 핵심 차별화 요소가 되는 인공지능을 개발하는 신생기업 실무자들에게 보기 드문 참고서 역할을 할 것이다."
- 홍지앙 장(Hongjiang Zhang)/ 소스 코드 캐피탈 창업자, 전 킹소프트(KingSoft) CEO
"자연어 처리에 적용되는 딥러닝 기술의 최근 성장을 폭넓게 소개한다. 풍부한 경험을 갖춘 딥러닝과 자연어 처리 연구원들이 준비한 구어체 언어 이해, 대화 시스템, 어휘 분석, 구문 분석, 지식 그래프, 기계번역, 질의응답, 정서 분석, 소셜 컴퓨팅 등 광범위한 자연어 처리 애플리케이션을 다룬다. 주요 연구 동향에서부터 최신 딥러닝 방법, 그 방법의 한계와 유망한 연구에 이르기까지 다양한 주제를 다룬다. 독창적인 내용, 정교한 알고리즘, 자세한 활용 사례를 제시하기 때문에 딥러닝과 자연어 처리를 배우려는 모든 독자에게 유용한 길잡이가 될 것이다."
- 하이펑 왕(Haifeng Wang)/ 바이두 부사장 및 수석연구원, 전 ACL 사장
"대부분의 음성인식 애플리케이션에서 컴퓨터가 사람에 비해 적게는 다섯 배에서 열 배의 오류를 발생시켰던 학습이 시작되던 2011년경, 나는 미래 방향으로 지식공학의 중요성을 강조했다. 그로부터 불과 몇 년 만에 딥러닝은 인간과 컴퓨터 간의 대화 음성인식 능력의 차이가 거의 없도록 줄였다. 딥러닝을 통한 음성인식 혁명의 선구자인 리 덩 박사가 편집하고 저술한 이 책은 자연어 처리의 중요한 세부 분야로써 음성인식의 매력적인 점을 멋들어지게 설명한다. 역사적 관점을 음성인식에서부터 자연어 처리 일반 영역으로 확대해 향후 자연어 처리 개발에 가치 있는 가이드를 제공한다.
이 책에서 중요한 것은 딥러닝이 겉으로는 단순히 많은 데이터, 뛰어난 컴퓨팅 능력, 복잡한 모델을 이용하는 것처럼 보일지라도 현재의 딥러닝 추세는 이전의 데이터 중심의 얕은 머신러닝 시대에서 나온 혁명이라고 주장한다. 사실 자연어 처리 애플리케이션을 위해 개발된 최신 딥러닝 기술은 개별 태스크를 성공적으로 해결했음에도 풍부한 지식이나 인간의 인지 능력을 충분히 활용하지 못했다. 따라서 편집자와 저자의 견해와 마찬가지로 지식공학을 완벽하게 통합하는 고도화된 딥러닝이 자연어 처리 혁명의 길을 열어줄 것이라는 주장을 지지한다.
음성 및 자연어 처리 연구자, 엔지니어, 학생들이 자연어 처리와 딥러닝 최첨단 기술을 학습하고 미래에 대한 중요한 통찰력을 얻을 수 있도록 이 책을 읽을 것을 권한다."
- 사다오키 후루이(Sadaoki Furui)/ 시카고 토요타 기술 연구소 사장
“음성, 시각, 언어 분야에서 딥러닝의 급부상으로 흥분감이 높다. 이 책을 읽으면 그 흥분감이 어디에서 왔는지 충분히 이해할 수 있을 것이다.“
- 켄 처치(Ken Church)/ IBM 연구소, 전 ACL 사장
이 책의 대상 독자
주요 목표는 자연어 처리에 적용된 최근 딥러닝의 발전에 관한 포괄적인 조사 내용을 제공하는 데 있다. 자연어 처리 중심인 딥러닝 연구의 최신 기술이 적용되는 음성언어 이해, 대화 시스템, 어휘 분석, 구문 분석, 지식 그래프, 기계번역, 질의응답, 감정 분석, 소셜 컴퓨팅 및 (이미지에서) 자연어 생성 등을 다룬다. 대학원생, 박사후 연구원, 교육자, 산업계 연구원 및 자연어 처리와 관련된 최신 기법 익히기에 관심이 있는 독자를 대상으로 하며, 컴퓨팅에 대한 기술적 배경을 가진 이에게 적합할 것이다.
이 책의 구성
이 책은 11개의 장으로 구성된다.
1장: 자연어 처리와 딥러닝 소개(Li Deng과 Yang Liu)
2장: 대화 이해에 적용되는 딥러닝(Gokhan Tur, Asli Celikyilmaz, Xiaodong He, Dilek Hakkani-Tür, Li Deng)
3장: 음성 및 텍스트 기반 대화 시스템의 딥러닝(Asli Celikyilmaz, Li Deng, Dilek Hakkani-Tür)
4장: 어휘 분석 및 문법 분석에서 딥러닝(Wanxiang Che와 Yue Zhang)
5장: 지식 그래프의 딥러닝(Zhiyuan Liu와 Xianpei Han)
6장: 기계번역의 딥러닝(Yang Liu와 Jiajun Zhang)
7장: 질의응답의 딥러닝(Kang Liu와 Yansong Feng)
8장: 감성 분석의 딥러닝(Duyu Tang과 Meishan Zhang)
9장: 소셜 컴퓨팅의 딥러닝(Xin Zhao와 Chenliang Li)
10장: 이미지로부터 자연어 생성에서 딥러닝(Xiaodong He와 Li Deng)
11장: 에필로그(Li Deng과 Yang Liu)
1장에서는 자연어 처리와 딥러닝 전체 소개와 이후에 다룰 주요 내용을 리뷰한 다음 역사적인 발전을 세 가지 물결로 연계하고 향후 방향을 살펴본다. 2장에서 10장까지는 자연어 처리에 적용된 최근 학습 방법의 개별 애플리케이션을 다루는 장으로 구성된다. 각 장은 주요 연구자가 각 분야에서 적극적으로 실행했던 연구를 기반으로 한다.
상세 이미지
목차
목차
- 1장. 자연어 처리와 딥러닝 소개
- 1.1 자연어 처리: 기본 내용
- 1.2 첫 번째 물결: 이성주의
- 1.3 두 번째 물결: 실증주의
- 1.4 세 번째 물결: 딥러닝
- 1.5 미래로의 전환
- 1.5.1 실증주의에서 딥러닝으로: 혁명
- 1.5.2 현재 딥러닝 기술의 한계
- 1.6 자연어 처리의 향후 방향
- 1.6.1 신경망과 기호의 통합
- 1.6.2 구조, 기억 그리고 지식
- 1.6.3 비지도학습과 생성 딥러닝
- 1.6.4 다중양식 및 멀티태스킹 딥러닝
- 1.6.5 메타러닝
- 1.7 요약
- 2장. 대화 이해에 사용되는 딥러닝
- 2.1 소개
- 2.2 역사적 관점
- 2.3 주요 언어 이해 작업
- 2.3.1 도메인 탐지 및 의도 결정
- 2.3.2 슬롯 채우기
- 2.4 기술의 고도화: 통계 모델링에서부터 딥러닝까지
- 2.4.1 도메인 탐지와 의도 결정
- 2.4.2 슬롯 채우기
- 2.4.3 멀티태스크 멀티도메인 연결 모델링
- 2.4.4 문맥에서 이해하기
- 2.5 요약
- 3장. 음성 및 텍스트 기반 대화 시스템에 사용되는 딥러닝
- 3.1 서론
- 3.2 대화 시스템의 구성 요소 학습 방법
- 3.2.1 판별 방법
- 3.2.2 생성 방법
- 3.2.3 의사 결정
- 3.3 목표 지향 신경 대화 시스템
- 3.3.1 신경망 언어 이해
- 3.3.2 대화 상태 추적기
- 3.3.3 심층 대화 관리자
- 3.4 모델 기반 사용자 시뮬레이터
- 3.5 자연어 생성
- 3.6 대화 시스템 구축을 위한 엔드 투 엔드 딥러닝 방식
- 3.7 오픈 대화 시스템을 위한 딥러닝
- 3.8 대화 모델링을 위한 데이터셋
- 3.8.1 카네기 멜론 커뮤니케이터 말뭉치
- 3.8.2 ATIS: 항공 여행 정보 시스템 파일럿 말뭉치
- 3.8.3 대화 상태 추적 챌린지 데이터셋
- 3.8.4 말루바 프레임 데이터셋
- 3.8.5 페이스북 대화 데이터셋
- 3.8.6 우분투 대화 말뭉치
- 3.9 오픈소스 대화 소프트웨어
- 3.10 대화 시스템 평가
- 3.11 요약
- 4장. 어휘 분석과 문장 분석에 사용되는 딥러닝
- 4.1 배경
- 4.2 어휘 분석과 문법 분석
- 4.2.1 단어 세분화
- 4.2.2 형태소 분석
- 4.2.3 구문 분석
- 4.2.4 구조화된 예측
- 4.3 구조화 예측 방법
- 4.3.1 그래프 기반 방법
- 4.3.2 전이 기반 방법들
- 4.4 신경그래프 기반 방법
- 4.4.1 신경조건부 랜덤 필드
- 4.4.2 신경망 그래프 기반의 의존 분석
- 4.5 신경망 전이 기반 방법
- 4.5.1 그리디 이동 축소 의존 분석
- 4.5.2 그리디 시퀀스 레이블링
- 4.5.3 전역 최적화 모델
- 4.6 요약
- 5장. 지식 그래프에서 사용되는 딥러닝
- 5.1 서론
- 5.1.1 기본 개념
- 5.1.2 전형적인 지식 그래프
- 5.2 지식 표상 학습
- 5.3 신경망 관계 추출
- 5.3.1 문장 수준 신경망 관계 추출
- 5.3.2 문서 수준 신경망 관계 추출
- 5.4 텍스트와 지식 연결: 개체 연결
- 5.4.1 개체 연결 프레임워크
- 5.4.2 개체 연결 딥러닝
- 5.5 요약
- 6장. 기계번역에 사용되는 딥러닝
- 6.1 서론
- 6.2 통계 기계번역과 그 과제
- 6.2.1 기본 내용
- 6.2.2 통계 기계번역 과제
- 6.3 기계번역을 위한 구성 요소 수준 딥러닝
- 6.3.1 단어 배열을 위한 딥러닝
- 6.3.2 번역 규칙 확률 추정 딥러닝
- 6.3.3 구 재배열을 위한 딥러닝
- 6.3.4 언어 모델링을 위한 딥러닝
- 6.3.5 피처 조합을 위한 딥러닝
- 6.4 기계번역을 위한 엔드 투 엔드 딥러닝
- 6.4.1 인코더 - 디코더 프레임워크
- 6.4.2 기계번역에 사용되는 신경망 관심
- 6.4.3 잘 쓰이지 않는 어휘의 기술적 문제점 다루기
- 6.4.4 평가 지표를 최적화하는 엔드 투 엔드 학습
- 6.4.5 사전 지식 투입하기
- 6.4.6 자원이 부족한 언어 번역
- 6.4.7 신경망 기계번역에서 네트워크 구조
- 6.4.8 통계 기계번역과 신경망 기계번역의 조합
- 6.5 요약
- 7장. 질의응답에 사용되는 딥러닝
- 7.1 서론
- 7.2 지식 기반 질의에 사용되는 딥러닝
- 7.2.1 정보 추출 스타일
- 7.2.2 의미 분석 스타일
- 7.2.2
- 7.2.3 정보 추출 스타일 대 의미 분석 스타일
- 7.2.4 데이터 종류
- 7.2.5 도전 과제
- 7.3 기계 이해에 사용되는 딥러닝
- 7.3.1 태스크 설명
- 7.3.2 기계 이해에서 피처 엔지니어링 방법
- 7.3.3 기계 이해를 위한 딥러닝
- 7.4 요약
- 8장. 딥러닝으로 하는 감성 분석
- 8.1 소개
- 8.2 감성 기반 단어 임베딩
- 8.3 문장 수준 감성 분석
- 8.3.1 컨볼루션 신경망
- 8.3.2 순환 신경망
- 8.3.3 재귀신경망
- 8.3.4 외부 자원 통합
- 8.4 문서 수준 감성 분류
- 8.5 정밀하게 정제된 감성 분석
- 8.5.1 의견 마이닝
- 8.5.2 표적 감성 분석
- 8.5.3 특정 면 수준 감성 분석
- 8.5.4 입장 포착
- 8.5.5 풍자 감지
- 8.6 요약
- 9장. 소셜 컴퓨팅에서 사용되는 딥러닝
- 9.1 소셜 컴퓨팅 소개
- 9.2 딥러닝으로 하는 사용자 생성 콘텐츠 모델링
- 9.2.1 전통적 의미 표상
- 9.2.2 얕은 임베딩으로 의미 표상하기
- 9.2.3 심층신경망으로 하는 의미 표상
- 9.2.4 관심 메커니즘으로 의미 표상 강화하기
- 9.3 딥러닝을 사용한 소셜 커넥션 모델링
- 9.3.1 소셜미디어 소셜 커넥션
- 9.3.2 소셜 커넥션을 모델링하는 네트워크 학습법
- 9.3.3 얕은 임베딩 모델
- 9.3.4 심층신경망 모델
- 9.3.5 네트워크 임베딩 적용
- 9.4 딥러닝을 이용한 추천
- 9.4.1 소셜미디어에서 추천
- 9.4.2 전통 추천 알고리즘
- 9.4.3 얕은 임베딩 기반 모델
- 9.4.4 심층신경망 기반 모델
- 9.5 요약
- 10장. 이미지로부터 자연어 생성을 위한 딥러닝
- 10.1 소개
- 10.2 배경
- 10.3 이미지에서 나온 자연어 생성을 위한 딥러닝 프레임워크
- 10.3.1 엔드 투 엔드 프레임워크
- 10.3.2 구성 프레임워크
- 10.3.3 기타 프레임워크
- 10.4 평가 지표 및 벤치마크
- 10.5 이미지 캡셔닝의 산업 배치
- 10.6 예제: 이미지에 대한 자연어 설명
- 10.7 이미지에서 스타일리시한 자연어 생성 최근 연구
- 10.8 요약
- 11장. 에필로그: 딥러닝 시대에 자연어 처리의 경계
- 11.1 소개
- 11.2 두 가지 새로운 관점
- 11.2.1 태스크 관점
- 11.2.2 표상 관점
- 11.3 자연어 처리를 위한 딥러닝의 주요 발전과 연구 경계선
- 11.3.1 일반화를 위한 구성
- 11.3.2 자연어 처리에 대한 비지도학습
- 11.3.3 자연어 처리를 위한 강화학습
- 11.3.4 자연어 처리를 위한 메타학습
- 11.3.5 해석 가능성: 약한 센스와 강한 센스
- 11.4 요약