프라도 박사의 금융 머신러닝 세트 [실전 금융 머신러닝 완벽 분석 + 자산운용을 위한 금융 머신러닝]

원서명Advances in Financial Machine Learning (ISBN 9781119482086) + Machine Learning for Asset Managers (ISBN 9781108792899)
지은이마르코스 로페즈 데 프라도(Marcos M. López de Prado)
옮긴이이병욱, 이기홍, 하석근

ISBN : SET0000000003
60,000원
2021년 01월 26일 펴냄
페이퍼백 | 728쪽 | 152*228mm
시리즈 : 금융 퀀트 머신러닝 융합

판매처

교보문고 YES24 알라딘

책 소개
저자/역자 소개
목차
도서 오류 신고

책 소개

세트 구성: 전2권

1) 실전 금융 머신러닝 완벽 분석
2) 자산운용을 위한 금융 머신러닝

프라도 교수의 금융 머신러닝 강의 세트 성공적인 금융 머신러닝 프로젝트를 위한 『실전 금융 머신러닝 완벽 분석』과 『자산운용을 위한 금융 머신러닝』은 퀀트 매니저와 퀀트 분석가에게 지침이 될 수 있는 책이다.

『실전 금융 머신러닝 완벽 분석』 소개

머신러닝을 금융에 적용하는 방법을 알려주며, 이론 연구를 넘어선 실전 경험을 바탕으로 어떠한 장점과 위험이 존재하는 것인지 빠짐없이 설명한다. 저자가 20년 간 금융에서 실제로 적용해 본 머신러닝 기법에 대해 각각의 장단점과 함께 개별 기법들을 상세히 설명한다. 또 금융에 맞는 데이터 구조, 모델링, 백테스팅, 유용한 금융적 특징, 고성능 컴퓨팅에 이르기까지 최고 전문가의 시각에서 전달해 주는 실전 지식을 빠짐없이 나열한다. 대부분의 금융 머신러닝 프로젝트가 실패하는 이유와 성공적인 금융 머신러닝 프로젝트를 위해서 어떠한 요소가 갖춰져야 하는지 설명하고 있다. 특히 대부분 프로젝트가 저지르는 백테스팅의 오류를 심도 있게 설명한다. 메타-전략 패러다임의 효용성과 중요성을 설명해 주며, 대부분 성공한 프로젝트가 활용하고 있는 메타-전략 패러다임을 예제와 함께 잘 설명한다. 이 책은 그 깊이로 인해 머신러닝과 금융에 대한 최소한의 지식을 갖춰야 이해할 수 있지만, 최소한의 지식이 바탕이 되고 나면 책에서 다루고 있는 깊이 있고 실용적인 내용으로부터 많은 도움을 받을 수 있다.

이 책의 대상 독자

특히 금융 관련 데이터에 연계된 문제들을 해결하기 위해 설계된 고급 머신러닝 기법을 다루고 있다. ‘고급’이라는 의미는 이해하기가 극도로 힘들다거나 딥러닝이나 순환신경망 또는 합성곱망 등 최근에 되살아나고 있는 기법들을 설명한다는 의미는 아니다. 그보다 이 책은 금융 문제에 머신러닝 알고리즘을 적용한 경험이 있는 상급 연구원들이 중요하게 생각하는 여러 의문에 해답을 주고자 쓰여졌다. 만약 머신러닝이 처음이고, 복잡한 알고리즘에 대한 경험이 없다면 이 책은 (아직은) 맞지 않을 것이다. 이 책에서 다루고 있는 문제에 대해 현업에서의 경험이 없다면 이 책을 이용해 문제를 해결하기가 쉽지 않을 것이다. 이 책을 읽기 전에 머신러닝에 관한 여러 훌륭한 책을 읽길 권한다. 이 책의 핵심 독자들은 머신러닝 경험이 풍부한 전문 투자가들이다. 저자의 목표는 여러분이 이 책에서 배운 것을 통해 수익을 증대하기를 바라는 것이고, 금융을 현대화하는 데 일조하고 투자가들에게 실질적인 가치를 전달해 주기를 바라는 것이다. 이 책은 금융 이외의 여러 분야에 머신러닝 알고리즘을 성공적으로 구현한 경험이 있는 데이터 과학자들에게도 적합하다. 만약 여러분이 구글에서 일하면서 얼굴 인식 분야를 성공적으로 구현한 적이 있지만, 금융 쪽에 제대로 적용해 본 적이 없다면 이 책이 많은 도움이 될 것이다. 가끔 특정 구조(예를 들어, 메타 레이블링, 삼중 배리어 기법, 프랙디프)의 금융 논리에 대해 잘 이해되지 않을 때도 있을 수 있지만, 끈기를 갖길 바란다. 투자 포트폴리오를 일정 수준 이상 운용하다 보면 게임의 법칙이 점점 뚜렷하게 보이고, 1장에 설명된 내용들이 이해가 될 것이다.

이 책의 구성

이 책은 서로 얽혀 있는 주제들을 각각 구분해 정돈된 형태로 설명한다. 각 장은 그 이전 장을 읽었다고 가정하고 설명한다. 1부는 금융 데이터를 머신러닝 알고리즘에서 잘 적용할 수 있도록 데이터를 구조화하는 방법을 알아보고, 2부에서는 해당 데이터에 기반해 머신러닝 알고리즘을 활용해 리서치하는 방법을 알아본다. 여기서 중요한 것은 실질적인 발견은 연구나 과학적 프로세스를 통해 이뤄지며, 이는 우연히 어떤 (잘못될 가능성이 많은) 결과가 나타날 때까지 의미 없이 반복하는 연구 기법과는 구분된다. 3부에서는 연구에 대한 백테스트 방법을 설명하고, 결과가 잘못될 확률을 평가해 본다. 1~3부를 통해 데이터 분석으로부터 모델을 연구하고, 결과를 평가하는 전체 프로세스를 개괄할 수 있다. 이러한 지식을 바탕으로 4부에서는 데이터로 되돌아가 의미 있는 특성을 추출하는 혁신적인 방법을 설명한다. 이러한 작업들은 대부분 상당한 양의 자원을 소모하는데 5부에서는 유용한 HPC 비법을 알아본다.

『자산운용을 위한 금융 머신러닝』 소개

로페즈 데 프라도 박사의 저서 『실전 금융 머신러닝 완벽 분석』의 후속작으로, 개념적으로는 자산운용 일반에도 적용할 수 있으며, 퀀트 매니저와 퀀트 분석가에게 지침이 될 수 있는 책이다. 머신러닝의 금융 응용에 대한 아이디어를 제시하며, 『실전 금융 머신러닝 완벽 분석』을 이해하기 위한 기초 개념을 더 자세히 설명하고 관련된 최근의 연구를 추가했다.

이 책의 구성

금융 공분산 행렬이 잡음을 갖고, 이들은 회귀 분석을 하거나 최적 포트폴리오를 계산하기 이전에 정제돼야 한다는 것을 배울 것이다(2장). 상관관계가 상호 연관성에 대한 매우 좁은 정의이고, 다양한 정보이론 척도가 더 통찰력이 있다는 것을 배울 것이다(3장). 기저(basis)를 변경하지 않고 공간의 차원을 축소하는 직관적인 방법을 배울 것이다. 주성분 분석(PCA, Principal Component Analysis)과 달리 머신러닝 기반의 차원 축소법은 직관적 결과를 제공한다(4장). 불가능한 고정 기간 예측(fixed-horizon prediction)을 목적으로 하기보다는 높은 정확도로 풀 수 있는 금융 예측 문제를 제안하는 대안적 방법들을 배울 것이다(5장). 고전적 p-값에 대한 현대적 대안을 배우고(6장) 평균-분산 투자 포트폴리오에 만연한 불안정성 문제를 해결하는 법을 배울 것이다(7장). 그리고 연구자의 발견이 다중 테스트의 결과로 거짓일 확률을 평가하는 법을 배울 것이다(8장). 만약 자산 운용 산업 또는 금융 학문에서 일을 한다면 이 책은 바로 당신을 위한 것이다.

저자/역자 소개

지은이 소개

마르코스 로페즈 데 프라도(Marcos M. Lopez de Prado)

머신러닝과 슈퍼컴퓨팅을 이용해 수십억 달러의 기금을 운용하고 있다. 구겐하임 파트너의 정량 금융 투자 전략(QIS, Quantitative Investment Strategies) 사업을 설립해 뛰어난 리스크-조정 수익률을 지속적으로 달성한 고용량 전략을 개발했다. 130억 달러의 자산을 운용한 후 QIS를 인수하고 2018년 구겐하임에서 스핀아웃(spin out)했다.
2010년부터 로렌스 버클리 국립 연구소(Lawrence Berkeley National Laboratory, 미국 에너지부, 과학국)의 연구원으로 일하고 있다. 금융에서 가장 많이 읽힌 10대 도서의 저자(SSRN 순위 기준)로, 머신러닝과 슈퍼컴퓨팅에 관련된 수십 편의 논문을 썼고, 알고리즘 거래에 대한 다수의 국제 특허를 갖고 있다.
1999년에 스페인 국립 학문상을 수상했고, 2003년에는 금융 경제학으로 박사학위를 받았으며, 2011년에는 마드리드 대학교에서 수학 금융으로 두 번째 박사학위를 받았다. 박사 후 과정을 하버드와 코넬 대학교에서 마쳤으며, 공학부에서 금융 머신러닝 과정을 가르쳤다. 미국 수학 학회에 따른 에르도스 #2Erdos #2와 아인슈타인 #4Einstein #4를 갖고 있다.

옮긴이 소개

이병욱

(주)크라스랩 대표이사이자 서울과학종합대학원 디지털금융 MBA 주임교수를 맡고 있다. 한국과학기술원(KAIST) 전산학과 계산이론 연구실에서 학사 및 석사학위를 취득했다. 공학을 전공한 금융 전문가로 세계 최초의 핸드 헬드-PC(Handheld-PC) 개발에 참여해 한글 윈도우 CE 1.0과 2.0을 마이크로 소프트 사에서 공동 개발했다. 1999년에는 전 보험사 보험료 실시간 비교 서비스를 제공하는 핀테크 전문회사인 (주)보험넷을 창업해 업계에 큰 반향을 불러일으켰다. 이후 삼성생명을 비롯한 생명 및 손해 보험사에서 CMO(마케팅 총괄 상무), CSMO(영업 및 마케팅 총괄 전무) 등을 역임하면서 혁신적인 상품과 서비스를 개발 및 총괄했다. 세계 최초로 파생 상품 ELS를 기초 자산으로 한 변액 보험을 개발해 단일 보험 상품으로 5,000억 원 이상 판매되는 돌풍을 일으켰고, 매일 분산 투자하는 일 분산 투자(daily averaging) 변액 보험을 세계 최초로 개발해 상품 판매 독점권을 획득했다. 최근에는 머신러닝 기반의 금융 분석과 블록체인에 관심을 갖고 다양한 활동을 하고 있다. 저서로는 『블록체인 해설서』(에이콘, 2019)와 『비트코인과 블록체인, 가상자산의 실체 2/e』(에이콘, 2020)이 있다.

이기홍

카네기멜론대학교에서 석사 학위를 받았고, 피츠버그대학교 Finance Ph.D, CFA, FRM이며 금융, 투자, 경제분석 전문가다. 삼성생명, HSBC, 새마을 금고 중앙회, 한국투자공사 등과 같은 국내 유수의 금융 기관, 금융 공기업 에서 자산운용 포트폴리오 매니저로 근무했으며, 현재 딥러닝과 강화학습을 금융에 접목시켜 이를 전파하고 저변을 확대하는 것을 보람으로 삼고 있다. 저서(공저)로는 『엑셀 VBA로 쉽게 배우는 금융공학 프로그래밍』(한빛미디어, 2009)이 있으며, 번역서로는 『포트폴리오 성공 운용』(미래에셋투자교육연구소, 2010), 『딥러닝 부트캠프 with 케라스』(길벗, 2017), 『프로그래머를 위한 기초 해석학』(길벗, 2018), 『핸즈온 머신러닝〮딥러닝 알고리즘 트레이딩』(에이콘, 2019), 『실용 최적화 알고리즘』(에이콘, 2020), 『초과 수익을 찾아서 2/e』(에이콘, 2020) 등이 있다. 누구나 자유롭게 머신러닝과 딥러닝을 자신의 연구나 업무에 적용해 활용하는 그날이 오기를 바라며 매진하고 있다.

하석근

학성고와 한국외국어대학교 경영학 학사, 미국 컬럼비아대학교(Columbia University) 산업공학 석사, 프랑스 에드헥경영대학원(EDHEC Business School)에서 프랭크 파보지(Frank J. Fabozzi) 교수 지도하에 「Essays on Human Capital and on Momentum」 논문으로 경영학 박사학위(PhD in Finance)를 받았다. 주요 학술지 에 논문을 발표하며 학계와 업계의 가교 역할을 하고 있다. 하나 UBS 자산 운용에서 펀드매니저로 근무 중이다. 디멘셔널 펀드 어드바이저(DFA, Dimensional Fund Advisors) 미국 본사 및 싱가포르 법인에서 글로벌 주식 포트폴 리오 매니저 및 부사장으로 팩터 투자를 실시했으며, 한국투자공사(KIC)에서 국부를 운용했고, 모건스탠리(Morgan Stanley)와 현대증권에서 근무했다. 번역 서로 『초과 수익을 찾아서 2/e』(에이콘, 2020)이 있다. CFA 및 FRM이다.

_『실전 금융 머신러닝 완벽 분석』_
1장. 독립된 주제로서의 금융 머신러닝
1.1 동기
1.2 금융 머신러닝 프로젝트가 실패하는 주요 원인
1.2.1 시지프스 패러다임
1.2.2 메타 전략 패러다임
1.3 책의 구조
1.3.1 생산 체인 형태로 구조 짜기
1.3.3 흔한 함정에 따른 구성
1.4 대상 독자들
1.5 필요 지식
1.6 자주 받는 질문들
1.7 감사의 글
- 연습 문제
- 참고 자료
- 참고 문헌
1부. 데이터 분석
2장. 금융 데이터 구조
2.1 동기
2.2 금융 데이터의 근본적 형태
2.2.1 기본 데이터
2.2.2 시장 데이터
2.2.3 분석
2.2.4 대체 데이터
2.3 바
2.3.1 표준 바
2.4 복수 상품 계열 다루기
2.4.1 ETF 트릭
2.4.2 PCA 가중값
2.4.3 단일 선물 롤 오버
2.5 특성 샘플 추출
2.5.1 축소를 위한 표본 추출
2.5.2 이벤트 기반의 표본 추출
- 연습 문제
- 참고 자료
3장. 레이블링
3.1 동기
3.2 고정 기간 기법
3.3 동적 임계값 계산
3.4 삼중 배리어 기법
3.5 방향과 크기 파악
3.6 메타 레이블링
3.7 메타 레이블링을 이용하는 방법
3.8 퀀터멘털 방법
3.9 불필요한 레이블 제거
- 연습 문제
- 참고 문헌
4장. 표본 가중값
4.1 동기
4.2 중첩된 결과
4.3 공존 레이블의 개수
4.4 레이블의 평균 고유도
4.5 배깅 분류기와 고유도
4.5.1 순차적 부트스트랩
4.5.2 순차적 부트스트랩의 구현
4.5.3 수치적 예제
4.5.4 몬테카를로 실험
4.6 수익률 기여도
4.7 시간 감쇠
4.8 클래스 가중값
- 연습 문제
- 참고 자료
- 참고 문헌
5장. 분수 미분의 특징
5.1 동기
5.2 정상성 대 기억 딜레마
5.3 문헌 리뷰
5.4 방법
5.4.1 장기 기억
5.4.2 반복 추정
5.4.3 수렴
5.5 구현
5.5.1 확장 윈도우
5.5.2 고정 너비 윈도우 분수 미분
5.6 최대 기억 유지 정상성
5.7 결론
- 연습 문제
- 참고 자료
- 참고 문헌
2부. 모델링
6장. 앙상블 기법
6.1 동기
6.2 오류의 세 가지 원인
6.3 배깅
6.3.1 분산 축소
6.3.2 개선된 정확도
6.3.3 관측 중복
6.4 랜덤 포레스트
6.5 부스팅
6.6 금융에 있어서의 배깅 대 부스팅
6.7 배깅의 확장성
- 연습 문제
- 참고 자료
- 참고 문헌
7장. 금융에서의 교차 검증
7.1 동기
7.2 교차 검증의 목표
7.3 금융에서 K겹 교차 검증이 실패하는 이유
7.4 해법: 제거 K겹 교차 검증
7.4.1 훈련셋에서의 제거
7.4.2 엠바고
7.4.3 제거된 K겹 클래스
7.5 sklearn의 교차 검증 버그
- 연습 문제
- 참고 문헌
8장. 특성 중요도
8.1 동기
8.2 특성 중요도의 중요성
8.3 대체 효과가 있는 특성 중요도
8.3.1 평균 감소 불순도
8.3.2 평균 감소 정확도
8.4 대체 효과가 없는 특성 중요도
8.4.1 단일 특성 중요도
8.4.2 직교 특성
8.5 병렬 대 스태킹 특성 중요도
8.6 합성 데이터를 사용한 실험
- 연습 문제
- 참고 자료
9장. 교차 검증을 통한 하이퍼 파라미터 튜닝
9.1 동기
9.2 그리드 검색 교차 검증
9.3 랜덤 검색 교차 검증
9.3.1 로그 균등 분포
9.4 점수 함수 및 하이퍼 파라미터 튜닝
- 연습 문제
- 참고 자료
- 참고 문헌
3부. 백테스트
10장. 베팅 크기
10.1 동기
10.2 전략 독립 베팅 크기 방식
10.3 예측된 확률로부터 베팅 크기 조절
10.4 실행 중인 베팅의 평균화
10.5 베팅 크기 이산화
10.6 동적 베팅 크기와 지정가
- 연습 문제
- 참고 자료
- 참고 문헌
11장. 백테스트의 위험
11.1 동기
11.2 미션 임파서블: 결함 없는 백테스트
11.3 비록 백테스트 결과가 나무랄 데 없어도 아마 잘못됐을 것이다
11.4 백테스트는 연구 도구가 아니다
11.5 몇 가지 일반적인 추천
11.6 전략 선택
- 연습 문제
- 참고 자료
- 참고 문헌
12장. 교차 검증을 통한 백테스트
12.1 동기
12.2 전방 진행 기법
12.2.1 전방 진행 방법의 위험
12.3 교차 검증 기법
12.4 조합적 제거 교차 검증 기법
12.4.1 조합적 분할
12.4.2 조합적 제거 교차 검증 백테스트 알고리즘
12.4.3 몇 가지 예제
12.5 조합적 제거 교차 검증이 백테스트 과적합을 해결하는 법
- 연습 문제
- 참고 자료
13장. 합성 데이터에 대한 백테스트
13.1 동기
13.2 거래 규칙
13.3 문제
13.4 프레임워크
13.5 최적 거래 규칙의 수치적 결정
13.5.1 알고리즘
13.5.2 구현
13.6 실험 결과
13.6.1 제로 장기 균형의 경우
13.6.2 양의 장기 균형의 경우
13.6.3 음의 장기 균형의 경우
13.7 결론
- 연습 문제
- 참고 자료
14장. 백테스트 통계량
14.1 동기
14.2 백테스트 통계량의 종류
14.3 일반적인 특성
14.4 성과
14.4.1 수익률의 시간 가중 비율
14.5 런
14.5.1 수익률 집중
14.5.2 손실폭과 수면하 시간
14.5.3 성과 평가를 위한 런 통계량
14.6 거래 구축 비용
14.7 효율성
14.7.1 샤프 비율
14.7.2 확률적 샤프 비율
14.7.3 축소 샤프 비율
14.7.4 효율성 통계량
14.8 분류 점수
14.9 기여도 분석
- 연습 문제
- 참고 자료
- 참고 문헌
15장. 전략 리스크 이해
15.1 동기
15.2 대칭 투자 이익
15.3 비대칭 투자 이익
15.4 전략 실패의 확률
15.4.1 알고리즘
15.4.2 구현
- 연습 문제
- 참고 자료
16장. 머신러닝 자산 배분
16.1 동기
16.2 볼록 포트폴리오 최적화 문제
16.3 마코위츠의 저주
16.4 기하적 관계에서 계층적 관계까지
16.4.1 트리 군집화
16.4.2 준대각화
16.4.3 재귀적 이분법
16.5 수치 예제
16.6 샘플 외 몬테카를로 시뮬레이션
16.7 향후 연구 과제
16.8 결론
- 부록
- 연습 문제
- 참고 자료
4부. 유용한 금융의 특징
17장. 구조적 변화
17.1 동기
17.2 구조적 변화 테스트 유형
17.3 CUSUM 테스트
17.3.1 재귀적 잔차에 브라운 - 더빈 - 에반스 CUSUM 테스트
17.3.2 수준에 대한 추 - 스틴치콤 - 화이트 CUSUM 테스트
17.4 폭발성 테스트
17.4.1 초 - 유형의 딕키 - 풀러 테스트
17.4.2 상한 증강 딕키 - 풀러
17.4.3 서브 또는 슈퍼 - 마팅게일 테스트
- 연습 문제
- 참고 자료
18장. 엔트로피 특성들
18.1 동기
18.2 샤논의 엔트로피
18.3 플러그인(또는 최대 우도) 추정량
18.4 렘펠 - 지브 추정기
18.5 인코딩 체계
18.5.1 이진 인코딩
18.5.2 분위수 인코딩
18.5.3 시그마 인코딩
18.6 가우시안 프로세스의 엔트로피
18.7 엔트로피와 일반화된 평균
18.8 엔트로피의 몇 가지 금융 응용
18.8.1 시장 효율성
18.8.2 최대 엔트로피 생성
18.8.3 포트폴리오 집중화
18.8.4 시장 미시 구조
- 연습 문제
- 참고 자료
- 참고 문헌
19장. 미시 구조적 특성
19.1 동기
19.2 문헌 리뷰
19.3 1세대: 가격 시퀀스
19.3.1 틱 규칙
19.3.2 롤 모델
19.3.3 고가 - 저가 변동성 추정량
19.3.4 코윈과 슐츠
19.4 2세대: 전략적 거래 모델
19.4.1 카일의 람다
19.4.2 아미후드의 람다
19.4.3 하스브룩의 람다
19.5 제3세대: 순차적 거래 모델
19.5.1 정보 기반 거래의 확률
19.5.2 정보 기반 거래의 거래량 동기화 확률
19.6 미시 구조적 데이터셋으로부터의 추가 특성
19.6.1 주문 크기의 분포
19.6.2 취소율, 지정가 주문, 시장가 주문
19.6.3 시간 가중 평균 가격 실행 알고리즘
19.6.4 옵션 시장
19.6.5 부호가 있는 주문 흐름의 계열 상관관계
19.7 미시 구조적 정보란 무엇인가?
- 연습 문제
- 참고 자료
5부. 고성능 컴퓨팅 비법
20장. 다중 처리와 벡터화
20.1 동기
20.2 벡터화 예제
20.3 단일 스레드 대 다중 스레딩 대 다중 처리
20.4 원자와 분자
20.4.1 선형 분할
20.4.2 이중 루프 분할
20.5 다중 처리 엔진
20.5.1 작업 준비
20.5.2 비동기 호출
20.5.3 콜백 언래핑
20.5.4 피클/언피클 객체
20.5.5 출력 축소
20.6 다중 처리 예제
- 연습 문제
- 참고 자료
- 참고 문헌
21장. 무차별 대입과 양자 컴퓨터
21.1 동기
21.2 조합적 최적화
21.3 목적 함수
21.4 문제
21.5 정수 최적화 방법
21.5.1 비둘기집 분할
21.5.2 가능한 정적 해
21.5.3 궤적 평가
21.6 수치 예제
21.6.1 랜덤 행렬
21.6.2 정태적 해
21.6.3 동태적 해
- 연습 문제
- 참고 자료
22장. 고성능 계산 지능과 예측 기술
22.1 동기
22.2 2010년 플래시 크래시에 대한 감독 당국의 반응
22.3 배경
22.4 HPC 하드웨어
22.5 HPC 소프트웨어
22.5.1 MPI
22.5.2 계층적 데이터 형식 5
22.5.3 제자리 처리
22.5.4 수렴
22.6 실제 사례
22.6.1 초신성 사냥
22.6.2 융합 플라스마의 덩어리
22.6.3 일간 전기 사용 최대값
22.6.4 2010년의 플래시 크래시
22.6.5 정보 기반 거래 거래량 동기화 확률의 추정
22.6.6 비균등 고속 푸리에 변환으로 고빈도 이벤트 발견
22.7 요약 및 참여 요청
22.8 감사의 글
- 참고 자료
_『자산운용을 위한 금융 머신러닝』_
1장. 들어가며
1.1 동기 부여
1.2 이론이 중요하다
1.2.1 교훈1: 이론이 필요하다
1.2.2 교훈2: 머신러닝은 이론을 발견하는 것을 돕는다
1.3 어떻게 과학자들이 머신러닝을 이용하는가
1.4 두 가지 형태의 과적합
1.4.1 훈련셋 과적합
1.4.2 테스트셋 과적합
1.5 개요
1.6 청중
1.7 다섯 가지 만연한 금융 머신러닝에 대한 잘못된 개념
1.7.1 머신러닝은 성배 대 머신러닝은 무용지물
1.7.2 머신러닝은 블랙박스
1.7.3 금융은 머신러닝을 적용하기에는 불충분한 데이터를 갖고 있다
1.7.4 금융에서 신호 대 잡음 비율이 너무 낮다
1.7.5 금융에서 과적합의 위험은 너무 크다
1.8 금융 리서치의 미래
1.9 자주 물어 보는 질문들
1.10 결론
1.11 연습문제
2장. 잡음 제거와 주음 제거
2.1 동기 부여
2.2 마르첸코–파스퇴르 정리
2.3 신호가 있는 랜덤 행렬
2.4 마르첸코–파스퇴르 PDF 적합화
2.5 잡음 제거
2.5.1 상수 잔차 고유값 방법
2.5.2 타깃 축소
2.6 주음 제거
2.7 실험 결과
2.7.1 최소 분산 포트폴리오
2.7.2 최대 샤프 비율 포트폴리오
2.8 결론
2.9 연습문제
3장. 거리 척도
3.1 동기 부여
3.2 상관계수 기반 척도
3.3 한계와 결합 엔트로피
3.4 조건부 엔트로피
3.5 쿨백 - 라이블러 발산
3.6 교차 엔트로피
3.7 상호 정보
3.8 정보 변분
3.9 이산화
3.10 두 분할 간의 거리
3.11 실험 결과
3.11.1 무관계
3.11.2 선형관계
3.11.3 비선형관계
3.12 결론
3.13 연습문제
4장. 최적 군집화
4.1 동기 부여
4.2 근접성 행렬
4.3 군집화 종류
4.4 군집의 수
4.4.1 관측 행렬
4.4.2 기본 군집화
4.4.3 상위 수준 군집화
4.5 실험 결과
4.5.1 랜덤 블록 상관관계 행렬 생성
4.5.2 군집의 수
4.6 결론
4.7 연습문제
5장. 금융 레이블
5.1 동기 부여
5.2 고정 - 기간 방법
5.3 삼중 배리어 방법
5.4 추세 검색 방법
5.5 메타 레이블링
5.5.1 기대 샤프 비율에 의한 베팅 크기
5.5.2 앙상블 베팅 크기
5.6 실험 결과
5.7 결론
5.8 연습문제
6장. 특성 중요도 분석
6.1 동기 부여
6.2 p - 값
6.2.1 p 값의 몇 가지 결함
6.2.2 수치 예제
6.3 특성 중요도
6.3.1 평균 감소 불순도
6.3.2 평균 감소 정확도
6.4 확률 가중 정확도
6.5 대체 효과
6.5.1 직교화
6.5.2 군집 특성 중요도
6.6 실험 결과
6.7 결론
6.8 연습문제
7장. 포트폴리오 구축
7.1 동기 부여
7.2 볼록 포트폴리오 최적화
7.3 조건 수
7.4 마코위츠의 저주
7.5 공분산 불안정성의 원천으로서의 신호
7.6 중첩 군집 최적화 알고리즘
7.6.1 상관 군집화
7.6.2 군집 내 비중
7.6.3 군집 간 비중
7.7 실험 결과
7.7.1 최소 분산 포트폴리오
7.7.2 최대 샤프 비율 포트폴리오
7.8 결론
7.9 연습문제
8장. 테스트셋 과적합
8.1 동기 부여
8.2 정밀도와 재현율
8.3 다중 테스트하의 정밀도와 재현율
8.4 샤프 비율
8.5 ‘거짓 전략’ 정리
8.6 실험 결과
8.7 축소 샤프 비율
8.7.1 유효 시행 수
8.7.2 시행 간 분산
8.8 군별 오차율
8.8.1 시다크 조정
8.8.2 다중 테스트하의 1종 오류
8.8.3 다중 테스트하의 2종 오류
8.8.4 1종과 2종 오류 간의 상호작용
8.9 결론
8.10 연습문제
부록 A. 합성 데이터 테스트
부록 B. ‘거짓 전략’ 정리의 증명

도서 오류 신고

이름

e-mail

도서명

신고내용

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안

개인정보수집ㆍ이용에 동의합니다.