퀀트 투자를 위한 머신러닝·딥러닝 알고리듬 트레이딩 2/e [파이썬, Pandas, 텐서플로 2.0, Scikit-learn을 활용한 효과적인 트레이딩 전략]
- 원서명Machine Learning for Algorithmic Trading: Predictive models to extract signals from market and alternative data for systematic trading strategies with Python, 2nd Edition (ISBN 9781839217715)
- 지은이스테판 젠슨(Stefan Jansen)
- 옮긴이홍창수, 이기홍
- ISBN : 9791161755694
- 50,000원 (eBook 40,000원)
- 2021년 09월 30일 펴냄 (절판)
- 페이퍼백 | 1,164쪽 | 188*235mm
- 시리즈 : acorn+PACKT, 금융 퀀트 머신러닝 융합, 데이터 과학
판매처
- 현재 이 도서는 구매할 수 없습니다.
책 소개
번역서의 소스 코드 파일은 여기에서 내려 받으실 수 있습니다.
https://github.com/AcornPublishing/algorithmic-trading
원서의 소스 코드 파일은 여기에서 확인하실 수 있습니다.
https://github.com/stefan-jansen/machine-learning-for-trading
본문에 쓰인 컬러 이미지는 여기에서 내려 받으세요.
요약
머신러닝과 딥러닝 기술을 이용해 알고리듬 트레이딩의 아이디어에서 실행까지 전반적인 프로세스를 서술하는 좋은 안내서다. 2판에서는 전략 백테스팅, 오토인코더, 적대적 생성 신경망(GAN), 이미지 형식으로 변환된 시계열에 합성곱 신경망(CNN) 적용과 같은 최신 내용을 추가했다. 또한 금융 시장 분석으로 100개 이상의 알파 팩터를 설명하고 있으며, 부록으로 기술적 분석에 관한 모든 것을 수록했다. 세계적으로 저명한 AI 콘퍼런스인 NeurIPS에서 발표된 최신 금융 딥러닝 연구를 소개하고 구현한다.
이 책에서 다루는 내용
◆ 투자와 트레이딩 문제를 푸는 머신러닝 기법 구현
◆ 시장, 기본, 대체 데이터를 활용한 알파 팩터 연구
◆ 지도학습, 비지도학습, 강화학습 모델 설계
◆ 판다스, 넘파이와 Scikit-learn을 이용한 포트폴리오 위험과 성과 최적화
◆ 머신러닝 모델을 Quantopian 플랫폼 위에서 실전 트레이딩 전략으로 통합
◆ 신뢰성 있는 시계열 백테스트 방법으로 전략 평가
◆ 케라스, 파이토치와 텐서플로를 사용한 딥신경망 설계와 평가
◆ 강화학습을 이용한 OpenAI Gym에서의 트레이딩 전략 개발
이 책의 대상 독자
금융시장에 대한 이해와 트레이딩 전략에 관심이 있는 애널리스트, 데이터 과학자, ML 엔지니어라면 이 책이 도움이 될 것이다. 또한 ML을 활용해 더 나은 의사결정을 내리고자 하는 투자 전문가로서 가치도 찾을 수 있다.
소프트웨어와 ML에 대한 배경지식이 있는 경우 이 영역에 대한 소개자료를 생략할 수 있다. 마찬가지로 전문 지식이 투자에 관한 것이라면 이 책이 제공하는 다양한 배경의 금융 맥락 일부 또는 전부를 잘 알고 있을 것이다.
이 책은 독자가 매우 역동적인 이 영역을 계속 배우고 싶어 한다고 가정한다. 이를 위해 깃허브(GitHub) 저장소 내의 각 장에 대해 README 파일에 연결된 수많은 학술 참고 자료와 추가 자료를 책의 끝에 제공한다.
파이썬(Python) 3과 넘파이, 판다스, SciPy와 같은 과학 컴퓨팅 라이브러리를 사용하는 것이 편할 것이며, 계속해서 다른 많은 자료를 얻을 수 있을 것을 기대한다. ML과 사이킷런에 대한 경험이 도움이 되겠지만 기본 워크플로를 간략하게 다루고 격차를 메꾸거나 더 깊이 파고들려면 다양한 리소스를 참조하길 바란다. 마찬가지로 금융과 투자에 기본 지식이 있다면 용어를 더 쉽게 사용할 수 있을 것이다.
이 책의 구성
ML이 트레이딩 전략의 설계와 실행에 가치를 더할 수 있는 방법을 종합적으로 소개한다. 데이터 소싱과 전략 개발 프로세스의 다양한 측면과 ML 과제에 대한 다양한 솔루션을 다루는 4개의 부로 구성돼 있다.
1부에서는 머신러닝을 활용하는 트레이딩 전략 전반에 걸쳐 관련된 기본적인 측면을 다룬다.
1장, ‘트레이딩용 머신러닝: 아이디어에서 주문 집행까지’에서는 ML이 거래에서 중요한 이유와 방법을 요약하고 투자 프로세스를 설명하며, ML이 가치를 높일 수 있는 방법을 간략히 설명한다.
2장, ‘시장 데이터와 기본 데이터: 소스와 기법’에서는 거래소 제공 틱 데이터와 보고된 재무 정보를 포함해 시장 데이터를 소싱하고 활용하는 방법을 다룬다.
3장, ‘금융을 위한 대체 데이터: 범주와 사용 사례’에서는 폭발적으로 증가하는 수의 출처와 공급자를 평가하기 위한 범주와 기준을 설명한다.
4장, ‘금융 특성 공학: 알파 팩터 리서치’에서는 예측 시그널을 포착하는 데이터 변환을 생성하고 평가 프로세스와 팩터 성과를 측정하는 방법을 설명한다.
5장, ‘포트폴리오 최적화와 성과 평가’에서는 전략의 실행에 따른 포트폴리오를 관리, 최적화, 평가하는 방법을 소개한다.
2부에서는 근본적인 지도학습과 비지도학습 알고리듬이 엔드투엔드 워크플로의 맥락에서 트레이딩 전략에 어떻게 정보를 제공할 수 있는지 설명한다.
6장, ‘머신러닝 프로세스’에서는 ML 모델의 예측 성과를 체계적으로 수립, 훈련, 튜닝, 평가하는 방법을 개략적으로 설명함으로써 단계를 설정한다.
7장, ‘선형 모델: 리스크 팩터에서 수익률 예측까지’에서는 선형 회귀와 로지스틱 회귀를 추론과 예측에 사용하는 방법과 규제화를 사용해 과적합 위험을 관리하는 방법을 설명한다.
8장, ‘ML4T 작업 흐름: 모델에서 전략 백테스팅까지’에서는 지금까지 별도로 다룬 ML4T 워크플로의 다양한 구성 요소를 통합한다.
9장, ‘시계열 모델’에서는 벡터 자기 회귀 모델뿐 아니라 변동성 예측에 대한 ARCH/GARCH 모델을 비롯한 일변량 및 다변량 시계열 진단과 모델을 다룬다.
10장, ‘베이지안 머신러닝: 동적 샤프 비율과 페어 트레이딩’에서는 확률적 모델과 마르코프 체인 몬테카를로(MCMC) 샘플링 및 변분 베이즈 방법이 대략적인 추론을 어떻게 용이하게 하는지 제시한다.
11장, ‘랜덤 포레스트: 일본 주식 롱/숏 전략’에서는 통찰력과 예측을 위한 비선형 트리 기반 모델을 구축, 훈련, 조정하는 방법을 설명한다.
12장, ‘거래 전략 강화’에서는 그래디언트 부스트(Gradient Boost)를 소개하고 고성능 훈련과 예측을 위해 XGBoost, LightBGM, CatBoost 라이브러리를 사용하는 방법을 보여준다.
13장, ‘비지도학습을 활용한 데이터 기반 리스크 팩터와 자산 배분’에서는 알고리듬 거래를 위해 차원 축소와 군집화를 사용하는 방법을 설명한다.
3부는 텍스트 데이터에 초점을 맞추고 대체 데이터의 핵심 출처에서 고품질 시그널을 추출하기 위한 최첨단 비지도학습 기법을 도입한다.
14장, ‘트레이딩을 위한 텍스트 데이터: 감성 분석’에서는 텍스트 데이터를 수치형으로 변환하는 방법을 보여주고 감성 분석을 위한 2부의 분류 알고리듬을 대규모 데이터 세트에 적용한다.
15장, ‘토픽 모델링’에서는 비지도학습을 사용해 많은 문서를 요약한 주제를 추출하고 분류 모델의 특성으로 텍스트 데이터를 탐색하거나 주제를 사용하는 좀 더 효과적인 방법을 제공한다.
16장, ‘어닝 콜과 SEC 공시 보고서를 위한 단어 임베딩’에서는 신경망을 사용해 기존 텍스트 특성보다 의미론적 콘텍스트를 훨씬 더 잘 포착하고 텍스트 데이터에서 거래 시그널을 추출하는 매우 유망한 방법을 나타내는 단어 벡터 형태의 최신 언어 특성을 학습한다.
4부에서는 딥러닝과 강화학습을 소개한다.
17장, ‘딥러닝’에서는 4부에서 사용할 가장 인기 있는 딥러닝 프레임워크인 텐서플로 2와 파이토치(PyTorch)를 소개한다.
18장, ‘금융 시계열과 인공위성 이미지를 위한 CNN’에서는 대규모의 비정형 데이터를 활용하는 분류 작업을 위해 매우 강력한 합성곱 신경망(CNN)을 다룬다.
19장, ‘순환 신경망’에서는 순환 신경망(RNN)이 어떻게 시퀀스 대 시퀀스 모델링에 유용한지 보여준다. 이는 예측할 일변량 시계열과 다변량 시계열을 포함한다.
20장, ‘조건부 위험 요인과 자산 가격 결정을 위한 오토인코더’에서는 고차원 데이터의 비선형 압축을 위한 오토인코더를 다룬다.
21장, ‘합성 시계열 데이터를 위한 적대적 생성 네트워크’에서는 딥러닝에서 흥미로운 발전 중 하나를 소개한다.
22장, ‘심층 강화학습: 트레이딩 에이전트의 구축’에서는 강화학습이 환경에 대응해 의사결정을 최적화하는 방법을 배우는 에이전트의 설계와 훈련을 어떻게 허용하는지 설명한다.
23장, ‘결론과 다음 단계’에서는 학습한 교훈을 요약하고, 계속해서 학습하고 트레이딩 전략을 수립하고자 취할 수 있는 몇 가지 단계를 개략적으로 설명한다.
부록, ‘알파 팩터 라이브러리’에서는 거의 200개의 인기 있는 금융 특성을 나열하고 근거를 설명하며, 이러한 특성을 계산하는 방법을 보여준다.
상세 이미지
목차
목차
- 1부. 데이터, 알파 팩터, 포트폴리오
- 1장. 트레이딩용 머신러닝: 아이디어에서 주문 집행까지
- 투자업계에서 머신러닝의 부상
- 전자 거래에서 고빈도 매매(HFT)까지
- 팩터 투자와 스마트 베타 펀드
- 알고리듬 개척자는 인간보다 우위에 있다
- 머신러닝과 대체 데이터
- 크라우드 소싱 거래 알고리듬
- 머신러닝 기반 전략의 설계와 실행
- 데이터의 소싱과 관리
- 알파 팩터 리서치에서 포트폴리오 관리까지
- 전략 백테스팅
- 트레이딩을 위한 머신러닝: 전략과 사용 사례
- 알고리듬 트레이딩의 진화
- 거래를 위한 머신러닝 사용 사례
- 요약
- 투자업계에서 머신러닝의 부상
- 2장. 시장 데이터와 기본 데이터: 소스와 기법
- 시장 데이터는 시장 환경을 반영한다
- 시장 미시 구조: 기본 지식
- 트레이딩 방법: 여러 종류의 주문
- 트레이딩 장소: 거래소에서 다크풀까지
- 고빈도 데이터로 작업
- 나스닥 주문 호가창으로 작업
- FIX 프로토콜을 활용한 거래의 통신
- 나스닥 토탈뷰-잇치 데이터 피드
- 틱에서 바로: 시장 데이터 정규화 방법
- AlgoSeek 분 바: 주식 호가와 거래 데이터
- 시장 데이터에 대한 API 접근
- 판다스를 이용한 원거리 데이터 접근
- yfinance: 데이터를 야후! 파이낸스로부터 스크레이핑
- 퀀토피안
- 집라인
- 퀀들
- 기타 시장 데이터 공급자
- 기본 데이터 작업 방법
- 재무제표 데이터
- 기타 기본 데이터 소스
- 판다스를 이용한 효율적 데이터 저장
- 요약
- 시장 데이터는 시장 환경을 반영한다
- 3장. 금융을 위한 대체 데이터: 범주와 사용 사례
- 대체 데이터 혁명
- 대체 데이터의 원천
- 개인
- 비즈니스 프로세스
- 센서
- 대체 데이터 평가를 위한 기준
- 신호 내용의 질
- 데이터의 질
- 기술적 측면
- 대체 데이터 시장
- 데이터 제공업체와 사용 사례
- 대체 데이터로 작업
- 오픈테이블 데이터 스크래핑
- 어닝 콜 트랜스크립트 스크래핑과 파싱
- 요약
- 4장. 알파 팩터 리서치
- 알파 팩터 실무: 데이터부터 시그널까지
- 알파 팩터 공학
- 수십 년간의 팩터 연구를 바탕으로 구축
- 모멘텀과 심리: 추세는 당신의 친구다
- 가치 팩터
- 변동성과 규모 이례 현상
- 우량주 팩터
- 수익률을 예측하는 알파 팩터 공학
- 판다스와 넘파이를 사용한 팩터 공학
- 칼만 필터를 사용한 알파 팩터의 잡음 제거
- 웨이블릿을 이용한 잡음 데이터의 전처리 방법
- 시그널에서 트레이딩으로: 백테스트를 위한 집라인
- 단일 팩터 전략을 백테스트하는 방법
- 다양한 데이터 소스의 팩터 결합
- 알파렌즈를 사용한 시그널과 잡음의 분리
- 미래 수익률과 팩터 분위수의 생성
- 팩터 5분위수에 의한 예측 성과
- 정보 계수
- 팩터 회전율
- 알파 팩터 리소스
- 기타 알고리듬 트레이딩 라이브러리
- 요약
- 5장. 포트폴리오 최적화와 성과 평가
- 포트폴리오 성과를 측정하는 방법
- 단일 숫자로 위험 수익 트레이드오프 포착
- 적극적 운용의 근본 법칙
- 포트폴리오 위험과 수익률 관리하는 방법
- 현대 포트폴리오 관리의 진화
- 평균 분산 최적화
- 평균 분산 최적화의 대안
- 리스크 패리티
- 리스크 팩터 투자
- 계층적 리스크 패리티
- 집라인으로 트레이딩과 포트폴리오 관리
- 신호 생성과 거래 실행 계획 수립
- 평균 분산 포트폴리오 최적화 구현
- 파이폴리오를 이용한 백테스팅 성과 측정
- 수익률과 벤치마크 입력 생성
- 표본 외 수익률로 전진 분석
- 요약
- 포트폴리오 성과를 측정하는 방법
- 2부. 트레이딩을 위한 ML: 기본
- 6장. 머신러닝 프로세스
- 데이터로부터 머신러닝이 작동하는 방법
- 도전 과제: 알고리듬을 작업에 매칭
- 지도학습: 예제에 의한 학습
- 비지도학습: 유용한 패턴의 발견
- 강화학습
- 머신러닝 워크플로
- 기본 설명: k-최근접 이웃
- 문제의 구성: 목적과 성과 측정
- 데이터의 수집과 준비
- 특성 탐험, 추출, 특성 공학
- ML 알고리듬 선택
- 모델 설계와 조정
- 모델 선택을 위한 교차 검증의 활용
- 파이썬으로 교차 검증을 구현하는 방법
- 금융에서 교차 검증의 문제
- 사이킷런을 이용한 파라미터 조정과 옐로우브릭
- 요약
- 데이터로부터 머신러닝이 작동하는 방법
- 7장. 선형 모델: 리스크 팩터에서 수익률 예측까지
- 추론에서 예측까지
- 베이스라인 모델: 다중 선형 회귀 모델
- 모델을 만드는 방법
- 모델을 훈련하는 방법
- 가우스-마르코프 정리
- 통계적 추론을 수행하는 방법
- 문제를 진단하고 해결하는 방법
- 실제로 선형 회귀를 실행하는 방법
- statsmodels를 활용한 최소 자승법
- sklearn을 활용한 확률적 경사 하강법(SGD)
- 선형 요인 모델을 구축하는 방법
- CAPM에서 파마-프렌치 5 요인 모델까지
- 위험 요인 입수
- 파마-맥베스 회귀 분석
- 수축 방법을 사용한 선형 회귀 규제화
- 과적합을 방지하는 방법
- 리지 회귀 분석의 작동 방식
- 라쏘 회귀 분석의 작동 방식
- 선형 회귀로 수익률을 예측하는 방법
- 모델 특성과 선도 수익률 준비
- statsmodels를 사용한 선형 OLS 회귀 분석
- 사이킷런을 이용한 선형 OLS 회귀
- 사이킷런을 이용한 리지 회귀 분석
- sklearn을 이용한 라쏘 회귀 분석
- 예측 신호의 품질 비교
- 선형 분류
- 로지스틱 회귀 모델
- statsmodels로 추론을 수행하는 방법
- 가격 움직임을 로지스틱 회귀 분석으로 예측
- 요약
- 8장. ML4T 작업 흐름: 모델에서 전략 백테스트까지
- ML 기반 전략의 백테스트 방법
- 백테스트의 단점과 이를 회피하는 방법
- 데이터를 올바르게 얻기
- 시뮬레이션을 올바르게 수행
- 통계량을 올바르게 얻기
- 백테스트 엔진 작동법
- 벡터화 대 이벤트 기반 백테스트
- 주요 구현 측면
- 백트레이더: 로컬 백테스트용 유연한 도구
- 백트레이더의 세레브로 구조의 주요 개념
- 실제에서 백트레이더를 사용하는 방법
- 백트레이더 요약과 다음 단계
- 집라인: 퀀토피안이 만든 확장 가능한 백테스트
- 강건한 시뮬레이션을 위한 캘린더와 파이프라인
- 분 데이터를 사용해 자체 번들 인제스트
- 파이프라인 API: ML 시그널 백테스트
- 백테스트 중 모델을 훈련하는 방법
- 노트북 사용법
- 요약
- 9장. 시계열 모델
- 진단과 특성 추출을 위한 분석 도구
- 시계열 패턴의 분해
- 롤링 윈도우 통계량과 이동 평균
- 자기 상관계수의 측정
- 정상성 진단과 회복
- 정상성을 얻기 위한 시계열 변환
- 단위근의 처리 방법
- 시계열 변환의 실제 적용
- 일변량 시계열 모델
- 자기 회귀 모델의 구축
- 이동 평균 모델의 구축
- ARIMA 모델 구축과 확장
- 매크로 펀더멘털 예측
- 시계열 모델을 활용한 변동성 예측
- 다변량 시계열 모델
- 방정식 체계
- 벡터 자기 회귀(VAR) 모델
- VAR 모델을 활용한 매크로 펀더멘털 예측
- 공적분: 공통 추세를 가진 시계열
- 엥글-그레인저 2단계 방법
- 요한센 우도 비율 테스트
- 공적분을 활용한 통계적 차익 거래
- 같이 움직이는 자산 쌍을 선택하는 방법
- 페어 트레이딩 실제 구현
- 전략 백테스트 준비
- 백트레이더를 이용한 전략 백테스트
- 확장: 개선 방법
- 요약
- 진단과 특성 추출을 위한 분석 도구
- 10장. 베이지안 머신러닝: 동적 샤프 비율과 페어 트레이딩
- 베이지안 머신러닝 학습법
- 경험적 증거에서 가정을 업데이트하는 방법
- 정확한 추론: 최대 사후 확률 추정
- 결정론적 및 확률론적 근사 추론
- PyMC3를 사용한 확률 프로그래밍
- 테아노를 이용한 베이지안 머신러닝
- PyMC3 워크플로: 경기 침체 예측
- 트레이딩을 위한 베이지안 머신러닝
- 성과 비교를 위한 베이지안 샤프 비율
- 페어 트레이딩을 위한 베이지안 롤링 회귀 분석
- 확률 변동성 모델
- 요약
- 베이지안 머신러닝 학습법
- 11장. 랜덤 포레스트: 일본 주식 롱/숏 전략
- 결정 트리: 데이터로부터의 규칙 학습
- 트리의 결정 규칙 학습과 적용
- 결정 트리의 실용적 사용법
- 과대적합과 규제화
- 하이퍼파라미터의 조정
- 랜덤 포레스트: 트리의 신뢰성을 높인다
- 앙상블 모델의 성과가 더 좋은 이유
- 배깅
- 랜덤 포레스트를 구축하는 방법
- 랜덤 포레스트의 학습과 조정
- 랜덤 포레스트를 위한 특성 중요도
- 아웃오브백 테스트
- 랜덤 포레스트의 장점과 단점
- 일본 주식에 대한 롱/숏 시그널
- 데이터: 일본 주식
- LightGBM을 사용한 ML4T
- 전략: 집라인을 이용한 백테스트
- 요약
- 결정 트리: 데이터로부터의 규칙 학습
- 12장. 거래 전략 강화
- 시작하기: 적응형 부스팅
- 에이다부스트 알고리듬
- 에이다부스트를 사용해 월별 가격 변동 예측
- 그래디언트 부스팅: 대부분의 작업을 위한 앙상블
- GBM 모델을 훈련하고 조정하는 방법
- 사이킷런으로 그래디언트 부스팅을 사용하는 방법
- XGBoost, LightGBM, CatBoost 사용
- 알고리듬 혁신이 성능을 향상시키는 방법
- 부스팅을 사용한 롱/숏 거래 전략
- LightGBM과 CatBoost로 시그널 생성
- 블랙박스의 내부: GBM 결과를 해석하는 방법
- 부스팅 앙상블에 기반을 둔 전략 백테스팅
- 학습한 교훈과 다음 단계
- 일중 전략을 위한 부스팅
- 고빈도 데이터를 위한 특성 공학
- LightGBM으로 분 단위 빈도 시그널
- 거래 시그널 품질 평가
- 요약
- 시작하기: 적응형 부스팅
- 13장. 비지도학습을 활용한 데이터 기반 리스크 팩터와 자산 배분
- 차원 축소
- 차원의 저주
- 선형 차원 축소
- 매니폴드 학습: 선형 차원 축소
- 트레이딩을 위한 PCA
- 데이터 주도형 리스크 팩터
- 고유 포트폴리오
- 군집화
- k-평균 군집화
- 계층적 군집화
- 밀도 기반 군집화
- 가우시안 혼합 모델
- 최적 포트폴리오를 위한 계층적 군집화
- 계층적 리스크 패리티의 작동 원리
- ML 트레이딩 전략을 사용한 HRP 백테스트
- 요약
- 차원 축소
- 3부. 자연어 처리
- 14장. 트레이딩을 위한 텍스트 데이터: 감성 분석
- 텍스트를 이용한 머신러닝: 언어에서부터 특성까지
- 텍스트 데이터 작업의 주요 과제
- 자연어 처리 워크플로
- 응용 사례
- 텍스트에서 토큰으로: NLP 파이프라인
- spaCy와 textacy를 이용한 NLP 파이프라인
- TextBlob을 사용한 자연어 처리
- 토큰 계산: 문서 단어 행렬
- 단어 주머니 모델
- sklearn을 사용한 문서 단어 행렬(DTM)
- 핵심적인 교훈
- 트레이딩을 위한 자연어 처리
- 나이브 베이즈 분류기
- 뉴스 기사 분류
- 트위터와 옐프 데이터를 사용한 감성 분석
- 요약
- 텍스트를 이용한 머신러닝: 언어에서부터 특성까지
- 15장. 토픽 모델링
- 잠재 토픽 학습: 목적과 접근법
- 잠재 의미 인덱싱
- sklearn을 이용한 LSI의 구현 방법
- 장점과 제약점
- pLSA
- sklearn을 이용한 pLSA의 구현 방법
- 장점과 제한점
- LDA
- LDA의 원리
- LDA 토픽 평가
- sklearn을 이용한 LDA의 구현 방법
- pyLDAvis를 이용한 LDA 결과의 시각화
- Gensim을 사용한 LDA의 구현 방법
- 실적 발표 콜을 위한 토픽 모델링
- 데이터 전처리
- 모델 훈련과 평가
- 실험 실행
- 금융 뉴스를 위한 토픽 모델링
- 요약
- 잠재 토픽 학습: 목적과 접근법
- 16장. 어닝 콜과 SEC 공시 보고서를 위한 단어 임베딩
- 단어 임베딩이 의미를 인코딩하는 방법
- 신경 언어 모델이 문맥에서 사용법을 배우는 방법
- word2vec: 확장 가능한 단어와 구분 임베딩
- 의미론적 산술을 활용한 임베딩 평가
- 사전 훈련된 단어 벡터를 사용하는 방법
- GloVe: 단어 표현을 위한 글로벌 벡터
- 금융 뉴스를 위한 사용자정의 임베딩
- 전처리: 문장 인식과 앤그램
- 텐서플로 2를 이용한 스킵그램 아키텍처
- 텐서보드를 사용해 임베딩 시각화
- Gensim으로 임베딩을 더 빠르게 훈련하는 방법
- SEC 공시 문서를 이용한 트레이딩을 위한 word2vec
- 전처리: 문장 인식과 앤그램
- 모델 훈련
- doc2vec 임베딩을 사용한 감성 분석
- 옐프 감성 데이터에서 doc2vec 입력 생성
- doc2vec 모델 훈련
- 문서 벡터로 분류기 훈련
- 학습한 교훈과 다음 단계
- 새로운 개척자: 사전 훈련된 트랜스포머 모델
- 어텐션은 당신이 필요한 모든 것
- BERT: 좀 더 보편적인 언어 모델을 지향
- 텍스트 데이터에 대한 트레이딩: 교훈과 다음 단계
- 요약
- 단어 임베딩이 의미를 인코딩하는 방법
- 4부. 딥러닝과 강화학습
- 17장. 딥러닝
- 딥러닝: 무엇이 새롭고 왜 중요한가
- 계층적 구조가 고차원 데이터의 문제을 완화한다
- 표현 학습으로서의 DL
- DL의 ML과 AL와의 연관성
- 신경망의 설계
- 단순 순전파 신경망 구조
- 주요 설계 선택
- 심층 신경망의 규제화
- 더 빠른 훈련: DL을 위한 최적화
- 요약: 주요 하이퍼파라미터를 조정하는 방법
- 파이썬을 이용해 처음부터 신경망을 구축하는 방법
- 입력층
- 은닉층
- 출력층
- 순전파
- 교차 엔트로피 비용 함수
- 파이썬을 사용해 역전파를 구현하는 방법
- 인기 있는 딥러닝 라이브러리
- GPU 가속화의 활용
- 텐서플로 2를 사용하는 방법
- 텐서보드 사용법
- 파이토치 1.4 사용법
- 다른 옵션
- 롱/숏 전략을 위한 NN의 최적화
- 일 수익률을 예측하기 위한 특성 공학
- NN 구조 프레임워크 정의
- NN을 조정하한 설계 옵션 교차 검증
- 예측 성능 평가
- 앙상블 시그널을 기반으로 하는 전략의 백테스트
- 결과를 더욱 개선하는 방법
- 요약
- 딥러닝: 무엇이 새롭고 왜 중요한가
- 18장. 금융 시계열과 인공위성 이미지를 위한 CNN
- CNN이 그리드 같은 데이터를 모델링하는 방법
- 수작업 코딩부터 데이터의 학습 필터까지
- 합성곱층의 요소 연산 방법
- CNN 아키텍처의 진화: 주요 혁신
- 인공위성 이미지와 물체 인식을 위한 CNN
- LeNet5: 산업용 애플리케이션을 갖춘 최초의 CNN
- 알렉스넷: 딥러닝 연구의 재점화
- 전이학습: 적은 데이터로 더 빠른 훈련
- 객체 탐지와 분할
- 실제 객체 탐지
- 시계열 데이터용 CNN: 수익률 예측
- 1차원 합성곱이 있는 자기 회귀 CNN
- CNN-TA-2D 형식의 시계열 군집화
- 요약
- CNN이 그리드 같은 데이터를 모델링하는 방법
- 19장. 순환 신경망
- RNN의 작동 원리
- 순환 주기로 계산 그래프 펼치기
- 시간을 통한 역전파
- 대안적 순환 신경망 구조
- 심층 RNN의 설계
- 장기 의존성 학습 시 문제점
- GRU
- 텐서플로 2를 이용한 시계열을 위한 RNN
- 일변량 회귀: S&P 500 예측
- 시계열 데이터를 RNN용 형태로 변환
- 적층 LSTM: 주가 움직임과 수익률 예측
- 매크로 데이터에 대한 다변량 시계열 회귀
- 텍스트 데이터를 위한 RNN
- 감성 분류를 위한 LSTM과 단어 임베딩
- 사전 학습된 단어 벡터를 이용한 감성 분석
- SEC 보고서 임베딩으로부터 수익률 예측
- 요약
- RNN의 작동 원리
- 20장. 조건부 위험 요인과 자산 가격 결정을 위한 오토인코더
- 비선형 특성 추출을 위한 오토인코더
- 선형 차원 축소 일반화
- 이미지 압축을 위한 합성곱 오토인코더
- 규제화된 오토인코더로 과적합 관리
- 노이즈 제거 오토인코더로 손상된 데이터 수정
- 시계열 특성을 위한 Seq2seq 오토인코더
- 변분 오토인코더로 생성 모델링
- 텐서플로 2로 오토인코더 구현
- 데이터를 준비하는 방법
- 단층 순전파 오토인코더
- 희소성 제약 조건이 있는 순전파 오토인코더
- 심층 순전파 오토인코더
- 합성곱 오토인코더
- 오토인코더 노이즈 제거
- 거래를 위한 조건부 오토인코더
- 주식 가격과 메타데이터 정보 습득
- 예측 자산 특징 계산
- 조건부 오토인코더 아키텍처 만들기
- 교훈과 다음 단계
- 요약
- 비선형 특성 추출을 위한 오토인코더
- 21장. 합성 시계열 데이터를 위한 적대적 생성 네트워크
- GAN으로 합성 데이터 생성
- 생성 모델과 판별 모델 비교
- 적대적 훈련: 사기의 제로섬 계임
- GAN 아키텍처 ZOO의 급속한 진화
- 이미지를 위한 GAN 애플리케이션과 시계열 데이터
- 텐서플로 2를 사용해 GAN을 빌드하는 방법
- 생성자 네트워크 빌드
- 판별자 네트워크 생성
- 적대적 훈련 프로세스 설정
- 평가 결과
- 합성 금융 데이터를 위한 TimeGAN
- 특성과 시간에 걸쳐 데이터를 생성하는 방법 학습
- 텐서플로 2를 사용한 TimeGAN 구현
- 합성 시계열 데이터의 품질 평가
- 교훈과 다음 단계
- 요약
- GAN으로 합성 데이터 생성
- 22장. 심층 강화학습: 트레이딩 에이전트의 구축
- RL 시스템의 구성 요소
- 정책: 상태에서 행동으로 전이
- 보상: 행동으로부터 학습
- 가치 함수: 장기적으로 최적 선택
- 모델 기반 대 모델 프리: 도약 전에 보기?
- RL 문제의 해법
- RL 문제 풀이의 주요 문제점
- RL 문제를 푸는 근본적인 방법
- 동적 계획 문제 풀기
- 유한 MDP
- 정책 반복
- 가치 반복
- 일반화된 정책 반복
- 파이썬을 이용한 동적 계획
- Q-러닝: 바둑에서 최적 정책 찾기
- 탐험 대 활용 트레이드오프: ε-탐욕 정책
- Q-러닝 알고리듬
- 파이썬을 이용한 Q-러닝 에이전트 훈련법
- OpenAI Gym을 사용한 심층 강화학습
- 신경망을 이용한 가치 함수의 근사
- 딥 Q-러닝 알고리듬과 확장
- OpenAI GYM 소개
- 텐서플로2를 이용한 DDQN의 구현
- 간단한 트레이딩 에이전트 작성
- 사용자 정의 OpenAI 트레이딩 환경을 설계하는 방법
- Deep Q-learning on the stock market
- 얻은 교훈
- 요약
- RL 시스템의 구성 요소
- 23장. 결론과 다음 단계
- 학습에서 얻은 주요 요점과 교훈
- 데이터는 가장 중요한 단일 재료
- 도메인 전문 지식: 잡음으로부터 시그널의 구별
- ML은 데이터로 문제를 풀기 위한 도구 모음이다
- 백테스트의 과적합을 주의하라
- 블랙박스 모델에서 통찰력을 얻는 방법
- 실전 트레이딩을 위한 ML
- 데이터 관리 테크놀로지
- ML 도구
- 온라인 트레이딩 플랫폼
- 결론
- 학습에서 얻은 주요 요점과 교훈
- 부록. 알파 팩터 라이브러리
- TA-Lib에서 구현된 공통 요인 알파
- 핵심 구성 요소: 이동 평균
- 중첩 연구: 가격과 변동성 추세
- 모멘텀 지표
- 거래량과 유동성 지표
- 변동성 지표
- 기본 위험 요인
- 정형화된 알파에 대한 월드퀀트의 탐구
- 횡단면 및 시계열 함수
- 정형화된 알파 표현식
- 이변량 및 다변량 요인 평가
- 정보 계수와 상호 정보량
- 특성 중요도와 SHAP 값
- 비교: 각 지표에 대한 Top 25 특성
- 금융 성과: 알파렌즈
- TA-Lib에서 구현된 공통 요인 알파
도서 오류 신고
정오표
정오표
[용어 일괄]
무리스크
->
무위험
[p.68 : 6행]
19090년대에
->
1990년대에
[p.73 : 아래에서 7행]
시장 시장에서
->
시장에서
[p.79 : 아래에서 3행]
매수자로부터 매수하는
->
매수자로부터 매도하는
[p.80 : 1행]
대한거래를
->
대한 거래를