Top

머신러닝 알고리듬 트레이딩 세트 [실전 알고리즘 트레이딩 배우기 + 퀀트 투자를 위한 머신러닝·딥러닝 알고리듬 트레이딩 2/e]

  • 원서명Machine Learning for Algorithmic Trading, 2nd Edition (ISBN 9781839217715) + Learn Algorithmic Trading (ISBN 9781789348347)
  • 지은이스테판 젠슨(Stefan Jansen), 세바스티앙 도나디오(Sebastien Donadio), 수라브 고쉬(Sourav Ghosh)
  • 옮긴이홍창수, 이기홍
  • ISBN : SET0000000006
  • 85,000원
  • 2021년 09월 30일 펴냄
  • 페이퍼백 | 1,592쪽 | 188*235mm
  • 시리즈 : 데이터 과학

책 소개

세트 구성: 전2권

1) 실전 알고리즘 트레이딩 배우기
2) 퀀트 투자를 위한 머신러닝·딥러닝 알고리듬 트레이딩 2/e

머신러닝 알고리듬 트레이딩 세트
지도학습과 비지도학습 알고리듬으로 효과적인 투자 전략을 안내하는 『퀀트 투자를 위한 머신러닝·딥러닝 알고리듬 트레이딩 2/e』과 자매서 『실전 알고리즘 트레이딩 배우기』의 세트다.

『퀀트 투자를 위한 머신러닝·딥러닝 알고리듬 트레이딩 2/e』 소개

머신러닝과 딥러닝 기술을 이용해 알고리듬 트레이딩의 아이디어에서 실행까지 전반적인 프로세스를 서술하는 좋은 안내서다. 2판에서는 전략 백테스팅, 오토인코더, 적대적 생성 신경망(GAN), 이미지 형식으로 변환된 시계열에 합성곱 신경망(CNN) 적용과 같은 최신 내용을 추가했다. 또한 금융 시장 분석으로 100개 이상의 알파 팩터를 설명하고 있으며, 부록으로 기술적 분석에 관한 모든 것을 수록했다. 세계적으로 저명한 AI 콘퍼런스인 NeurIPS에서 발표된 최신 금융 딥러닝 연구를 소개하고 구현한다.

이 책에서 다루는 내용

◆ 투자와 트레이딩 문제를 푸는 머신러닝 기법 구현
◆ 시장, 기본, 대체 데이터를 활용한 알파 팩터 연구
◆ 지도학습, 비지도학습, 강화학습 모델 설계
◆ 판다스, 넘파이와 Scikit-learn을 이용한 포트폴리오 위험과 성과 최적화
◆ 머신러닝 모델을 Quantopian 플랫폼 위에서 실전 트레이딩 전략으로 통합
◆ 신뢰성 있는 시계열 백테스트 방법으로 전략 평가
◆ 케라스, 파이토치와 텐서플로를 사용한 딥신경망 설계와 평가
◆ 강화학습을 이용한 OpenAI Gym에서의 트레이딩 전략 개발

이 책의 구성

ML이 트레이딩 전략의 설계와 실행에 가치를 더할 수 있는 방법을 종합적으로 소개한다. 데이터 소싱과 전략 개발 프로세스의 다양한 측면과 ML 과제에 대한 다양한 솔루션을 다루는 4개의 부로 구성돼 있다.

1부에서는 머신러닝을 활용하는 트레이딩 전략 전반에 걸쳐 관련된 기본적인 측면을 다룬다.
1장, ‘트레이딩용 머신러닝: 아이디어에서 주문 집행까지’에서는 ML이 거래에서 중요한 이유와 방법을 요약하고 투자 프로세스를 설명하며, ML이 가치를 높일 수 있는 방법을 간략히 설명한다.
2장, ‘시장 데이터와 기본 데이터: 소스와 기법’에서는 거래소 제공 틱 데이터와 보고된 재무 정보를 포함해 시장 데이터를 소싱하고 활용하는 방법을 다룬다.
3장, ‘금융을 위한 대체 데이터: 범주와 사용 사례’에서는 폭발적으로 증가하는 수의 출처와 공급자를 평가하기 위한 범주와 기준을 설명한다.
4장, ‘금융 특성 공학: 알파 팩터 리서치’에서는 예측 시그널을 포착하는 데이터 변환을 생성하고 평가 프로세스와 팩터 성과를 측정하는 방법을 설명한다.
5장, ‘포트폴리오 최적화와 성과 평가’에서는 전략의 실행에 따른 포트폴리오를 관리, 최적화, 평가하는 방법을 소개한다.

2부에서는 근본적인 지도학습과 비지도학습 알고리듬이 엔드투엔드 워크플로의 맥락에서 트레이딩 전략에 어떻게 정보를 제공할 수 있는지 설명한다.
6장, ‘머신러닝 프로세스’에서는 ML 모델의 예측 성과를 체계적으로 수립, 훈련, 튜닝, 평가하는 방법을 개략적으로 설명함으로써 단계를 설정한다.
7장, ‘선형 모델: 리스크 팩터에서 수익률 예측까지’에서는 선형 회귀와 로지스틱 회귀를 추론과 예측에 사용하는 방법과 규제화를 사용해 과적합 위험을 관리하는 방법을 설명한다.
8장, ‘ML4T 작업 흐름: 모델에서 전략 백테스팅까지’에서는 지금까지 별도로 다룬 ML4T 워크플로의 다양한 구성 요소를 통합한다.
9장, ‘시계열 모델’에서는 벡터 자기 회귀 모델뿐 아니라 변동성 예측에 대한 ARCH/GARCH 모델을 비롯한 일변량 및 다변량 시계열 진단과 모델을 다룬다.
10장, ‘베이지안 머신러닝: 동적 샤프 비율과 페어 트레이딩’에서는 확률적 모델과 마르코프 체인 몬테카를로(MCMC) 샘플링 및 변분 베이즈 방법이 대략적인 추론을 어떻게 용이하게 하는지 제시한다.
11장, ‘랜덤 포레스트: 일본 주식 롱/숏 전략’에서는 통찰력과 예측을 위한 비선형 트리 기반 모델을 구축, 훈련, 조정하는 방법을 설명한다.
12장, ‘거래 전략 강화’에서는 그래디언트 부스트(Gradient Boost)를 소개하고 고성능 훈련과 예측을 위해 XGBoost, LightBGM, CatBoost 라이브러리를 사용하는 방법을 보여준다.
13장, ‘비지도학습을 활용한 데이터 기반 리스크 팩터와 자산 배분’에서는 알고리듬 거래를 위해 차원 축소와 군집화를 사용하는 방법을 설명한다.

3부는 텍스트 데이터에 초점을 맞추고 대체 데이터의 핵심 출처에서 고품질 시그널을 추출하기 위한 최첨단 비지도학습 기법을 도입한다.
14장, ‘트레이딩을 위한 텍스트 데이터: 감성 분석’에서는 텍스트 데이터를 수치형으로 변환하는 방법을 보여주고 감성 분석을 위한 2부의 분류 알고리듬을 대규모 데이터 세트에 적용한다.
15장, ‘토픽 모델링’에서는 비지도학습을 사용해 많은 문서를 요약한 주제를 추출하고 분류 모델의 특성으로 텍스트 데이터를 탐색하거나 주제를 사용하는 좀 더 효과적인 방법을 제공한다.
16장, ‘어닝 콜과 SEC 공시 보고서를 위한 단어 임베딩’에서는 신경망을 사용해 기존 텍스트 특성보다 의미론적 콘텍스트를 훨씬 더 잘 포착하고 텍스트 데이터에서 거래 시그널을 추출하는 매우 유망한 방법을 나타내는 단어 벡터 형태의 최신 언어 특성을 학습한다.

4부에서는 딥러닝과 강화학습을 소개한다.
17장, ‘딥러닝’에서는 4부에서 사용할 가장 인기 있는 딥러닝 프레임워크인 텐서플로 2와 파이토치(PyTorch)를 소개한다.
18장, ‘금융 시계열과 인공위성 이미지를 위한 CNN’에서는 대규모의 비정형 데이터를 활용하는 분류 작업을 위해 매우 강력한 합성곱 신경망(CNN)을 다룬다.
19장, ‘순환 신경망’에서는 순환 신경망(RNN)이 어떻게 시퀀스 대 시퀀스 모델링에 유용한지 보여준다. 이는 예측할 일변량 시계열과 다변량 시계열을 포함한다.
20장, ‘조건부 위험 요인과 자산 가격 결정을 위한 오토인코더’에서는 고차원 데이터의 비선형 압축을 위한 오토인코더를 다룬다.
21장, ‘합성 시계열 데이터를 위한 적대적 생성 네트워크’에서는 딥러닝에서 흥미로운 발전 중 하나를 소개한다.
22장, ‘심층 강화학습: 트레이딩 에이전트의 구축’에서는 강화학습이 환경에 대응해 의사결정을 최적화하는 방법을 배우는 에이전트의 설계와 훈련을 어떻게 허용하는지 설명한다.
23장, ‘결론과 다음 단계’에서는 학습한 교훈을 요약하고, 계속해서 학습하고 트레이딩 전략을 수립하고자 취할 수 있는 몇 가지 단계를 개략적으로 설명한다.
부록, ‘알파 팩터 라이브러리’에서는 거의 200개의 인기 있는 금융 특성을 나열하고 근거를 설명하며, 이러한 특성을 계산하는 방법을 보여준다.

『실전 알고리즘 트레이딩 배우기』 소개

실전 알고리즘 트레이딩을 위한 기초 환경, 지식과 함께 백테스트 및 리스크 관리 기법과 노하우, 실전에서의 유의 사항을 전달한다. 파이썬을 기반으로 간단한 트레이딩 시그널부터 시작해서 경제 이벤트 기반 및 변동성 조정의 고급 기법을 활용하는 방법을 보여주고, 그 기법을 머신러닝 기법과 어떻게 결합하는지까지 알려준다.

이 책에서 다루는 내용

◆ 현대 알고리즘 트레이딩 시스템과 전략의 구성 요소 이해
◆ 파이썬을 이용한 머신러닝의 알고리즘 트레이딩 시그널과 전략에의 적용
◆ 평균 회귀, 추세 추종, 경제 지표 발표 등을 기반으로 한 트레이딩 전략의 구축, 시각화, 분석
◆ 파이썬 트레이딩 전략을 위한 위험 관리 시스템의 계량화 및 구축
◆ 트레이딩 봇의 성과를 향상시키고자 트레이딩 전략을 시뮬레이션하는 백테스터 구축
◆ 라이브 시장에 트레이딩 전략을 배포하고 수익성 유지와 개선을 위한 운영

이 책의 구성

1장, ‘알고리즘 트레이딩의 기초’에서는 알고리즘 트레이딩이 무엇이며 알고리즘 트레이딩이 고빈도수 또는 낮은 지연 시간 거래와 어떻게 관련돼 있는지 설명한다. 규칙 기반에서 AI로 이어지는 알고리즘 거래의 진화를 살펴본다. 알고리즘 거래 개념, 자산 분류 및 계기 등 본질적인 내용을 다룰 것이다. 어떻게 알고리즘을 결정하는가를 배운다.
2장, ‘기술적 분석을 통한 시장 해석’에서는 몇 가지 인기 있는 기술적 분석 방법을 다루며, 시장 데이터의 분석에 적용하는 방법을 보여 준다. 시장 추세, 지지, 저항을 활용한 기초 알고리즘 트레이딩을 실시한다.
3장, ‘기초 머신러닝을 통한 시장 예측’에서는 여러 가지 간단한 회귀 및 분류 방법을 검토하고 구현하며, 트레이딩에 지도 통계적 학습 방법을 적용하는 것의 장점을 설명한다. 4장, ‘인간의 직관에 의한 고전적 트레이딩 전략’에서는 몇 가지 기본적인 알고리즘 전략(모멘텀, 추세, 평균회귀)을 살펴보고, 그 작동과 장단점을 설명한다.
5장, ‘고급 알고리즘 전략’에서는 좀 더 진보된 접근 방식(통계적 차익 거래, 페어 상관관계)과 그들의 장단점을 검토해 기본적인 알고리즘 전략을 통합한다.
6장, ‘알고리즘 전략의 위험 관리’에서는 알고리즘 전략에서 위험(시장 위험, 운영 위험, 소프트웨어 구현 버그)을 측정하고 관리하는 방법을 설명한다.
7장, ‘파이썬 트레이딩 시스템 구축’에서는 앞에서 만들어진 알고리즘에 기초해 거래 전략을 지원하는 기능적 구성 요소를 설명한다. 파이썬을 이용해 작은 트레이딩 시스템을 구축할 것이며, 앞에서 나온 알고리즘을 사용해 거래할 수 있는 트레이딩 시스템을 구축할 것이다. 8장, ‘트레이딩 거래소 연결’에서는 트레이딩 시스템의 통신 구성 요소를 설명한다. 파이썬에 있는 퀵픽스 라이브러리를 사용해서 거래 시스템을 실제 교환에 연결할 것이다.
9장, ‘파이썬 백테스트 시스템 구축’에서는 트레이딩 봇의 성능을 검증하고자 대량의 데이터로 테스트를 실행해 트레이딩 알고리즘을 향상시키는 방법을 설명한다. 모델이 구현되면 트레이딩 로봇이 트레이딩 인프라에서 예상대로 동작하는지 테스트(구현 관련 실수 확인)해야 한다.
10장, ‘변화하는 시장 참여자와 시장 조건 적응’에서는 실시간 거래 시장에 배포할 때 전략이 예상대로 수행되지 않는 이유를 논의하고, 전략 자체 또는 기본적인 가정 내에서 문제를 해결하는 예를 제공한다. 또한 잘 수행되고 있는 전략이 왜 성능 면에서 서서히 악화되는지를 논의하고, 이것을 어떻게 해결할 것인지 설명하는 몇 가지 간단한 예를 소개할 것이다.

저자/역자 소개

지은이 소개

스테판 젠슨(Stefan Jansen)

어플라이드 에이아이(Applied AI)의 창립자이자 CEO다. 포춘지 선정 500대 기업, 투자 기업 및 업계 전반에서 데이터와 AI 전략에 대해 조언하고, 데이터 과학 팀을 구성하고, 광범위한 비즈니스 문제에 대한 엔드투엔드 머신 학습 솔루션을 개발하고 있다.
이전에는 국제 투자회사의 파트너이자 상무이사를 역임하며 예측 분석 및 투자 연구 업무를 구축했다. 15개 시장에서 영업을 하는 글로벌 핀테크 기업의 고위 임원으로 신흥국 중앙은행에 자문, 세계은행과 상담하기도 했다.
조지아 공대에서 컴퓨터 공학 석사 학위를, 하버드 및 자유 대학교 베를린에서 경제학 석사 학위를 취득했고 CFA 자격증을 보유하고 있다. 유럽, 아시아, 미주 지역에서 6개 언어로 근무했으며 제너럴 어셈블리(General Assembly)와 데이터캠프(Datacamp)에서 데이터 과학을 가르쳤다.

세바스티앙 도나디오(Sebastien Donadio)

트레이데어(Tradair)의 최고 기술 책임자로 이 기술을 선도하는 책임을 맡고 있다. HC테크놀로지스의 소프트웨어 엔지니어링 팀장, 선 트레이딩(Sun Trading)의 계량적 트레이딩 전략 소프트웨어 개발업체인 고빈도 FX사의 파트너 겸 기술 이사로 재직하면서 국방부의 프로젝트 리더로 일하는 등 매우 다양한 전문 경험을 갖고 있다. 프랑스에 있는 동안 Bull SAS와 소시에테 제네랄(Societe Generale)의 IT 신용 리스크 관리자(Credit Risk Manager)로서 연구한 경험이 있다. 지난 10년 동안 시카고 대학교, 뉴욕 대학교, 컬럼비아 대학교에서 다양한 컴퓨터 과학 과정을 가르쳤다. 주로 기술을 다루는 것에 열정을 갖고 있으며, 스쿠버 다이빙 강사면서 경험 많은 암벽 등반가이기도 하다.

수라브 고쉬(Sourav Ghosh)

지난 10년 동안 몇몇 독점적인 고빈도 알고리즘 트레이딩 회사에서 일했다. 전 세계 여러 자산 클래스에 걸쳐 트레이딩 거래소를 위한 매우 낮은 지연 시간과 높은 처리량의 자동 트레이딩 시스템을 구축했다. 시장 조성을 위한 통계적 차익 거래와 가장 유동적인 글로벌 선물 계약의 거래 전략을 전문으로 한다. 시카고의 한 트레이딩 회사에서 정량적 개발자로 일하고 있다. 서던캘리포니아 대학교에서 컴퓨터 과학 석사 학위를 받았다. 관심 분야는 컴퓨터 아키텍처, 핀테크, 확률 이론과 확률적 프로세스, 통계적 학습과 추론 방법, 자연어 처리 등이다.

옮긴이 소개

홍창수

경북대학교에서 재무 전공으로 경영학 석사 학위를 받고, 한국외국어대학교에서 「장외 개별주식옵션의 내재변동성에 관한 실증분석」으로 경영학 박사 학위를 받았다. 2000년 외환선물㈜ 투자공학 팀 애널리스트로 첫 직장 생활을 시작한 이후로 리딩투자증권 파생상품운용 팀 옵션 딜러, 한국투자증권 리스크관리부 리스크퀀트로 근무했다. 한화투자증권에서 장외 파생상품겸영인가 취득에 참여한 이후 금융공학 팀, OTC파생 팀에서 장외파생상품 마케팅 담당 차장으로 근무했다. 이후 금융자산 평가회사인 NICE P&I㈜ 금융공학연구소 실장으로 근무했으며, 현재 정보사업본부에서 장외 파생상품 및 리스크 관련 금융공학 컨설팅 업무를 수행하고 있다. 지은 책으로는 『장외 파생상품 실무입문』(서울경제경영, 2014)이 있다. SCI급 저널인 PLOS ONE을 비롯해 국내 유수의 재무금융 및 경영 학술지인 증권학회지, 재무관리연구, 금융공학연구, 경영연구 등에 재무 및 파생상품 관련 논문을 게재했다. 중앙대학교에서 금융공학 융합전공 강사로 ‘금융공학 실습’ 과목을 강의했으며, 한국금융공학회 산학협력위원으로 활동하고 있다.

이기홍

카네기멜론 대학교에서 석사 학위를 받았고, 피츠버그 대학교 Finance Ph.D, CFA,FRM이며, 금융, 투자, 경제분석 전문가다. 삼성생명, HSBC, 새마을금고 중앙회, 한국투자공사 등과 같은 국내 유수의 금융 기관, 금융 공기업에서 자산운용 포트폴리오 매니저로 근무했으며, 현재 딥러닝과 강화학습을 금융에 접목시켜 이를 전파하고 저변을 확대하는 것을 보람으로 삼고 있다. 저서로는 『엑셀 VBA로 쉽게 배우는 금융공학 프로그래밍』(한빛미디어, 2009)이 있으며, 번역서로는 『포트폴리오 성공 운용』(미래에셋투자교육연구소, 2010), 『딥러닝 부트캠프 with 케라스』(길벗, 2017), 『프로그래머를 위한 기초 해석학』(길벗, 2018)과 『실용 최적화 알고리즘』(에이콘, 2020), 『초과 수익을 찾아서 2/e』(에이콘, 2020), 『자산운용을 위한 금융 머신러닝』(에이콘, 2021), 『실전 알고리즘 트레이딩 배우기』(에이콘, 2021), 『존 헐의 비즈니스 금융 머신러닝 2/e』(에이콘, 2021) 등이 있다. 누구나 자유롭게 머신러닝과 딥러닝을 자신의 연구나 업무에 적용해 활용하는 그날이 오기를 바라며 매진하고 있다.

목차

목차
  • 『퀀트 투자를 위한 머신러닝·딥러닝 알고리듬 트레이딩 2/e』
  • 1부. 데이터, 알파 팩터, 포트폴리오

  • 1장. 트레이딩용 머신러닝: 아이디어에서 주문 집행까지
    • 투자업계에서 머신러닝의 부상
      • 전자 거래에서 고빈도 매매(HFT)까지
      • 팩터 투자와 스마트 베타 펀드
      • 알고리듬 개척자는 인간보다 우위에 있다
      • 머신러닝과 대체 데이터
      • 크라우드 소싱 거래 알고리듬
    • 머신러닝 기반 전략의 설계와 실행
      • 데이터의 소싱과 관리
      • 알파 팩터 리서치에서 포트폴리오 관리까지
      • 전략 백테스팅
    • 트레이딩을 위한 머신러닝: 전략과 사용 사례
      • 알고리듬 트레이딩의 진화
      • 거래를 위한 머신러닝 사용 사례
    • 요약

  • 2장. 시장 데이터와 기본 데이터: 소스와 기법
    • 시장 데이터는 시장 환경을 반영한다
      • 시장 미시 구조: 기본 지식
      • 트레이딩 방법: 여러 종류의 주문
      • 트레이딩 장소: 거래소에서 다크풀까지
    • 고빈도 데이터로 작업
      • 나스닥 주문 호가창으로 작업
      • FIX 프로토콜을 활용한 거래의 통신
      • 나스닥 토탈뷰-잇치 데이터 피드
      • 틱에서 바로: 시장 데이터 정규화 방법
      • AlgoSeek 분 바: 주식 호가와 거래 데이터
    • 시장 데이터에 대한 API 접근
      • 판다스를 이용한 원거리 데이터 접근
      • yfinance: 데이터를 야후! 파이낸스로부터 스크레이핑
      • 퀀토피안
      • 집라인
      • 퀀들
      • 기타 시장 데이터 공급자
    • 기본 데이터 작업 방법
      • 재무제표 데이터
      • 기타 기본 데이터 소스
    • 판다스를 이용한 효율적 데이터 저장
    • 요약

  • 3장. 금융을 위한 대체 데이터: 범주와 사용 사례
    • 대체 데이터 혁명
    • 대체 데이터의 원천
      • 개인
      • 비즈니스 프로세스
      • 센서
    • 대체 데이터 평가를 위한 기준
      • 신호 내용의 질
      • 데이터의 질
      • 기술적 측면
    • 대체 데이터 시장
      • 데이터 제공업체와 사용 사례
    • 대체 데이터로 작업
      • 오픈테이블 데이터 스크래핑
      • 어닝 콜 트랜스크립트 스크래핑과 파싱
    • 요약

  • 4장. 알파 팩터 리서치
    • 알파 팩터 실무: 데이터부터 시그널까지
    • 알파 팩터 공학
      • 수십 년간의 팩터 연구를 바탕으로 구축
      • 모멘텀과 심리: 추세는 당신의 친구다
      • 가치 팩터
      • 변동성과 규모 이례 현상
    • 우량주 팩터
      • 수익률을 예측하는 알파 팩터 공학
      • 판다스와 넘파이를 사용한 팩터 공학
      • 칼만 필터를 사용한 알파 팩터의 잡음 제거
      • 웨이블릿을 이용한 잡음 데이터의 전처리 방법
    • 시그널에서 트레이딩으로: 백테스트를 위한 집라인
      • 단일 팩터 전략을 백테스트하는 방법
      • 다양한 데이터 소스의 팩터 결합
    • 알파렌즈를 사용한 시그널과 잡음의 분리
      • 미래 수익률과 팩터 분위수의 생성
      • 팩터 5분위수에 의한 예측 성과
      • 정보 계수
      • 팩터 회전율
    • 알파 팩터 리소스
      • 기타 알고리듬 트레이딩 라이브러리
    • 요약

  • 5장. 포트폴리오 최적화와 성과 평가
    • 포트폴리오 성과를 측정하는 방법
      • 단일 숫자로 위험 수익 트레이드오프 포착
      • 적극적 운용의 근본 법칙
    • 포트폴리오 위험과 수익률 관리하는 방법
      • 현대 포트폴리오 관리의 진화
      • 평균 분산 최적화
      • 평균 분산 최적화의 대안
      • 리스크 패리티
      • 리스크 팩터 투자
      • 계층적 리스크 패리티
    • 집라인으로 트레이딩과 포트폴리오 관리
      • 신호 생성과 거래 실행 계획 수립
      • 평균 분산 포트폴리오 최적화 구현
    • 파이폴리오를 이용한 백테스팅 성과 측정
      • 수익률과 벤치마크 입력 생성
      • 표본 외 수익률로 전진 분석
    • 요약

  • 2부. 트레이딩을 위한 ML: 기본

  • 6장. 머신러닝 프로세스
    • 데이터로부터 머신러닝이 작동하는 방법
      • 도전 과제: 알고리듬을 작업에 매칭
      • 지도학습: 예제에 의한 학습
      • 비지도학습: 유용한 패턴의 발견
      • 강화학습
    • 머신러닝 워크플로
      • 기본 설명: k-최근접 이웃
      • 문제의 구성: 목적과 성과 측정
      • 데이터의 수집과 준비
      • 특성 탐험, 추출, 특성 공학
      • ML 알고리듬 선택
      • 모델 설계와 조정
      • 모델 선택을 위한 교차 검증의 활용
      • 파이썬으로 교차 검증을 구현하는 방법
      • 금융에서 교차 검증의 문제
      • 사이킷런을 이용한 파라미터 조정과 옐로우브릭
    • 요약

  • 7장. 선형 모델: 리스크 팩터에서 수익률 예측까지
    • 추론에서 예측까지
    • 베이스라인 모델: 다중 선형 회귀 모델
      • 모델을 만드는 방법
      • 모델을 훈련하는 방법
      • 가우스-마르코프 정리
      • 통계적 추론을 수행하는 방법
      • 문제를 진단하고 해결하는 방법
    • 실제로 선형 회귀를 실행하는 방법
      • statsmodels를 활용한 최소 자승법
      • sklearn을 활용한 확률적 경사 하강법(SGD)
    • 선형 요인 모델을 구축하는 방법
      • CAPM에서 파마-프렌치 5 요인 모델까지
      • 위험 요인 입수
      • 파마-맥베스 회귀 분석
    • 수축 방법을 사용한 선형 회귀 규제화
      • 과적합을 방지하는 방법
      • 리지 회귀 분석의 작동 방식
      • 라쏘 회귀 분석의 작동 방식
    • 선형 회귀로 수익률을 예측하는 방법
      • 모델 특성과 선도 수익률 준비
      • statsmodels를 사용한 선형 OLS 회귀 분석
      • 사이킷런을 이용한 선형 OLS 회귀
      • 사이킷런을 이용한 리지 회귀 분석
      • sklearn을 이용한 라쏘 회귀 분석
      • 예측 신호의 품질 비교
    • 선형 분류
      • 로지스틱 회귀 모델
      • statsmodels로 추론을 수행하는 방법
      • 가격 움직임을 로지스틱 회귀 분석으로 예측
    • 요약

  • 8장. ML4T 작업 흐름: 모델에서 전략 백테스트까지
    • ML 기반 전략의 백테스트 방법
    • 백테스트의 단점과 이를 회피하는 방법
      • 데이터를 올바르게 얻기
      • 시뮬레이션을 올바르게 수행
      • 통계량을 올바르게 얻기
    • 백테스트 엔진 작동법
      • 벡터화 대 이벤트 기반 백테스트
      • 주요 구현 측면
    • 백트레이더: 로컬 백테스트용 유연한 도구
      • 백트레이더의 세레브로 구조의 주요 개념
      • 실제에서 백트레이더를 사용하는 방법
      • 백트레이더 요약과 다음 단계
    • 집라인: 퀀토피안이 만든 확장 가능한 백테스트
      • 강건한 시뮬레이션을 위한 캘린더와 파이프라인
      • 분 데이터를 사용해 자체 번들 인제스트
      • 파이프라인 API: ML 시그널 백테스트
      • 백테스트 중 모델을 훈련하는 방법
      • 노트북 사용법
    • 요약

  • 9장. 시계열 모델
    • 진단과 특성 추출을 위한 분석 도구
      • 시계열 패턴의 분해
      • 롤링 윈도우 통계량과 이동 평균
      • 자기 상관계수의 측정
    • 정상성 진단과 회복
      • 정상성을 얻기 위한 시계열 변환
      • 단위근의 처리 방법
      • 시계열 변환의 실제 적용
    • 일변량 시계열 모델
      • 자기 회귀 모델의 구축
      • 이동 평균 모델의 구축
      • ARIMA 모델 구축과 확장
      • 매크로 펀더멘털 예측
      • 시계열 모델을 활용한 변동성 예측
    • 다변량 시계열 모델
      • 방정식 체계
      • 벡터 자기 회귀(VAR) 모델
      • VAR 모델을 활용한 매크로 펀더멘털 예측
    • 공적분: 공통 추세를 가진 시계열
      • 엥글-그레인저 2단계 방법
      • 요한센 우도 비율 테스트
    • 공적분을 활용한 통계적 차익 거래
      • 같이 움직이는 자산 쌍을 선택하는 방법
      • 페어 트레이딩 실제 구현
      • 전략 백테스트 준비
      • 백트레이더를 이용한 전략 백테스트
      • 확장: 개선 방법
    • 요약

  • 10장. 베이지안 머신러닝: 동적 샤프 비율과 페어 트레이딩
    • 베이지안 머신러닝 학습법
      • 경험적 증거에서 가정을 업데이트하는 방법
      • 정확한 추론: 최대 사후 확률 추정
      • 결정론적 및 확률론적 근사 추론
    • PyMC3를 사용한 확률 프로그래밍
      • 테아노를 이용한 베이지안 머신러닝
      • PyMC3 워크플로: 경기 침체 예측
    • 트레이딩을 위한 베이지안 머신러닝
      • 성과 비교를 위한 베이지안 샤프 비율
      • 페어 트레이딩을 위한 베이지안 롤링 회귀 분석
      • 확률 변동성 모델
    • 요약

  • 11장. 랜덤 포레스트: 일본 주식 롱/숏 전략
    • 결정 트리: 데이터로부터의 규칙 학습
      • 트리의 결정 규칙 학습과 적용
      • 결정 트리의 실용적 사용법
      • 과대적합과 규제화
      • 하이퍼파라미터의 조정
    • 랜덤 포레스트: 트리의 신뢰성을 높인다
      • 앙상블 모델의 성과가 더 좋은 이유
      • 배깅
      • 랜덤 포레스트를 구축하는 방법
      • 랜덤 포레스트의 학습과 조정
      • 랜덤 포레스트를 위한 특성 중요도
      • 아웃오브백 테스트
      • 랜덤 포레스트의 장점과 단점
    • 일본 주식에 대한 롱/숏 시그널
      • 데이터: 일본 주식
      • LightGBM을 사용한 ML4T
      • 전략: 집라인을 이용한 백테스트
    • 요약

  • 12장. 거래 전략 강화
    • 시작하기: 적응형 부스팅
      • 에이다부스트 알고리듬
      • 에이다부스트를 사용해 월별 가격 변동 예측
    • 그래디언트 부스팅: 대부분의 작업을 위한 앙상블
      • GBM 모델을 훈련하고 조정하는 방법
      • 사이킷런으로 그래디언트 부스팅을 사용하는 방법
    • XGBoost, LightGBM, CatBoost 사용
      • 알고리듬 혁신이 성능을 향상시키는 방법
    • 부스팅을 사용한 롱/숏 거래 전략
      • LightGBM과 CatBoost로 시그널 생성
      • 블랙박스의 내부: GBM 결과를 해석하는 방법
      • 부스팅 앙상블에 기반을 둔 전략 백테스팅
      • 학습한 교훈과 다음 단계
    • 일중 전략을 위한 부스팅
      • 고빈도 데이터를 위한 특성 공학
      • LightGBM으로 분 단위 빈도 시그널
      • 거래 시그널 품질 평가
    • 요약

  • 13장. 비지도학습을 활용한 데이터 기반 리스크 팩터와 자산 배분
    • 차원 축소
      • 차원의 저주
      • 선형 차원 축소
      • 매니폴드 학습: 선형 차원 축소
    • 트레이딩을 위한 PCA
      • 데이터 주도형 리스크 팩터
      • 고유 포트폴리오
    • 군집화
      • k-평균 군집화
      • 계층적 군집화
      • 밀도 기반 군집화
      • 가우시안 혼합 모델
    • 최적 포트폴리오를 위한 계층적 군집화
      • 계층적 리스크 패리티의 작동 원리
      • ML 트레이딩 전략을 사용한 HRP 백테스트
    • 요약

  • 3부. 자연어 처리

  • 14장. 트레이딩을 위한 텍스트 데이터: 감성 분석
    • 텍스트를 이용한 머신러닝: 언어에서부터 특성까지
      • 텍스트 데이터 작업의 주요 과제
      • 자연어 처리 워크플로
      • 응용 사례
    • 텍스트에서 토큰으로: NLP 파이프라인
      • spaCy와 textacy를 이용한 NLP 파이프라인
      • TextBlob을 사용한 자연어 처리
    • 토큰 계산: 문서 단어 행렬
      • 단어 주머니 모델
      • sklearn을 사용한 문서 단어 행렬(DTM)
      • 핵심적인 교훈
    • 트레이딩을 위한 자연어 처리
      • 나이브 베이즈 분류기
      • 뉴스 기사 분류
      • 트위터와 옐프 데이터를 사용한 감성 분석
    • 요약

  • 15장. 토픽 모델링
    • 잠재 토픽 학습: 목적과 접근법
      • 잠재 의미 인덱싱
      • sklearn을 이용한 LSI의 구현 방법
      • 장점과 제약점
    • pLSA
      • sklearn을 이용한 pLSA의 구현 방법
      • 장점과 제한점
    • LDA
      • LDA의 원리
      • LDA 토픽 평가
      • sklearn을 이용한 LDA의 구현 방법
      • pyLDAvis를 이용한 LDA 결과의 시각화
      • Gensim을 사용한 LDA의 구현 방법
    • 실적 발표 콜을 위한 토픽 모델링
      • 데이터 전처리
      • 모델 훈련과 평가
      • 실험 실행
    • 금융 뉴스를 위한 토픽 모델링
    • 요약

  • 16장. 어닝 콜과 SEC 공시 보고서를 위한 단어 임베딩
    • 단어 임베딩이 의미를 인코딩하는 방법
      • 신경 언어 모델이 문맥에서 사용법을 배우는 방법
      • word2vec: 확장 가능한 단어와 구분 임베딩
      • 의미론적 산술을 활용한 임베딩 평가
    • 사전 훈련된 단어 벡터를 사용하는 방법
      • GloVe: 단어 표현을 위한 글로벌 벡터
    • 금융 뉴스를 위한 사용자정의 임베딩
      • 전처리: 문장 인식과 앤그램
      • 텐서플로 2를 이용한 스킵그램 아키텍처
      • 텐서보드를 사용해 임베딩 시각화
      • Gensim으로 임베딩을 더 빠르게 훈련하는 방법
    • SEC 공시 문서를 이용한 트레이딩을 위한 word2vec
      • 전처리: 문장 인식과 앤그램
      • 모델 훈련
    • doc2vec 임베딩을 사용한 감성 분석
      • 옐프 감성 데이터에서 doc2vec 입력 생성
      • doc2vec 모델 훈련
      • 문서 벡터로 분류기 훈련
      • 학습한 교훈과 다음 단계
    • 새로운 개척자: 사전 훈련된 트랜스포머 모델
      • 어텐션은 당신이 필요한 모든 것
      • BERT: 좀 더 보편적인 언어 모델을 지향
      • 텍스트 데이터에 대한 트레이딩: 교훈과 다음 단계
    • 요약

  • 4부. 딥러닝과 강화학습

  • 17장. 딥러닝
    • 딥러닝: 무엇이 새롭고 왜 중요한가
      • 계층적 구조가 고차원 데이터의 문제을 완화한다
      • 표현 학습으로서의 DL
      • DL의 ML과 AL와의 연관성
    • 신경망의 설계
      • 단순 순전파 신경망 구조
      • 주요 설계 선택
      • 심층 신경망의 규제화
      • 더 빠른 훈련: DL을 위한 최적화
      • 요약: 주요 하이퍼파라미터를 조정하는 방법
    • 파이썬을 이용해 처음부터 신경망을 구축하는 방법
      • 입력층
      • 은닉층
      • 출력층
      • 순전파
      • 교차 엔트로피 비용 함수
      • 파이썬을 사용해 역전파를 구현하는 방법
    • 인기 있는 딥러닝 라이브러리
      • GPU 가속화의 활용
      • 텐서플로 2를 사용하는 방법
      • 텐서보드 사용법
      • 파이토치 1.4 사용법
      • 다른 옵션
    • 롱/숏 전략을 위한 NN의 최적화
      • 일 수익률을 예측하기 위한 특성 공학
      • NN 구조 프레임워크 정의
      • NN을 조정하한 설계 옵션 교차 검증
      • 예측 성능 평가
      • 앙상블 시그널을 기반으로 하는 전략의 백테스트
      • 결과를 더욱 개선하는 방법
    • 요약

  • 18장. 금융 시계열과 인공위성 이미지를 위한 CNN
    • CNN이 그리드 같은 데이터를 모델링하는 방법
      • 수작업 코딩부터 데이터의 학습 필터까지
      • 합성곱층의 요소 연산 방법
      • CNN 아키텍처의 진화: 주요 혁신
    • 인공위성 이미지와 물체 인식을 위한 CNN
      • LeNet5: 산업용 애플리케이션을 갖춘 최초의 CNN
      • 알렉스넷: 딥러닝 연구의 재점화
      • 전이학습: 적은 데이터로 더 빠른 훈련
      • 객체 탐지와 분할
      • 실제 객체 탐지
    • 시계열 데이터용 CNN: 수익률 예측
      • 1차원 합성곱이 있는 자기 회귀 CNN
      • CNN-TA-2D 형식의 시계열 군집화
    • 요약

  • 19장. 순환 신경망
    • RNN의 작동 원리
      • 순환 주기로 계산 그래프 펼치기
      • 시간을 통한 역전파
      • 대안적 순환 신경망 구조
      • 심층 RNN의 설계
      • 장기 의존성 학습 시 문제점
      • GRU
    • 텐서플로 2를 이용한 시계열을 위한 RNN
      • 일변량 회귀: S&P 500 예측
      • 시계열 데이터를 RNN용 형태로 변환
      • 적층 LSTM: 주가 움직임과 수익률 예측
      • 매크로 데이터에 대한 다변량 시계열 회귀
    • 텍스트 데이터를 위한 RNN
      • 감성 분류를 위한 LSTM과 단어 임베딩
      • 사전 학습된 단어 벡터를 이용한 감성 분석
      • SEC 보고서 임베딩으로부터 수익률 예측
    • 요약

  • 20장. 조건부 위험 요인과 자산 가격 결정을 위한 오토인코더
    • 비선형 특성 추출을 위한 오토인코더
      • 선형 차원 축소 일반화
      • 이미지 압축을 위한 합성곱 오토인코더
      • 규제화된 오토인코더로 과적합 관리
      • 노이즈 제거 오토인코더로 손상된 데이터 수정
      • 시계열 특성을 위한 Seq2seq 오토인코더
      • 변분 오토인코더로 생성 모델링
    • 텐서플로 2로 오토인코더 구현
      • 데이터를 준비하는 방법
      • 단층 순전파 오토인코더
      • 희소성 제약 조건이 있는 순전파 오토인코더
      • 심층 순전파 오토인코더
      • 합성곱 오토인코더
      • 오토인코더 노이즈 제거
    • 거래를 위한 조건부 오토인코더
      • 주식 가격과 메타데이터 정보 습득
      • 예측 자산 특징 계산
      • 조건부 오토인코더 아키텍처 만들기
      • 교훈과 다음 단계
    • 요약

  • 21장. 합성 시계열 데이터를 위한 적대적 생성 네트워크
    • GAN으로 합성 데이터 생성
      • 생성 모델과 판별 모델 비교
      • 적대적 훈련: 사기의 제로섬 계임
      • GAN 아키텍처 ZOO의 급속한 진화
      • 이미지를 위한 GAN 애플리케이션과 시계열 데이터
    • 텐서플로 2를 사용해 GAN을 빌드하는 방법
      • 생성자 네트워크 빌드
      • 판별자 네트워크 생성
      • 적대적 훈련 프로세스 설정
      • 평가 결과
    • 합성 금융 데이터를 위한 TimeGAN
      • 특성과 시간에 걸쳐 데이터를 생성하는 방법 학습
      • 텐서플로 2를 사용한 TimeGAN 구현
      • 합성 시계열 데이터의 품질 평가
      • 교훈과 다음 단계
    • 요약

  • 22장. 심층 강화학습: 트레이딩 에이전트의 구축
    • RL 시스템의 구성 요소
      • 정책: 상태에서 행동으로 전이
      • 보상: 행동으로부터 학습
      • 가치 함수: 장기적으로 최적 선택
      • 모델 기반 대 모델 프리: 도약 전에 보기?
    • RL 문제의 해법
      • RL 문제 풀이의 주요 문제점
      • RL 문제를 푸는 근본적인 방법
    • 동적 계획 문제 풀기
      • 유한 MDP
      • 정책 반복
      • 가치 반복
      • 일반화된 정책 반복
      • 파이썬을 이용한 동적 계획
    • Q-러닝: 바둑에서 최적 정책 찾기
      • 탐험 대 활용 트레이드오프: ε-탐욕 정책
      • Q-러닝 알고리듬
      • 파이썬을 이용한 Q-러닝 에이전트 훈련법
    • OpenAI Gym을 사용한 심층 강화학습
      • 신경망을 이용한 가치 함수의 근사
      • 딥 Q-러닝 알고리듬과 확장
      • OpenAI GYM 소개
      • 텐서플로2를 이용한 DDQN의 구현
      • 간단한 트레이딩 에이전트 작성
      • 사용자 정의 OpenAI 트레이딩 환경을 설계하는 방법
      • Deep Q-learning on the stock market
      • 얻은 교훈
    • 요약

  • 23장. 결론과 다음 단계
    • 학습에서 얻은 주요 요점과 교훈
      • 데이터는 가장 중요한 단일 재료
      • 도메인 전문 지식: 잡음으로부터 시그널의 구별
      • ML은 데이터로 문제를 풀기 위한 도구 모음이다
      • 백테스트의 과적합을 주의하라
      • 블랙박스 모델에서 통찰력을 얻는 방법
    • 실전 트레이딩을 위한 ML
      • 데이터 관리 테크놀로지
      • ML 도구
      • 온라인 트레이딩 플랫폼
    • 결론

  • 부록. 알파 팩터 라이브러리
    • TA-Lib에서 구현된 공통 요인 알파
      • 핵심 구성 요소: 이동 평균
      • 중첩 연구: 가격과 변동성 추세
      • 모멘텀 지표
      • 거래량과 유동성 지표
      • 변동성 지표
      • 기본 위험 요인
    • 정형화된 알파에 대한 월드퀀트의 탐구
      • 횡단면 및 시계열 함수
      • 정형화된 알파 표현식
    • 이변량 및 다변량 요인 평가
      • 정보 계수와 상호 정보량
      • 특성 중요도와 SHAP 값
      • 비교: 각 지표에 대한 Top 25 특성
      • 금융 성과: 알파렌즈

  • 『실전 알고리즘 트레이딩 배우기』
  • 1부. 소개 및 환경 설정
  • 1장. 알고리즘 트레이딩 기초
    • 왜 트레이딩을 하는가?
    • 현대적 트레이딩 환경의 기본 개념
      • 시장 섹터
      • 자산 클래스
      • 현대 거래소의 기본 사항
      • 알고리즘 트레이딩 개념의 이해
      • 직관에서 알고리즘 트레이딩까지
      • 알고리즘 트레이딩 시스템의 구성 요소
      • 왜 파이썬인가?
    • 요약

  • 2부. 거래 신호 생성 및 전략
  • 2장. 기술적 분석을 통한 시장 해석
    • 추세와 모멘텀 기반 지표 기반의 트레이딩 전략 설계
      • 지지와 저항 지표
    • 기본적 기술적 분석 기반의 트레이딩 시그널의 생성
      • 단순이동평균
      • 지수이동평균
      • APO
      • MACD
      • 볼린저 밴드
      • 상대강도지표
      • 표준편차
      • 모멘텀
    • 트레이딩 자산의 계절성과 같은 고급 개념의 구현
    • 요약

  • 3장. 기초 머신러닝을 통한 시장 예측
    • 용어와 표기의 이해
      • 금융 자산 탐구
    • 선형회귀 방법을 이용한 예측 모델 구축
      • 최소제곱법
      • 규제화와 수축 - 라소와 릿지 회귀
      • 결정트리회귀
    • 선형분류 방법을 이용한 예측 모델 구축
      • k-최근접 이웃
      • 서포트 벡터 머신
      • 로짓 회귀
    • 요약

  • 3부. 알고리즘 트레이딩 전략
  • 4장. 인간의 직관에 의한 고전적 트레이딩 전략
    • 모멘텀과 추세 추종 트레이딩 전략 구축
      • 모멘텀 전략 예제
      • 파이썬 구현
    • 회귀 행태가 있는 시장에 적합한 트레이딩 전략 만들기
      • 회귀 전략의 예
    • 선형적으로 상관관계를 갖는 트레이딩 상품 그룹에 대해서
    • 작동하는 트레이딩 전략 만들기
    • 요약

  • 5장. 고급 알고리즘 전략
    • 거래 상품 변동성 조정 트레이딩 전략 구축
      • 기술적 지표로 거래 상품 변동성 조정
      • 트레이딩 전략의 변동성 조정
      • 변동성 조정 평균 회귀 트레이딩 전략
    • 경제 이벤트 트레이딩 전략
      • 경제 지표 발표
      • 경제 지표 발표 포맷
      • 전자 경제 발표 서비스
      • 트레이딩과 경제 지표 발표
    • 통계적 차익 거래의 이해와 구현
      • StatArb 기초
      • StatArb 리드-래그
      • 포트폴리오 구성과 관계 조정
      • StatArb 인프라 비용
      • 파이썬 StatArb 트레이딩 전략
    • 요약

  • 6장. 알고리즘 전략의 위험 관리
    • 위험 유형과 위험 요인의 구별
      • 트레이딩 손실 리스크
      • 규제 위반 리스크
      • 스푸핑
      • 호가 스터핑
      • 종가 뱅잉
      • 리스크 원천
      • 리스크 계량화
    • 리스크 척도의 구분
      • 손절
      • 최대 낙폭
      • 포지션 한도
      • 포지션 보유 기간
      • PnL 분산
      • 샤프 비율
      • 기간별 최대 체결수
      • 최대 거래 규모
      • 거래량 한도
    • 리스크 관리 알고리즘 구축
      • 현실적으로 위험 조정
    • 요약

  • 4부. 트레이딩 시스템 구축
  • 7장. 파이썬 트레이딩 시스템 구축
    • 트레이딩 시스템 이해
      • 게이트웨이
      • 주문 호가창 관리
      • 전략
      • 주문 관리 시스템
      • 핵심 구성 요소
      • 주변 구성 요소
    • 파이썬 트레이딩 시스템 구축
      • LiquidityProvider 클래스
      • 전략 클래스
      • OrderManager 클래스
      • MarketSimulator 클래스
      • TestTradingSimulation 클래스
    • 지정가 주문 호가창 설계
    • 요약

  • 8장. 트레이딩 거래소 연결
    • 트레이딩 시스템을 이용한 거래소 거래
    • 통신 API 검토
      • 네트워크 기초
      • 트레이딩 프로토콜
      • FIX 통신 프로토콜
    • 수신 가격 업데이트
      • 송신자 코드 예
    • 주문 실행과 시장 반응 수신
      • Acceptor 코드 예제
      • 기타 트레이딩 API
    • 요약

  • 9장. 파이썬 백테스트 시스템 구축
    • 백테스터 구축
      • 표본 내 데이터 대 표본 외 데이터
      • 페이퍼 트레이딩(선행 테스트)
      • 초보적 데이터 저장
      • HDF5
      • 데이터베이스
    • 올바른 가정 선택
      • 루프형 백테스트 시스템
      • 이벤트 주도형 백테스트 시스템
    • 시간값 평가
    • 이중 이동 평균 전략 백테스트
      • 루프형 백테스터
      • 이벤트 기반 백테스터
    • 요약

  • 5부. 알고리즘 트레이딩의 도전
  • 10장. 변화하는 시장 참여자와 시장 조건 적응
    • 백테스터와 라이브시장의 전략 성과 비교
      • 벡테스터 불안정성의 영향
      • 시뮬레이션 불안정성의 원인
      • 라이브 트레이딩에 반응한 백테스팅 및 전략 조정
    • 알고리즘 트레이딩에서 지속적인 수익성
      • 알고리즘 트레이딩 전략의 이윤 감소
      • 시장 조건과 시장 참여자 변화에의 적응
    • 요약

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안