Top

데이터 과학자를 위한 금융 분석 총론 [R로 학습하는 핵심 금융 분석의 이론과 실제]

  • 원서명Financial Analytics with R: Building a Laptop Laboratory for Data Science (ISBN 9781107150751)
  • 지은이마크 베넷(Mark J. Bennett), 더크 휴겐(Dirk L. Hugen)
  • 옮긴이홍영표, 오승훈
  • ISBN : 9791161753522
  • 40,000원
  • 2019년 11월 29일 펴냄
  • 하드커버 | 508쪽 | 180*254mm
  • 시리즈 : 데이터 과학

책 소개

요약

금융 분석에 필요한 핵심 이론과 예제 코드로 구성된 책이다. 이론 설명에 수학적 증명이 포함돼 있어 깊이 있게 학습할 수 있고, R 코드로 구현해 이론을 직접 확인할 수도 있다. 시카고대학교와 아이오와대학교의 커리큘럼과 수업 교재를 기반으로 집필했다. 이 책에 담긴 금융 분석의 이론과 코드를 학습해 응용하면 데이터 과학자로서 자신만의 금융 분석 플랫폼을 구축할 수 있을 것이다.

이 책의 대상 독자

이 책을 이해하기 위해선 통계 분석, 확률과 통계, 혹은 수리 통계 과정을 수강하는 것이 가장 이상적이지만, 필요한 자료의 상당 부분은 본문과 부록에 수록돼 있다. C, C++, 자바, C#, 파이썬, 매트랩(Matlab)과 같은 하나 이상의 과학적 기반 프로그래밍 언어를 이용한 배열 처리에 익숙해지려면 학부 수준의 미적분, 선형 대수, 컴퓨터 과학 지식이 필요하다. 금융 배경지식은 필요치 않다. R을 사용해봤다면 이 책을 이해하기 더욱 수월할 것이다.

이 책의 구성

전반에 걸쳐 컴퓨터 시뮬레이션을 다룰 것이다. 컴퓨터 시뮬레이션은 성공적으로 자리잡았고, ‘이론’과 ‘물리적 실험’에 이어 세 번째 과학적인 방법으로 널리 받아들여지고 있다. 이 책은 금융 시뮬레이션 연구소를 구축할 때도 사용할 수 있다. 이 책은 시카고 대학교 그래함 스쿨 분석 석사 프로그램(the Graham School at the University of Chicago Master of Science in Analytics program)의 대학원 금융 분석 과정과 아이오와대학교 티피 경영대학 (the Tippie College of Business at the University of Iowa)의 금융학과에서 학부 투자 과정에 대한 연구 과제로 개발됐다. 단과 대학이나 종합 대학에서 대학원 교재로 사용하면 유용할 것이다. 수학과 컴퓨터 과학 에 대한 적절한 배경지식이 있다면 고급 학부 과정에서도 사용할 수 있다. R 언어로 하는 금융 컴퓨터 시뮬레이션은 스프레드시트 작성보다 더 복잡하고 난해할 수 있다. 정량적 옵티마이저(quantitative optimizer)는 로직이 주변 프로그램 코드에서 명백하게 드러날 때 잘 제어되고 조정될 수 있다. 견고하고 정교한 플랫폼을 구축하기 위해선 많은 컴퓨터 과학 지식을 보유해야 하며, 이면의 컴파일러와 실시간 시스템을 잘 알고 있다면 더 깊이 이해할 수 있다. 하지만 작업을 완료하면 금융 분석 개발자, 운영자, 학생은 통계 시뮬레이션을 위해 설계된 언어로 수행한 시뮬레이션의 이점을 인식하기 시작할 것이다. 시뮬레이터 구축과 시뮬레이션 관찰로부터 얻을 수 있는 통찰력은 향후 전문 분야를 깊이 이해하는 데 도움이 된다.
각 장의 연습 문제에서 데이터 과학은 통계와 전산 모형의 연구를 포함한다. 이는 금융 시장에 존재하는 경제적 가치를 밝히는 것을 의미한다. 데이터 공학은 파일, 프로그램 로직, 테스트, 그리고 지속적 개선을 이용해서 대용량 데이터집합에 적용해 컴퓨터에서 모형을 구현하는 과정이다. 연습 문제를 풀어보며 앞서 배운 데이터 과학 원리를 활용해 금융 연구소를 설계하고 구축한다.
연습 문제를 수행하면서 다양한 R 패키지를 수시로 설치해야 할 수도 있다. 인터넷에서 검 색하면 R 패키지 로딩이나 수행 시 발생하는 다양한 문제의 해결 방안을 찾을 수 있다. 이러 한 방안은 수많은 패키지, 조건, 사례에 반복적으로 활용할 수 있다.
연습 문제는 다양한 구성 요소에 개별적으로 초점을 맞추기 때문에 로직과 데이터를 이해할 수 있다. 각각의 새로운 구성 요소는 정교한 수준의 금융 분석을 수행하기 위해 이전 구성 요소를 기반으로 한다.

상세 이미지

저자/역자 소개

지은이의 말

스프레드시트(spreadsheet) 소프트웨어의 출현으로 분석가는 새로운 수준의 분석적 사고를 하게 됐다. 인간의 계산은 더 이상 단일 차원에 국한되지 않는다. 각 행이나 열은 시간 차 원, 생산 범주, 비즈니스 시나리오를 나타낼 수 있다. 그리고 자동화된 의존성 기능 덕분에 행과 열을 매우 쉽게 수정할 수 있다. 이제 스프레드시트는 더 정교하고 영구적인 분석 제 품인 대용량 분석 컴퓨터 프로그램을 위한 프로토타입으로 사용할 수 있다.
숙련된 분석가가 R과 파이썬P(ython) 같은 최신 프로그램 언어를 사용하면, 역사적 시세를 무료로 제공하는 서비스나 야후 같은 리소스를 이용해 이전보다 훨씬 적은 노력으로 분석 로직을 설계할 수 있다. 파이썬과 R의 간결한 구문 덕분에 자바와 유사한 기능을 탑재한 프로그램을 네 배 더 작게 만들 수 있다. 이제 원한다면 다양한 시장 변수를 시뮬레이션해 몇 주 안에 200달러 미만의 비용으로 소규모의 금융 연구소를 구축할 수 있다. 혹은 더 큰 저장 용량을 갖춘 고성능의 컴퓨터를 구입해 과거에는 불가능했던 전체 시장의 10년에서 20년치 역사적 데이터를 로드할 수도 있다.
연구실이 구축됐다면 통찰력(insights)을 얻을 수 있다. 지식 발견(knowledge discovery)은 한때 인간의 행위를 나타내는 용어였지만 이제는 컴퓨터 자동화를 설명하는 용어가 됐다. 지식 발견은 컴퓨터 프로그램이 생성할 수 있는 것을 다소 과대평가해 거창한 단어처럼 보인다. 예컨대 컴퓨터 학회인 ACM(Association for Computing Machinery)에는 KDD(Knowledge Discovery and Data Mining)라는 특화분과(special interest group)가 있다. 이 분과에서 다루는 ‘데이터 마이닝’은 누구도 나서서 도전하려 하지 않는 분야다. 결국 데이터 마이닝은 통계학자와 컴퓨터 과학자들의 몫이 됐다. 하지만 ‘정말, 자동으로, 기계를 이용해 지식을 발견할 수 있을까?’ 이는 너무 과장돼 사실처럼 느껴지지 않을 것이다. 하지만 이 책에 기술된 알고리즘을 직접 경험해보면, 데이터 과학 기술을 사용하는 프로그램이 매우 지루한 계산을 자동화할 수 있을 뿐만 아니라 과거 인간 사고 수준으로는 발견하지 못했던 통찰력을 제공할 수 있다는 사실을 곧 깨닫게 될 것이다.

지은이 소개

마크 베넷(Mark J. Bennett)

주요 투자 은행의 선임 데이터 과학자로, 시카고대학교의 석사과정에서 분석학을 강의한 다. 아르곤 국립 연구소(Argonne National Laboratory), 유니시스(Unisys Corporation), AT&T 벨 연구소(Bell Laboratories), 노스롭 그루먼(Northrop Grumman), XR 트레이딩 시큐리티(XR Trading Securities)에서 소프트웨어를 담당했다.

더크 휴겐(Dirk L. Hugen)

아이오와대학교 통계계리학과의 대학원생이다. 이전에는 신호처리 엔지니어로 일했다.

옮긴이의 말

“곤경에 빠지는 건 뭔가를 몰라서가 아니다. 뭔가를 확실히 안다는 착각 때문이다.” (It ain’t what you don’t know that gets you into trouble. It’s what you know for sure that just ain’t so.) - 마크 트웨인(Mark Twain)

데이터 분석은 더 이상 전문가만의 영역이 아니다. 누구나 관심만 있다면 데이터 과학자가 될 수 있다. 디지털 시대를 맞아 데이터는 폭발적으로 증가했으며, IT 성능은 강력해졌다. 따라서 더 많은 데이터를 검증하고 시뮬레이션해 정확한 알고리즘과 모형을 개발할 수 있게 됐다. 이 책은 이러한 시대적 배경 속에서 탄생했다. 원하는 데이터는 언제든지 인터넷에서 수집할 수 있으며, R과 같은 전문 분석 소프트웨어의 등장으로 개인용 PC에서도 다양한 분석 작업을 할 수 있다. 원서의 부제목이 ‘데이터 과학을 위한 랩톱 연구소 구축(Building a Laptop Laboratory for Data Science)’인 이유도 이 책의 내용을 학습하면 데이터 과학자가 되어 개인용 PC 환경에서도 자신만의 금융 분석 플랫폼을 구축할 수 있기 때문이다.
이 책의 목차는 금융 분석에 필요한 주제로 체계적으로 구성돼 있다. 본문에는 이론 설명과 수학적 증명도 포함돼 있으며, 이를 R로 구현했다. 금융 분석에 필요한 이론과 실제가 모두 포함된 총론이라 해도 손색이 없다. 물론 이 책이 금융 분석을 마스터하는 충분조건이라 할 수는 없지만 금융 분석의 전반적인 이해를 돕는 필요조건임은 분명하다.
또한 이 책은 시카고대학교(University of Chicago)와 아이오와대학교(University of Iowa)의 수업 교재를 바탕으로 작성됐다. 따라서 이 책의 구성을 살펴보면 해외 명문 대학교의 금융 분석 과정의 커리큘럼을 엿볼 수 있다. 국내 대학교의 금융 분석 과정에서도 이 책을 교재로 사용하면 수업에 도움이 될 것이라 기대한다. 다만 이 책의 예제 코드들이 학습에 초점이 맞춰 있어 상업용 분석 프로그램에 비해 성능이나 튜닝 측면이 부족할 수 있다. 그리고 예제 코드에서 다양한 기업을 다루므로 이 책의 출간 이후에 인수합병된 기업은 티커 심볼(ticker symbol)이 변할 수도 있다. 그리고 R 패키지가 업데이트되거나 인터넷 사이트의 데이터 제공 서비스 등에 변화가 있을 수도 있다. 이러한 부분까지 코드를 수정하고 개선할 수 있다면, 데이터 과학자로서 자신만의 금융 분석 플랫폼을 구축해 발전시켜 나갈 수 있는 충분한 능력을 겸비하게 될 것이다.
금융 분석을 올바로 이해해서 금융 시장에서 벌어지는 다양한 현상의 착각에 빠지지 말고, 사건의 본질에 한 걸음 다가가는 데 이 책이 도움이 되길 바란다.

옮긴이 소개

홍영표

카이스트 경영대학에서 정보경영 석사과정을 졸업했으며 현재 금융회사에 재직 중이다.
저서로는 『기술, 경영을 만나다』(에이콘, 2016)가 있으며, 옮긴 책으로는 에이콘출판사에서 출간한 『R고 하는 금융 분석』(2017), 『타입스크립트 디자인 패턴』(2017), 『The Modern Web』(2014), 『HTML & CSS』(2012), 『HTML5+CSS3+자바스크립트의 정석』(2012), 『Professional iPhone and iPad Database Application Programming 한국어판』(2012), 『아이폰&아이패드 인 액션』(2011)과 『제이콥 닐슨의 모바일 사용성 컨설팅 보고서』(제이펍, 2013), 『스프링 인 액션(제3판)』(제이펍, 2012)이 있다.

오승훈

카이스트 경영대학에서 정보경영 석사과정을 졸업했다. 정보관리기술사이자 정보시스템 수석감리원이다. 회사에서는 IT기획과 PI업무를 담당하고 있다. 최근에는 정량적인 데이터 분석을 통한 기업혁신 사례에 관심이 많다. 저서로는 『기술, 경영을 만나다』(에이콘, 2016)가 있으며, 옮긴 책으로는 『R고 하는 금융 분석』(에이콘, 2017)이 있다.

목차

목차
  • 1장. 분석적 사고
  • 1.1 금융 분석의 개요
  • 1.2 데이터 과학자를 위한 금융 분석
  • 1.3 R을 활용한 고급 분석
  • 1.4 연습 문제

  • 2장. 금융 분석 전문 언어, R
  • 2.1 R 시작하기
  • 2.2 언어 특성: 함수, 할당, 인수, 타입
  • 2.3 언어 특성: 바인딩과 배열
  • 2.4 에러 처리
  • 2.5 숫자, 통계, 문자 함수
  • 2.6 데이터프레임과 입출력
  • 2.7 리스트
  • 2.8 연습 문제

  • 3장. 금융 통계
  • 3.1 확률
    • 베이즈 규칙
    • 베이즈 규칙의 확장
  • 3.2 조합론
    • 순열
    • 조합
  • 3.3 수학적 기댓값
  • 3.4 표본평균, 표준편차, 분산
  • 3.5 표본 왜도와 첨도
  • 3.6 표본분산과 상관관계
  • 3.7 금융 수익
  • 3.8 자본자산가격결정모형
  • 3.9 연습 문제

  • 4장. 금융 증권
  • 4.1 채권 투자
  • 4.2 주식 투자
  • 4.3 서브프라임 모기지 사태
  • 4.4 유럽 경제위기
  • 4.5 증권 데이터집합과 시각화
  • 4.6 주식분할 조정
  • 4.7 인수합병 조정
  • 4.8 여러 시계열의 그래프 비교
  • 4.9 증권 데이터 획득
  • 4.10 증권 데이터 정제
  • 4.11 증권 시세 검색
  • 4.12 연습 문제

  • 5장. 데이터집합 분석과 리스크 측정
  • 5.1 로그 수익률로부터 가격 생성
  • 5.2 가격 변동의 정규 혼합모형
  • 5.3 스위스, 최저환율제 포기 선언
  • 5.4 연습 문제

  • 6장. 시계열 분석
  • 6.1 시계열 조사
  • 6.2 정상 시계열
  • 6.3 자기회귀이동평균 과정
  • 6.4 멱변환
  • 6.5 TSA 패키지
  • 6.6 자기회귀누적이동평균 과정
  • 6.7 사례 연구: 존슨앤드존슨의 순이익
  • 6.8 사례 연구: 월간 항공기 탑승객 수
  • 6.9 사례 연구: 전력 생산량
  • 6.10 일반화된 자기회귀 조건부 이분산성
  • 6.11 사례 연구: 구글 주식 수익률의 변동성
  • 6.12 연습 문제

  • 7장. 샤프 비율
  • 7.1 샤프 비율 공식
  • 7.2 기간과 연율화
  • 7.3 투자 후보 순위 결정
  • 7.4 quantmod 패키지
  • 7.5 손익계산서 증가율 측정
  • 7.6 손익계산서 증가율의 샤프 비율
  • 7.7 연습 문제

  • 8장. 마코위츠 평균–분산 최적화
  • 8.1 두 위험자산의 최적 포트폴리오
  • 8.2 이차계획법
  • 8.3 포트폴리오 최적화를 이용한 데이터 마이닝
  • 8.4 제약, 페널티 부여, 라쏘
  • 8.5 고차원으로의 확장
  • 8.6 사례 분석: 2003년부터 2008년까지 S&P 500 지수에 생존한 주식
  • 8.7 사례 분석: 2008년부터 2014년까지의 수천 개 후보 주식
  • 8.8 사례 분석: ETF
  • 8.9 연습 문제

  • 9장. 군집 분석
  • 9.1 K–평균 군집 분석
  • 9.2 K–평균 알고리즘 분석
  • 9.3 무방향 그래프의 희소성과 연결성
  • 9.4 공분산과 정밀 행렬
  • 9.5 공분산 시각화
  • 9.6 위샤트분포
  • 9.7 그래프 라쏘: 무방향 그래프의 페널티 부여
  • 9.8 그래프 라쏘 알고리즘 실행
  • 9.9 수년간의 가치주 추적
  • 9.10 연도별 희소성의 회귀분석
  • 9.11 분기별 희소성의 회귀분석
  • 9.12 월별 희소성의 회귀분석
  • 9.13 아키텍처와 확장
  • 9.14 연습 문제

  • 10장. 시장 심리 측정
  • 10.1 마르코프 국면전환 모형
  • 10.2 시장 데이터 확인
  • 10.3 베이지안 추론
  • 10.4 베타분포
  • 10.5 사전분포와 사후분포
  • 10.6 로그 수익률의 상관관계 검사
  • 10.7 모멘텀 그래프
  • 10.8 연습 문제

  • 11장. 거래 전략 시뮬레이션
  • 11.1 외환시장
  • 11.2 차트 분석
  • 11.3 초기화와 마무리
  • 11.4 모멘텀 지표
  • 11.5 포지션 내의 베이지안 추론
  • 11.6 진입
  • 11.7 청산
  • 11.8 수익성
  • 11.9 단기 변동성
  • 11.10 상태 기계
  • 11.11 시뮬레이션 요약
  • 11.12 연습 문제

  • 12장. 펀더멘털을 이용한 데이터 탐색
  • 12.1 RSQLite
  • 12.2 시가-장부가 비율 계산
  • 12.3 reshape2 패키지
  • 12.4 사례 연구: 구글
  • 12.5 사례 연구: 월마트
  • 12.6 가치 투자
  • 12.7 연구 과제: 주식시장을 이겨라
  • 12.8 연구 과제: 재무 건전성
  • 12.9 연습 문제

  • 13장. 펀더멘털을 이용한 예측
  • 13.1 최상의 손익계산서 포트폴리오
  • 13.2 손익계산서 증가율 수치 재설정
  • 13.3 가격 통계 획득
  • 13.4 손익계산서와 가격 통계의 결합
  • 13.5 분류 트리와 재귀 분할을 이용한 예측
  • 13.6 분류기 간의 예측률 비교
  • 13.7 연습 문제

  • 14장. 옵션의 이항모형
  • 14.1 금융공학에서의 적용
  • 14.2 위험중립 가격결정과 무차익
  • 14.3 높은 무위험 수익률 환경
  • 14.4 이항 데이터의 이항모형 수렴
  • 14.5 풋–콜 패리티
  • 14.6 이항에서 로그 정규로
  • 14.7 연습 문제

  • 15장. 블랙–숄즈 모형과 옵션의 내재 변동성
  • 15.1 기하 브라운 운동
  • 15.2 기하 브라운 운동의 몬테카를로 시뮬레이션
  • 15.3 블랙–숄즈 유도
  • 15.4 내재 변동성 알고리즘
  • 15.5 내재 변동성 구현
  • 15.6 Rcpp 패키지
  • 15.7 연습 문제

  • 부록. 확률분포와 통계 분석
  • A.1 분포
  • A.2 베르누이분포
  • A.3 이항분포
  • A.4 기하분포
  • A.5 포아송분포
  • A.6 연속분포함수
  • A.7 균등분포
  • A.8 지수분포
  • A.9 정규분포
  • A.10 로그 정규분포
  • A.11 tv 분포
  • A.12 다변량 정규분포
  • A.13 감마분포
  • A.14 최대우도추정
  • A.15 중심극한정리
  • A.16 신뢰구간
  • A.17 가설검정
  • A.18 회귀분석
  • A.19 모형 선택 기준

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안

정오표

정오표

[p.66 5행]
왜도가 0이며
->
왜도가 0이면