책 제목 : 퀀트 전략을 위한 인공지능 트레이닝

  • 정리
  • 코드

https://github.com/quant4junior/algoTrade

지은이의 말

  • 주식 예측이 어려운 이유
  1. 시계열 데이터의 일종이며, 과거의 패턴과 미래의 패턴이 일정하지 않기 때문에 예측하기가 어렵다.
  2. 주가를 움직이는 요소가 매우 복잡하며, 적절한 변수를 사용하지 않는 한 많은 noise를 갖게 된다.

Chapter 1. 금융과 투자 영역의 머신러닝

  • 금융 분석이 어려운 이유
  1. vision, nlp 처럼 지식이나 방법론이 활발하게 공유되지 않음
  2. 검증 방법이 제한적

투자에서는 과거 데이트를 바탕으로 하는 backtesting 검증 방법이 주로 사용되지만

일반적인 머신러닝 데이터의 검증셋 테스트셋 보다 성과에 대한 신뢰도가 높지 안핟.

-> 신뢰성 있는 backtesting 방법이 필요

  1. 양질의 데이터가 부족

투자 패턴의 다양화에 따라 고려해야 할 변수가 기하급수적으로 증가하는 반면, 투자 자산 데이터는 한정적임

Chapter 3. 파이썬으로 만드는 투자 전략과 주요 지표

Buy&Hold 전략 실습

  • 3.1 바이앤홀드 전략

바이앤홀드 - 주식을 매수한 후 장기 보유하는 투자 전략

-> 매수하려는 종목이 충분히 저가라고 판달될 때 주기적으로 매수한 후 장기간 보유하는 방식으로 투자하는 것

  • 데이터 처리

판다스 cumprod()

누적 곱 계산

  • 3.2 투자 성과 분석 지표
  1. 연평균 복리 수익률(CAGR)

산굴평균 수익률 -> 기하평균 수익률로 분석(기하평균 수익률이 복리 성질과 주가 변동이 심한 때에 따라 변동성을 표현하기 때문)

CAGR(t0, tn) = (v(tn) / v(t0))^(1 / (tn - t0) - 1)

V(t0) : 초깃값

V(tn) : 최종값

tn -t0 : 연 횟수

  1. 최대 낙폭(MDD)

최대 낙폭 지수로, 투자 기간에 고점부터 저점까지 떨어진 낙폭 중 최댓값을 의마한다.

투자자가 겪을 최대 고통을 측정하는 지표 -> 낮을수록 좋음

최대 낙폭 = (Trought Value - Peak Value) / Peak Value

Peak Value : 관측 기간 최고점 가격

Trough Value : 관측 기간 최저점 가격

  1. 변동성 (Vol)

금융자산의 방향성에 대한 불확실성과 가격 등락에 대한 위험 예쌍 지표

수익률의 표준 편차를 변동성으로 계산

Sigma(p) = Sigma(일)Root(p)

  1. 샤프 지수

위험 대비 수익성 지표

Ra 자산 수익률, Rb 무위험 수익률

실현 수익률의 산술평균 / 실현 수익률의 변동성 으로 계산

전통 퀀트 투자 전략

퀀트(Quant)투자는 data-kriven 전략이라고 할 수 있다.

  1. 전통적인 투자 방법론

quantitative(정량적) 방법론을 기반으로 투자 의사를 결정하는 것 - 정량적 : 모든것을 수치화

-> mean-reversion(평균 회귀), moving average(이동 평균선), relative strength index(상대 강도 지수), stochatic oscillator(스토캐스틱 오실레이터) 등의 다양한 지표를 사용

  1. 평균 회귀 전략

많은 자료를 토대로 결과를 예측할 때 평균에 가까워지려는 경향을 말한다.

  1. 볼린저 밴드(Bollinger band)

1980년대 존 볼린저에 의해 개발된 밴드

현재 주가가 상대적으로 높은지 낮은지를 판달할 때 사용하는 보조지표

이동 평균(중심선), 표준 편차(상단, 하단)으로 이루어짐

상단, 하단 밴드 = 중간 밴드 +- 2 * 20일 이동 표준 편차

중간 밴드 = 20일 이동 표준 편차