책 제목 : 퀀트 전략을 위한 인공지능 트레이닝
- 정리
- 코드
https://github.com/quant4junior/algoTrade
지은이의 말
- 주식 예측이 어려운 이유
- 시계열 데이터의 일종이며, 과거의 패턴과 미래의 패턴이 일정하지 않기 때문에 예측하기가 어렵다.
- 주가를 움직이는 요소가 매우 복잡하며, 적절한 변수를 사용하지 않는 한 많은 noise를 갖게 된다.
Chapter 1. 금융과 투자 영역의 머신러닝
- 금융 분석이 어려운 이유
- vision, nlp 처럼 지식이나 방법론이 활발하게 공유되지 않음
- 검증 방법이 제한적
투자에서는 과거 데이트를 바탕으로 하는 backtesting 검증 방법이 주로 사용되지만
일반적인 머신러닝 데이터의 검증셋 테스트셋 보다 성과에 대한 신뢰도가 높지 안핟.
-> 신뢰성 있는 backtesting 방법이 필요
- 양질의 데이터가 부족
투자 패턴의 다양화에 따라 고려해야 할 변수가 기하급수적으로 증가하는 반면, 투자 자산 데이터는 한정적임
Chapter 3. 파이썬으로 만드는 투자 전략과 주요 지표
Buy&Hold 전략 실습
- 3.1 바이앤홀드 전략
바이앤홀드 - 주식을 매수한 후 장기 보유하는 투자 전략
-> 매수하려는 종목이 충분히 저가라고 판달될 때 주기적으로 매수한 후 장기간 보유하는 방식으로 투자하는 것
- 데이터 처리
판다스 cumprod()
누적 곱 계산
- 3.2 투자 성과 분석 지표
- 연평균 복리 수익률(CAGR)
산굴평균 수익률 -> 기하평균 수익률로 분석(기하평균 수익률이 복리 성질과 주가 변동이 심한 때에 따라 변동성을 표현하기 때문)
CAGR(t0, tn) = (v(tn) / v(t0))^(1 / (tn - t0) - 1)
V(t0) : 초깃값
V(tn) : 최종값
tn -t0 : 연 횟수
- 최대 낙폭(MDD)
최대 낙폭 지수로, 투자 기간에 고점부터 저점까지 떨어진 낙폭 중 최댓값을 의마한다.
투자자가 겪을 최대 고통을 측정하는 지표 -> 낮을수록 좋음
최대 낙폭 = (Trought Value - Peak Value) / Peak Value
Peak Value : 관측 기간 최고점 가격
Trough Value : 관측 기간 최저점 가격
- 변동성 (Vol)
금융자산의 방향성에 대한 불확실성과 가격 등락에 대한 위험 예쌍 지표
수익률의 표준 편차를 변동성으로 계산
Sigma(p) = Sigma(일)Root(p)
- 샤프 지수
위험 대비 수익성 지표
Ra 자산 수익률, Rb 무위험 수익률
실현 수익률의 산술평균 / 실현 수익률의 변동성 으로 계산
전통 퀀트 투자 전략
퀀트(Quant)투자는 data-kriven 전략이라고 할 수 있다.
- 전통적인 투자 방법론
quantitative(정량적) 방법론을 기반으로 투자 의사를 결정하는 것 - 정량적 : 모든것을 수치화
-> mean-reversion(평균 회귀), moving average(이동 평균선), relative strength index(상대 강도 지수), stochatic oscillator(스토캐스틱 오실레이터) 등의 다양한 지표를 사용
- 평균 회귀 전략
많은 자료를 토대로 결과를 예측할 때 평균에 가까워지려는 경향을 말한다.
- 볼린저 밴드(Bollinger band)
1980년대 존 볼린저에 의해 개발된 밴드
현재 주가가 상대적으로 높은지 낮은지를 판달할 때 사용하는 보조지표
이동 평균(중심선), 표준 편차(상단, 하단)으로 이루어짐
상단, 하단 밴드 = 중간 밴드 +- 2 * 20일 이동 표준 편차
중간 밴드 = 20일 이동 표준 편차