개발

인공지능 비트 트레이더 경진대회 참가 기록

로지dev 2021. 7. 16. 16:45

https://dacon.io/competitions/official/235740/leaderboard

 

인공지능 비트 트레이더 경진대회 시즌3

출처 : DACON - Data Science Competition

dacon.io

자랑할만한 성적이 아니지만, 기록용으로 남겨둠.

 

 

 

마감 2주 전에 알게되어 참가하였다. 

 

baseline 코드를 제공하는 아주 편안한 대회 (였으나 생각만큼 성능 개선이 쉽지 않았음.)

 

데이터는 여러 코인의 일부 시간단위를 무작위로 샘플링한 가격데이터(시가, 고가, 저가, 종가, 거래량)이고

 

일부 시간단위를 무작위로 샘플링했다는게 뭔지 파악하는 과정에서 약간 헷갈렸음.

 

근까 일반적인 가격 예측 문제처럼 전체 시계열을 다 던져주고 예측하라는게 아니라,

 

1500개의 봉(일봉이더라 분봉이더라??)을 차트 여기저기서 떼온 것. 

 

이 중 1380개를 학습데이터로 하여 120개의 봉을 예측하면 된다.

 

 

그런데, 이 120개의 봉을 예측만 하면 되는게 아니라 최종 성적은 번 돈으로 매긴다.

 

그말인 즉슨,

 

이 대회에서 성적을 높이는 방법은 크게 두가지로 정리된다.

 

 

 

1. 가격 예측을 완벽하게 해서 저점 고점을 따낸다.

 

2. 가격 예측은 완벽하게 못해도, 매매 전략으로 발라먹는다.

 

 

 

아마 1번이 '인공지능 대회'라는 명칭의 의도에 더 부합하는 방향이지만, 

 

현실적으로 결과는 무조건 수익으로 결정된다는 자본시장의 원리를 고려한 문제 설정이 아닌가 싶다.

 

 

나는 베이스라인을 돌려본 후 아래 포스팅을 참고하여 single variable(종가) LSTM으로 1번 방향의 실험을 해보았는데,

 

오버피팅이 너무 심해, validation loss가 너무 큼.

 

사실상 몹쓸 수준.

 

이격이 일정한 걸로 봐서, 내가 뭔가를 잘못했다는 것은 확실함.

 

그러나 시간은 이미 마감시간~ ^.^

 

 

의외였던 것은 앞서 시즌의 우승자들이 모두 ARIMA라는 통계모델을 사용하고 있었다는 것.

 

데이터 수가 적어서 LSTM으로는 성능이 제대로 안나오는 거였을까?

 

어쨋든 재미있는 대회를 알게 되었다.

 

다음 시즌을 기약해야겠다.