오늘부터 3학년 1학기에 진행했던 주식 데이터 예측 프로젝트를 다시 한 번 복습해보면서 블로그에 기재할 예정이다. 다양한 방법론이 있지만, 우리는 주식 데이터와 관련된 선행연구를 탐색해보고, python 및 no-code-ml인 KNIME를 사용해 모델을 만들어 보기로 했다. 당시에는 python 구현에 실패했기 때문에, 리뷰를 하면서 원인을 탐색해보고 어떤 부분이 부족했는지도 함께 확인할 예정이다.
1. 선정 이유
해당 프로젝트는 학부연구생이 되고나서 처음으로 실시했던 과제로, 연구생들이 서로 다른 선행연구 논문을 탐색해보고, 1주일마다 진행 상황을 세미나에서 공유하였다. 2020년 이후 급부상한 주식 데이터에 대해 향후 어떤 방향으로 흘러갈지 한 명의 투자자 입장에서 예측해보고 싶다는 생각이 들었고, 기계학습 알고리즘에 대한 이해도도 낮았기 때문에 도메인과 방법론에 대해 함께 공부할 수 있는 좋은 기회를 가질 수 있다고 생각했다.
2. 선행연구 논문 탐색
1주차에는 주식 데이터를 활용한 기계학습과 관련된 논문을 탐색하였다. 학교 도서관, DBpia, 구글 학술 검색 등에서 찾아본 논문들은 다양한 주가 데이터와 방법론을 사용해 분석을 진행하였지만, 용어와 수식에 대한 이해도가 부족해서 많은 어려움이 있었다. 하지만, 주식 시계열 데이터를 활용하여 의미 있는 결과를 도출할 수 있는 다양한 방법을 확인할 수 있었다.
3. KNIME 프로그램 설치
기계학습 작업을 위해 KNIME를 설치하였다. KNIME는 약 4천개이상의 node로 code없이 다양하게 데이터를 가공하고 모델링할 수 있는 도구이다. 차후 모델링 과정에서 SVM, Decision Tree 등의 알고리즘을 활용할 때 사용할 예정이다. KNIME에 대해서는 차후 따로 포스팅 하도록 하겠다.
4. 선행연구 논문 분석
1. 빅데이터를 활용한 인공지능을 통한 주식 예측 분석 사례
2021년 발행된 이 논문은 주식시장의 예측은 불확실성이 꽤 높고, 영향을 줄 수 있는 불특정 요인이 과도히 많기 때문에, 변수에 대한 문제를 해결함과 동시에 LSTM과 같은 방법을 사용해 기존의 방법론보다 더 정확한 결과를 도출하면 보다 정확한 결과를 도출할 수 있다고 제시하였다.
2. AI 기반환경의 주식 시세예측을 위한 성능 비교분석 시스템
2022년 발행된 이 논문에서는 LSTM, GRU, DeepQ-Network, XGBoost 4가지 예측 모델의 성능을 비교하였으며, 이 중 GRU가 주식 시세를 예측하는데 가장 적합하다고 제시하였다. 해당 논문을 통해 데이터/모델의 선택에 따라 상대적으로 결과가 다르게 도출됨을 알 수 있었다.
5. 향후 계획
1주차에는 선행연구를 탐색하며 주식 데이터 분석을 위해 어떤 것들이 필요한지 생각해보았다. 금융 분야 데이터는 기본적으로 도메인 지식이 상당히 중요하며, 기계 학습 알고리즘에 대한 이해도 역시 중요하다. 복잡한 수식과 용어, 다양한 알고리즘 선택이 상당히 어렵지만, 이 과정을 통해 보다 데이터 분석에 친숙해질 수 있을 것이라고 생각한다. 다음 주에는 추가적으로 선행연구를 탐색해보고, 논문 하나를 선정해서 보다 깊게 탐색해볼 계획이다.
출처
최민기, 조광익, 전민기, 최훈,「빅데이터를 활용한 인공지능 주식 예측 분석 사례」, 한국정보통신학회 2021년도 춘계종합학술대회 논문집 제25권 제1호, 303-304쪽(2021)
이철현, 오염덕,「AI 기반환경의 주식 시세예측을 위한 성능 비교분석 시스템」, 2022년 한국컴퓨터정보학회 동계학술대회 논문집 제30권 제1호, 127-128쪽(2022)
'데이터 분석 > 주식 선행연구 분석' 카테고리의 다른 글
| [주식] 기계학습을 활용한 주식 데이터 분석 - 6주차 (0) | 2023.08.14 |
|---|---|
| [주식] 기계학습을 활용한 주식 데이터 분석 - 5주차 (0) | 2023.08.08 |
| [주식] 기계학습을 활용한 주식 데이터 분석 - 4주차 (0) | 2023.08.06 |
| [주식] 기계학습을 활용한 주식 데이터 분석 - 3주차 (2) | 2023.08.05 |
| [주식] 기계학습을 활용한 주식 데이터 분석 - 2주차 (0) | 2023.08.04 |