<aside>
📝 IEEE Access 저널 게재 (2024.10)
</aside>
<aside>
✅ 역할 : 데이터 수집, 전처리 및 EDA
</aside>
연구 배경
- COVID-19 이후 한국 주식시장에서 개인 투자자의 비중이 크게 증가했으며, 전통적 금융정보 채널에서 소셜 미디어로 투자 정보가 이동하고 있음
- 이러한 상황에서 소셜 미디어 데이터는 전통적 금융 데이터 분석을 보완할 수 있는 새로운 차원의 정보를 제공함
연구 필요성 및 목적
- 기존 연구는 뉴스 기사에 의존해 주가를 예측하는 데 한정되어 있으며, 개인 투자자의 감성과 의견을 반영한 주식 토론 게시판 데이터의 활용은 부족한 실정임
- 본 연구는 COVID-19 기간 급성장한 이차전지 섹터를 중심으로 주식 토론 게시판 데이터 기반 주가 예측 모델의 정확도를 비교 분석함
분석 내용
- 2020년부터 2022년까지 주요 6개 기업의 주식 데이터와 네이버 주식 토론 게시판 게시글 데이터를 수집함
- 분석 과정은 LDA 토픽 모델링, GPT 기반 감성 분석, 그리고 LSTM 기반 예측 모델 비교로 구성됨
- 예측 모델의 정확도는 입력 데이터에 따라 4가지 경우로 비교함
- P (Price)
- P+S (Price + Sentiment)
- P+T (Price + Topic)
- P+S+T (Price + Topic + Sentiment)
분석 결과 및 결론
- 주가 데이터와 토픽 확률 분포를 함께 활용한 P+T 모델에서 가장 높은 예측 정확도를 보였으며, 감성 점수는 그 변동성으로 인해 성능이 낮았음
- 개인 투자자들의 의견은 주식 예측 모델의 정밀도를 높이는 데 중요한 변수임을 확인함
- 주식 토론 게시판 데이터를 활용한 주가 예측 모델은 유의미한 결과를 보이며 소셜 미디어 데이터를 활용한 금융 분석 연구와 실제 금융시장 전략 수립에 시사점을 제공함