<aside>
💡 제 11회 산업통상자원부 공공데이터 활용 BI 공모전 참가 - 1차 합격, 2차 불합격 (2023.07)
</aside>
<aside>
🔥 한국경영학회 우수논문상 (2024.08)
</aside>
<aside>
✅ 역할 : 기상 및 전력 데이터 수집 및 전처리, PPT 작성
</aside>
https://github.com/minsuk1003/BI_Competition
프로젝트 주제
- 최근 기후변화에 따라 정확하고 빠른 전력수요 예측 필요성이 대두되는 상황 속에서 시계열 예측 분야에서 Transformer의 높은 복잡도를 극복할 수 있는 DLinear 모델을 활용하여 효과적인 실시간 전력수요 예측을 수행함
데이터 분석 내용
- 전력수급 데이터 (y) + 기상 데이터 (X) + 지역별 전력량 데이터 (가중치) 를 수집함
- 전처리 과정에서 최근 10년 간의 기상 및 전력 데이터에 대해 결측치 및 이상치 처리, 상관관계, VIF 분석을 통한 변수 선택 등을 수행함
- 전력수요는 기상정보에 영향을 받지만 지역별로 상이하므로, 지역별 주거용 전력거래량을 기준으로 서울, 경기 지역의 기상정보에 높은 가중치를 부여함
- DLinear 모델을 통해 향후 6시간의 5분 단위 전력수요를 예측하였으며, 작업 환경과 입력 데이터의 크기에 따라 성능을 비교함
분석 결과
- 3년 단위의 입력 데이터에서 보다 높은 시간비용을 갖지만, 더 낮은 MAPE를 기록함
- 평균적으로 5% 미만의 오차를 기록했으며, Local, Colab 환경에서 큰 차이를 보이지 않음
- 다음 6시간을 예측하는 데 약 10분이 소요되었으며, 실시간 수요예측을 만족함
- 그러나, 06:00 ~ 12:00 시간대에서 보다 두드러지는 오차를 개선할 필요성이 존재하며, 입력된 기상 데이터로는 발견하기 어려운 관계가 해당 시간대에 존재한다고 판단됨