글 수 223
안녕하세요 현재 사회과학 분야에서 박사과정중인 학생입니다.
가입인사드립니다!
현재 저의 논문에 딥러닝을 접목하고 싶어 공부를 하고 있는데요
여기서 하나 질문이 있습니다.
시계열 빅데이터를 바탕으로 A라는 사회현상이 발생할 확률을 구하고 사회현상을 예측하고 싶습니다.
공부해보니 확률을 구하는 것 까지는 RNN(LSTM)방법으로 확률을 구할 수 있을 것 같은데요 이후 예측에서 막혀있습니다.
제가 막힌 부분은 이부분인데요
만약 2009년 부터 2019년 까지 구축된 시계열데이터(변수 약 60개 인구변수, 사회 경제변수 등)를 통해 2020년 사회현상이 일어날 확률을 구했고 이를 바탕으로 2025년 혹은 더욱 뒤의 미래에 사회현상이 발생할 확률을 구하는 부분입니다.
기본적으로 딥러닝에서는 인풋데이터가 있어야 예측이 가능할 터인데 2024년의 데이터는 아직 존재하지 않죠. 이러한 상황은 어떻게 해결해야 할까요?
감사합니다!
현재까지의 데이터로 2020년을 예측한 것처럼, 2024년을 예측하시면 됩니다. 예를 들어, 2009년의 1~12월 데이터를 입력으로 받아 2013년을 예측하는 식입니다. 그렇게 학습한 후 2020년의 1~12월 데이터로 2024년을 예측합니다. 아무래도 데이터도 줄어들고 정확도도 떨어질 수 밖에 없습니다.