Project (6) 썸네일형 리스트형 Classical Time Series decomposition STL 논문리뷰에 앞서서 고전적인 방법을 어떻게 진행되는지 알아보았습니다. Moving average 시계열 데이터가 있으면 MA(moving average) 이동평균을 구해서 trend를 얻을 수 있습니다. 기본적으로 홀수값을 골라야 시계열 데이터에서 기준점에 대해 앞뒤를 고르게 볼 수 있어서 홀수값을 사용하는데 짝수값을 사용하게 되면 다시 2MA를 한번 더해주어서 홀수에서 한것처럼 나오게 해준다 실제 코드에서는 rolling이나 convolution_filter를 사용해서 trend를 구한다. Rolling은 과거시점의 정보만 사용하고 Convolution filter는 과거와 미래를 모두 포함하여 계산한다 Seasonal seasonal_component는 각각을 freq라는 기준값으로 나눴을 때 .. 감염병 예측 모델 (SI, SIS, SIR, SEIR) SI 모델 총 인구수를 N이라고 할때 감염 가능성이 있는 사람의 수를 S(Susceptible)이라고 합니다. 초기에는 S의 값이 N과 비슷하다고 가정하고 하는데 거기에 감염이 시간에 따라서 점점 증가하게 됩니다. 이를 비율로 나타내는 방식을 사용합니다.따라서 $\frac{S}{N}$ 부분이 전체 인구 수 에서 감염 가능성이 있는 사람의 수의 비율부분이 됩니다. 다음으로 감염에 대한 강도라고 하는것은 그 감염병이 얼마나 전파되는지에 대한 beta값과 감염된 사람의 수의 곱의 형태$\beta I$로 표현할 수 있습니다. $$\frac{dI}{dt} = \beta I \frac{S}{N}$$ 감염된 사람이 위와 같이 늘어났으니 시간에 따른 S에 해당하는 수의 변화량은 그만큼 감소하게 됩니다. $$\frac{.. 농산물 예측 데이터전처리 농산물을 예측하는 모델의 구조는 다음과 같습니다. 총 다섯가지 종류의 농작물에 대해서 예측을 합니다. 배추, 무, 양파, 홍고추, 마늘 크게 데이터는 3가지로 구분됩니다. 도매 가격 거래량 기상정보 각 농작물마다 1년주기로 바뀌는 주산지에 대한 기상정보를 얻습니다. 여기에서 기상정보의 경우에 배추와 무는 수확되고 나서 바로 시장에 팔리기 때문에 기상정보를 활용하지만 나머지의 경우에는 창고에 일정 보관 후에 시장에 나오기 때문에 기상정보를 제외하였습니다. 수출수입 정보는 수입에 대해서만 보았고 수입량과 수입시 단위 가격만 보았습니다. 가격&거래량 데이터 전처리 농넷에서 배추, 양파, 홍고추, 마늘, 무 총 5가지의 농작물에 대한 2014년도 1월 4일부터 2019년 12월 31일까지의 데이터는 일별 데이터.. STL(Seasonal-Trend decomposition using Loess) 논문 리뷰 진행중! Time Series 시계열 데이터에 시간에 순서에 대한 정보가 포함되어 있는 데이터 Additive VS Multiplicative additive $$ Y_t = T_t + S_t + R_t $$ Multiplicative $$ Y_t = T_t * S_t * R_t $$ $$ \log Y_t = \log T_t + \log S_t + \log R_t $$ 이와같이 바꿔서 additive처럼 사용도 가능! 시계열 데이터가 어떤식으로 구성되어 있는지에 따라 바뀌는데 보통 주식데이터가 Multiplicative를 따르고 보통은 additive를 따른다. Loess ( Locally weighted regression ) 가장 기본적으로 loess를 하는 방법은 wiehgt function에 mo.. STL-ATTLSTM:Vegetable Price Forecasting Using STL and Attention Mechanism-Based LSTM 논문 리뷰 이 논문에서는 3가지 기술을 합쳐서 가격예측 모델을 구성하게 됩니다. STL(Seasonal-Trend decomposition using Loess) Attention Mechanism LSTM Abstract Introduction sdf Related work 이 논문의 장점 농산물 가격에서 영향을 미치는것이 가격데이터 뿐만아니라 거래량 기상 수입데이터를 포함하여 입력 변수로 지정하여주었다. 통계모델말고 시계열에서 많이 사용하는 딥러닝 모델 LSTM을 사용하여 구성해보겠다. 이런 농산물 가격 예측 논문들이 데이터대상을 중국이나 인도시장을 대상으로 한것에 비해서 대한민국시장의 5가지 품종을 중심으로 데이터를 사용하였다. 농산물 가격을 추세성분과 계절성분이 포함하는 데이터인데 이런것을 다루는게 별로 없.. [산업수학 아카데미] 배운것 정리 1.git &anaconda prompt 간단하게 사용하는 방법 2. 따릉이 데이터를 이용해서 시각화하는 방법 다양하게 다른 블로그 참조해서 https://dailyheumsi.tistory.com/86?category=801880 [All about 따릉이 EDA, 1편] 대여소 살펴보기 짧은 서론. 무엇을 왜 하는가? 서울시에서 최근 계속해서 공공데이터를 많이 개방하고 있다. 그 중 가장 친숙하고도 대표적인 데이터는 '서울시 공공자전거', 일명 '따릉이' 데이터라는 생각이 dailyheumsi.tistory.com 1편 뿐만이 아니라 앞으로 가면서 데이터를 어떤 식으로 보는지에 대해서 살펴보았다. 3. 각자 배운것을 가지고 어떤 응용을 해볼까 했을 때 안산시에도 따릉이와 같이 페달로라는 것이 존재하는.. 이전 1 다음