數據準備
可以看出,滯後階數為1的自相關值超過了置信邊界,但是滯後階數為1-20的所有其他自相關值都沒有超過置信邊界。
研究表明,滯後階數為1,2,3時的偏自相關系數超過置信邊界為負,並且隨著滯後階數的增加而逐漸減小。
模型預測法
ARIMA模型的自動預測
它不要求時間序列上連續值之間的相關性,指數平滑法可用於時間序列數據的短期預測。
簡單指數平滑法
適用於無季節變化、處於恒定水平、無明顯趨勢的時間序列的預測。
獲取數據(數據源為倫敦年降雨量),通過ts函數轉換成時間序列。
預測未來五年的降水量
藍線用於預報1913-1920之間的降雨量,深灰色陰影面積為80%,淺灰色陰影面積為95%。預測提供了預測誤差(殘差)的統計指標,以評估預測是否有可能得到改善:如果預測誤差相關,則很可能可以通過另壹種預測技術來優化簡單的指數平滑預測。
可以發現,自相關系數在第三期達到置信限。為了驗證當滯後為1-20階時非零自相關性質是否顯著,可以使用Box.test()的Ljung-Box檢驗。
統計量為17.4,p值為0.626,不足以拒絕預測誤差在1-20階為非零自相關。
霍爾特指數平滑法
霍爾特指數平滑法可用於預測水平不穩定、無季節可加模型的時間序列。霍爾特指數平滑法是估計當前時間的水平和斜率。它的平滑級別由兩個參數控制,α:估計當前點級別,β:估計當前點趨勢的部分斜率。兩個參數都在0-1之間。當參數越接近0時,最近觀測值的權重越小。數據來源為1866至1911的女裝裙擺年直徑。利用ts函數將數據轉換成時間序列,並繪制時序圖。
相關預測值中,α值為0.8383,β預測值為1.0。這些都是很高的值,充分說明當前值在時間序列上,無論是橫向還是趨勢的斜率上,都嚴重依賴於最新的觀測值。這個結果也符合我們的預期,因為時間序列的水平和斜率在整個時間段內變化很大。總體來說,預測效果還不錯(紅色為預測值)。
預測未來五年的數據值,並得出預測結果。
為了檢驗預測效果,我們還檢驗了延遲1-20階的預測誤差是否非零自相關,繼續使用Ljung-Box檢驗。
相關圖顯示,樣本中的預測誤差在滯後5階時超過置信邊界,其他都沒有超過。我們認為有壹些偶然因素。
P =0.4749,也就是說置信度只有53%,不足以拒絕預測誤差在1-20為非零自相關,所以我們接受預測誤差在1-20為非零自相關。
霍爾特-溫特斯指數平滑法
具有增減趨勢和季節波動的時間序列預測方法。在Holt-Winters算法中,提供alpha、beta和gamma分別對應當前點的級別、趨勢和季節。參數的去強化範圍在0-1之間,當參數接近0時,近期觀測的影響權重較小。數據源是以澳大利亞昆士蘭州海邊紀念商品的月銷售日期為分析對象,通過ts函數將數據轉換成時間序列,繪制時序圖。
可以用對數來減少極值的影響,消除不均勻方差。
通過預測包預測未來12個月的銷售數據,並得出預測結果。
該模型成功地預測了季節性高峰,該高峰大約出現在每年的65438+2月。我們還可以通過繪制相關圖和Ljung-Box檢驗來檢驗延遲為1-20階時,樣本內預測誤差是否為非零自相關,進而確定預測模型是否可以再次優化。
相關圖顯示樣本的自相關值沒有超過1-20的滯後次序中的顯著(置信)邊界。
Ljung-Box檢驗的p值為0.6183,因此我們推斷,在1-20的滯後序中,沒有明顯的證據表明預測誤差是非零自相關的。