Dルートで行こう

ハック日記

Arimaモデル生成とbox検査を行った結果

This Script http://www.ec.kansai-u.ac.jp/user/arakit/documents/lbrts.pdf 
ちなみにRをものすごく網羅的に詳しく説明してあるため有用的と言える。

ここからの引用??

http://www.di.fc.ul.pt/~jpn/r/ts/index.html




>
plotForecastErrors <- function(forecasterrors) + { + # 予測誤差のヒストグラム(赤色)の作成 + mybinsize <- IQR(forecasterrors)/4 + mymin <- min(forecasterrors)*3 + mymax <- max(forecasterrors)*3 + mybins <- seq(mymin, mymax, mybinsize) + hist(forecasterrors, col="red", freq=FALSE, breaks=mybins) + # ヒストグラムの下の面積を 1 とするために,freq=FALSE とする + mysd <- sd(forecasterrors) + # 平均が 0,標準偏差が mysd の正規分布に従うデータを生成 + mynorm <- rnorm(10000, mean=0, sd=mysd) + myhist <- hist(mynorm, plot=FALSE, breaks=mybins) + # 予測誤差のヒストグラム正規分布のカーブを重ねて描く + points(myhist$mids, myhist$density, type="l", col="blue", lwd=2) + } > > plotForecastErrors(zkunren2$residuals)




>
fore<-forecast(zkunren2) > plotForecastErrors(fore$residuals)



>
Box.test(fore$residuals, lag=20, type="Ljung-Box") Box-Ljung test data: fore$residuals X-squared = 100.86, df = 20, p-value = 0.04364


とりあえず要約すると,作ったArimaモデルが本当にフィットした予測なのかどうかをBoxテストで
予測残差をしばき回している。


p値とは仮説が正しい上で検定統計量の値より大きくなる確率のことである。とりあえず、正規分布を思い出せばいい。有意水準が5%

予測誤差の平均

とりあえず予測誤差の正規分布

f:id:relorelo:20151027094459p:plain

 

めっちゃなだらか、やはりモデルが悪いんじゃないかー