バックテストに使用するデータの期間

0
304

十分な検証を行うのにはどれくらいの期間のデータが必要でしょうか?データは長ければ長いほどよいと書かれている本もあり、実際に過去数十年のデータを使った検証結果を載せている本もありますが、データが長ければ長いほどよいとは私は思いません。
当然ながら、取引スタンスや銘柄によってどれくらいデータが必要なのか違ってきますが、デイトレードだと分足で4~7年くらいあれば十分だと私は思っています。最長で10年分くらいまでで15年とかそれ以上になると今度は逆に過去のデータにバイアスがかかり過ぎて、直近の儲かるであろうアノマリーを見逃す可能性も出てくるからです。
例えば、外国人投資家の算入割合とかも昔とは全然違います。その他、日経225ミニ先物やETF・REIT等の新商品が開発されたり、オンライントレードが普及されたりと全く違う時代へと変遷しています。 インフレーションの影響やマーケット構造の変化や法律面での変更も少なからずありますので、必ずしもデータは長ければ長いほどよいということはありません。
ただし、長期間データのメリットもあります。長期間のデータで作成されたシステムは、収益力は小さいもののマーケットの構造変化に強く、極端なマーケットであっても損益はブレません。長期的に見れば儲かるわけですが、ドローダウンを回復するのにも、ある程度の期間が必要となりますのでトレード執行は忍耐勝負となります。また、システムが機能するのかしないのか、その答えが出てくるのが遅くなってしまうというデメリットが長期間データのシステムに見られます。
短期間データのシステムは長期間データのシステムと全く逆の性格です。まず、シミュレーションでの信頼性が低くなります。しかし、短期間のデータで検証した場合は収益力のあるシステムができやすく、直近データを使用しているがゆえにマーケットの癖を的確に捉えている可能性があります。デメリットは、当然ながら長期間運用するのには向いていなく、ちょっとしたマーケットの変化ですぐにシステムそのものの優位性が低下することです。
理想論を言えば、過去何十年ものデータでコンスタントにずっと儲かるシステムができればいいのですが、なかなかそういうシステムはできません。データの長短はどちらもメリット・デメリットがあるので、どの期間が最適だというのははっきりと定められているわけではないですが、上昇トレンド、下降トレンドが一回以上ずつ含まれているのが最低ラインかなという感じがいたします。以上の理由で私は4~7年くらいが妥当な数値かなと思いますが、皆さんはどう思われますか?


返事を書く(承認後反映)

This blog is kept spam free by WP-SpamFree.