本日は8月31日です。夏休みの宿題はお済でしょうか?
バックテスト用データを整理するとして、流動性すなわち出来高が多い銘柄はデータの質が良いというのは当然なのですが、それはデータを形成するのに出来高が多いほうが市場実勢を如実に表しているからだということが言えます。これを、流動性のパターンに分けて、詳しく説明したいと思います。
1、 一日に数枚程度しかできない
2、 出来高は少なくビッドとオファーがやや広い
3、 出来高は多く、常に板は存在する
4、 高頻度で売買が行われ、約定値段のほうが信頼度が高い
このうち、システムトレード対象の銘柄は3と4のみで、1と2は敬遠するべき銘柄です。
3の、「出来高は多く、常に板は存在する」という対象銘柄ですが、出来高が数万枚までというところで定義し、バックテスト用データの形態について協議してみます。通常、データを作成するのに約定値段を使いますが、最小値幅(呼値)の分だけずれる可能性があります。
例えば、瞬間で買いと売りをほぼ同時に出した場合、値段が動いたと判定されますが実際には提示されているビッドとオファーに変化はないので市場状況は何も変わっていないということが言えます。つまり、ビッドとオファーの中間値のデータを使うことのほうがリアリティを増すので、約定値段を使ったデータでバックテストするより現実的ではないかというのが今回提案の主旨となります。
ビッド・オファー・スプレッドについては各時間帯の平均を用いるなどでスリッページ計算に使うことも考えられます。余談ですが、High frequency trading (HFT)を行うヘッジファンド・プロップファーム等は、ビッドとオファーの中間値のデータを使うというよりはビッドとオファーのデータそのものを使ってバックテスト検証していると思われます。
4の、「高頻度で売買が行われ、約定値段のほうが信頼度が高い」という銘柄はそれほど多くなく、代表的なものは米国株価指数先物のe-mini S&P500くらいですが、このような銘柄は約定値段のみで反映するほうがよいと思います。というのも、約定値段は実際に契約が交わされた値段だといえますので、まさに現実のみを反映しているからです。
以上の提案があるわけですが、データ整理は奥が深く突き詰めるとキリがないので、実務では簡便法として全て約定値段を使っているのが現状です。しかし、ビッドとオファーの中間値のデータを使うという方法もあるのだということで、今回のまとめといたします。
コメントを残す