clew

どっかの誰かの役にたてばうれしい。

第642回トトくじ 予測結果をアップする。

第642回のトトくじ 予測結果をアップ。

とりあえず WEKA を使用したトトの予測を継続します。
pythonを使った手法については、ぼちぼち考えているのですが、なかなか理解が追い付かず、まだ先になりそうです。

今回は bagging と naive bayes を使用しました。

これまでの予測経験から、WEKAにおける使用スキームとアルゴリズムは以下のように設定しました。

  • スキーム : BAGGING
  • アルゴリズム : NAIVE BAYES

経験からいうと正解率はおよそ60%程度。
あまり良くはありません。ムラはありますがこれぐらいの正解率でも比較的安定してるほうじゃないかと思います。
13枠でいえば「7~8個ぐらいは正解を含む」予測だと思います。

今回の例で言えば、6個ぐらい正解していれば良い方だと思いますね。

対戦カードと試合会場情報からスコアを予測する。

今回のデータ、属性は4個です。

  1. home
  1. away
  1. スタジアム名
  1. ホームまたはアウエイのゴール数

この4つ目の属性、今まではホームとアウエイ、両方のデータを与えて予測していました。
これを今回は別々に予測することにしました。
ちょっと手間はかかりますがデータを読み込ませた後にフィルターで操作するだけで済みます。

データを読み込んだ画面で、不要な属性にチェックを入れ、あとは remove を押すだけで消えます。
元に戻すときは、上の undo を押すだけで1段階、操作が戻ります。

第642回予測結果の画像

f:id:swat777:20130723172212j:plain

まとめ

今回使用した”スキーム(アルゴリズムの組み合わせ)”と”目的変数をゴール数として名義属性に変更しての予測方法”は、経験上 60%ほどの正解率が期待できます。

前回の予測・・・641においては4個しか正解していなかったと思いますが、テストとして使用するアルゴリズムをナイーブベイズに変更して予測してみたところ、6個の正解となり、すこし正解率がアップしています。

以上です。