2012-01-01から1年間の記事一覧
以下のリンクを見てみてください。 怪しいリンクじゃないです。 はてなブックマークで取り上げられてた記事です。 当たり馬券配当30億円、外れは経費?…裁判 競馬における予想ソフトで、大きく儲ける話ってのは・・ 詐欺から本物まで、ほんとうにいろいろ…
ほとんど需要がない?と思われる、私の機械予測に関する記事。 懲りずに今回も書きます。 さて、サッカーにおけるデータってのは、試合が行われるたびにデータが更新されていきます。 まあ、蓄積といったほうが適切です。 ファンサカ?でしたっけ? ああいう…
さて、長らくブログはお休みしてました。 その間も、ちょこちょことトトくじ予測アルゴリズムの改良を試行してきました。 改良は、かなりのところまで来ているのですが、まだ決定的とはいえない状況。。 ま、いろいろと問題があるのですね。 そのうちのひと…
さて、機械学習によるサッカー勝敗予想・・ このブログにおいてトト予測について記事を書き始めてから相当な日数が経過しました。 その間、実際には一度もくじを買ってはいません。 したがって当選実績もナシ。 ひたすら「どうすれば良い予想ができるか?」…
さて現在は、トト予想モデルの完成に向けてバックテストを行っています。 プロトタイプ1号?は完敗でした。SVM によるトトくじ予測は失敗作です。 あの系統、路線では今後発展する見込みはありませんでした。なので発想を変える必要がありました。 ちょっと…
さて、記事にしようか、どうしようか迷っていたのですが・・ いつものようにデータをいじくり回していると・・ 私にとってはびっくりするような結果が出力されたんです。 なんと正解率100%! 13枠すべてをピッタリと当てることができたんですね。 こん…
さて、タイトルどおり J1 の結果を待つまでも無く、今季最後の予想は敗北が確定しました。 いままで試した方法は、すべて使い物にならない。。 かなり悔しいですが、現実だから仕方ないですね。 また違ったアプローチで立ち向かわねばなりません。 んーで、…
さて、今回602回めをもって今季の本トトくじは終了します。 というわけで、最後の予想をアップします。 いつものことですが、この予想は機械的にされています。 私の主観は入っていません。 支持率からみて不自然な買い目となっているものがいくつかあり…
さて、前回の記事を見てもらえれば分かりますが、タイトルどおりの結果に終わった第600回のトトくじ。 ブログには掲載しませんでしたが、実際には、もっとたくさん予測しています。 パターンを変えて何種類も試すわけですね。 WEKA はアルゴリズムの組み…
C:\libsvm-3.12\tools>python easy.py sijiritu23 Scaling training data... WARNING: original #nonzeros 1875 new #nonzeros 2009 Use -l 0 if many original feature values are zeros Cross validation... Best c=8.0, g=0.5 CV rate=66.7482 Training..…
さて、どうでもいい話シリーズ?なんだけれど・・ フットボールラボ というJリーグのデータに特化したサイトがあります。 今年5月にオープンしたサイトなんですが・・かなり良い。 良いんだけれど、過去の任意の時点でのデータが見れないんですよ。 更新さ…
さて、たまには役に立つ?話でも・・と思うわけで、今回は競馬とデータマイニングについての話です。 かなり以前になりますが、とある競馬の予想会社?が巨額の脱税容疑で摘発された事件がありました。 ニュースが流れた当時、私も相当気になりまして、「こ…
最近はちょっくら”お疲れモード”なんですが、相変わらずトトデータについて思案しています。 データマイニングからお宝を発掘する必要最低条件について、いろいろ考えるわけですね。 トトとか・・まあギャンブル全般について、アルゴリズムを用いて予測して…
相変わらずトトのデータをいじくりまわしています。 SVMのほうも、いろいろ考えては試行しているといった状況。 求めてることは、ほんとに単純なことなんですが、なかなか手ごわいです。 さて、ベイズに関しても、ちょこちょこ資料を探しては理解に努めて…
今回は”私的なトトくじの予測手法”についての作業工程のまとめです。 「興味がない」か、あるいは「何を言ってるのか、さっぱり分からないわ・・理解不能・・」のどちらかだと思いますけれども、万が一にも”役に立つ情報”があれば幸いです。 1、まずはデー…
予測モデルの作り方、考え方について、わかりやすく解説してくれているページを紹介します。 ■予測モデルの作り方(実務的な話) 1年ほど前に書かれているようですね。 予測モデル というものに初めて触れる方には、意味不明の言葉が少しあるかもしれません…
さて、アホみたいに予測がどうだとか、確率が~どうした?と言ってる私。 今回もそんなお話です。 まあ、知識がまったく乏しいことを前提?に書きます。 なので誤った認識や術語が適切でないことをお断りしておきます。突っ込みたい方は、どうか優しく接して…
さて・・”予想難易度による分類”(クラスター分析)は結果が分かってから初めて可能になります。 ”どんな結果になるか?前もって知らない、分かってない状態”では実行不可能・・ということに気が付きました。 すなわち、これから予想しようと思っていること…
さて、充分なバックテストを行ったわけではありませんが・・ 自己組織化マップ を用いたクラスタリングでのデータ分類・・ここまでは簡単に実行できます。 問題は、それで分類したデータをトレーニングデータとして予測を行った場合・・ ”予測精度が非常に悪…
さて、案の定。。予想はひどい結果ですね。 今回はJ1はナビスコ杯、J2はリーグ戦という変則パターン。 でも、こういった対戦カードの構成の違いを予想の不調の原因にしちゃいけないです。 597の自分の予想は・・ダブル5で 2/13 という結果。。(…
さて、飽きずに機械学習による予想を続けています。 今回は新たな手法として”予測の前にクラスタリングしてみる”ということを試します。 人力による任意の難易度設定による予測は失敗でした。 今度はクラスタリングを用いて、クラス分けしたデータをトレーニ…
さて、まだまだ予想手法を確立するには時間が必要です。。 とりあえずは、少し手法を変えて記録を残しておきます。 596回は特殊だからデータとしては不採用としました。 まずは、いつものように最新回13枠(595)のデータを597回の予想に向けてト…
さて、前回に引き継続き、予想難易度による分析?・・予想です。 概要: 1、難易度によって分類され、かつ、リーグ戦以外を除いたトト13枠開催回のみをトレーニングデータとして使用。 2、パラメーター探索には、libsvm付属の ”EASY.PY”を使用。 本…
さて、まだまだ試行錯誤で完成にはほど遠い状況ですが・・ プロトタイプ第一号として、忘れないうちに手順を記録しておきます。 1、まず分析に使用するデータを難易度によって分類する。 今回、改めてデータ全般について見直しを行いました。 いろいろと過…
さて、何を言ってるのか・・さっぱり分からないとは思いますが、とりあえず記録ということで。 与えるデータを、その特徴別に分割して、それぞれを予測モデルとする案は失敗に終わりました。。 これではまともに機能しないことが判明。 時系列の要素はありま…
とりあえあず備忘録ということで、「何を行ったか?」 記録に残します。 まずトレーニングデータ(今季のトトくじ対象ゲームのデータ)を前期、中期、後期 という具合に時系列要素を残したまま適当に3分割しました。 そして、それぞれに TOTO1,TOT…
さて、タイトルにあるように、予想結果はボロボロでした。 ですが、万策尽きたわけではありませんので、それほど落ち込んではいません。 ”SVMにおけるパラメーターを適正化しただけでは、トレーニングデータに対する識別度が向上しただけであり、未知のデ…
気になったので、先の記事で触れた Feature Engineering について、ちょこっと調べてみました。 意外にこの < Feature Engineering> というキーワードは、今の私にとってピッタリの内容なんじゃないか?と思ってるわけです。 何がピッタリなのか? それは…
さて、ことあるごとに・・というか、思い付くままといった方がいいけれども、 機械学習や予測といったキーワード、あるいは数値化とか・・まあ、その時々で浮かんだワードで検索を繰り返し、テキストを読みまくっているわけです。 ある程度ではありますが、…
さて、ほぼ二週間を費やして新しい予想手法・・というか正しい?やり方を模索してきたわけで・・ まだ完全理解というわけではありませんが、間違ったプロセスを残しておくことも役に立つことがあるかもしれない・・というわけで記録に残しておきます。 まず…