clew

どっかの誰かの役にたてばうれしい。

2012-01-01から1年間の記事一覧

やっぱり・・競馬は儲かるのか?興味深い記事があるぞ?

以下のリンクを見てみてください。 怪しいリンクじゃないです。 はてなブックマークで取り上げられてた記事です。 当たり馬券配当30億円、外れは経費?…裁判 競馬における予想ソフトで、大きく儲ける話ってのは・・ 詐欺から本物まで、ほんとうにいろいろ…

予測モデルと逐次更新されるデータとの関係性について。

ほとんど需要がない?と思われる、私の機械予測に関する記事。 懲りずに今回も書きます。 さて、サッカーにおけるデータってのは、試合が行われるたびにデータが更新されていきます。 まあ、蓄積といったほうが適切です。 ファンサカ?でしたっけ? ああいう…

トトくじ予測 プロトタイプ改良に向けて試行中。

さて、長らくブログはお休みしてました。 その間も、ちょこちょことトトくじ予測アルゴリズムの改良を試行してきました。 改良は、かなりのところまで来ているのですが、まだ決定的とはいえない状況。。 ま、いろいろと問題があるのですね。 そのうちのひと…

機械学習でトトくじの1等なんか獲れるわけねーよ。。と思ってるあなたへ。

さて、機械学習によるサッカー勝敗予想・・ このブログにおいてトト予測について記事を書き始めてから相当な日数が経過しました。 その間、実際には一度もくじを買ってはいません。 したがって当選実績もナシ。 ひたすら「どうすれば良い予想ができるか?」…

トトくじ予想 プロトタイプ2号の完成に向けて。 その1。

さて現在は、トト予想モデルの完成に向けてバックテストを行っています。 プロトタイプ1号?は完敗でした。SVM によるトトくじ予測は失敗作です。 あの系統、路線では今後発展する見込みはありませんでした。なので発想を変える必要がありました。 ちょっと…

まだ何とも言えないが・・ひょっとして大化けするかもしれない。

さて、記事にしようか、どうしようか迷っていたのですが・・ いつものようにデータをいじくり回していると・・ 私にとってはびっくりするような結果が出力されたんです。 なんと正解率100%! 13枠すべてをピッタリと当てることができたんですね。 こん…

第602回トトくじ 結果を待たずして敗北確定。しかし、転んでもタダでは起きないわよ。

さて、タイトルどおり J1 の結果を待つまでも無く、今季最後の予想は敗北が確定しました。 いままで試した方法は、すべて使い物にならない。。 かなり悔しいですが、現実だから仕方ないですね。 また違ったアプローチで立ち向かわねばなりません。 んーで、…

まったく参考にはならんと思うが・・第602回トトくじの予想をアップする。

さて、今回602回めをもって今季の本トトくじは終了します。 というわけで、最後の予想をアップします。 いつものことですが、この予想は機械的にされています。 私の主観は入っていません。 支持率からみて不自然な買い目となっているものがいくつかあり…

トトくじ第600回は、ダブル7 で 10/13 という正解率でした。。

さて、前回の記事を見てもらえれば分かりますが、タイトルどおりの結果に終わった第600回のトトくじ。 ブログには掲載しませんでしたが、実際には、もっとたくさん予測しています。 パターンを変えて何種類も試すわけですね。 WEKA はアルゴリズムの組み…

久しぶりにトトくじ第600回の途中結果照合をしてみた。

C:\libsvm-3.12\tools>python easy.py sijiritu23 Scaling training data... WARNING: original #nonzeros 1875 new #nonzeros 2009 Use -l 0 if many original feature values are zeros Cross validation... Best c=8.0, g=0.5 CV rate=66.7482 Training..…

フットボールラボが残念な件。オレはデータが欲しいんだよ。。

さて、どうでもいい話シリーズ?なんだけれど・・ フットボールラボ というJリーグのデータに特化したサイトがあります。 今年5月にオープンしたサイトなんですが・・かなり良い。 良いんだけれど、過去の任意の時点でのデータが見れないんですよ。 更新さ…

競馬とデータマイニング。どうでもいい話ですが興味があればどうぞ。

さて、たまには役に立つ?話でも・・と思うわけで、今回は競馬とデータマイニングについての話です。 かなり以前になりますが、とある競馬の予想会社?が巨額の脱税容疑で摘発された事件がありました。 ニュースが流れた当時、私も相当気になりまして、「こ…

相変わらずのトトくじ予想に関するメモ。

最近はちょっくら”お疲れモード”なんですが、相変わらずトトデータについて思案しています。 データマイニングからお宝を発掘する必要最低条件について、いろいろ考えるわけですね。 トトとか・・まあギャンブル全般について、アルゴリズムを用いて予測して…

ベイズ的予測手法について。その1。

相変わらずトトのデータをいじくりまわしています。 SVMのほうも、いろいろ考えては試行しているといった状況。 求めてることは、ほんとに単純なことなんですが、なかなか手ごわいです。 さて、ベイズに関しても、ちょこちょこ資料を探しては理解に努めて…

サポートベクトルマシンによるトトくじ予測 作業工程のまとめ その1。

今回は”私的なトトくじの予測手法”についての作業工程のまとめです。 「興味がない」か、あるいは「何を言ってるのか、さっぱり分からないわ・・理解不能・・」のどちらかだと思いますけれども、万が一にも”役に立つ情報”があれば幸いです。 1、まずはデー…

予測モデル作成のための基本について。これは良い資料だと思う。

予測モデルの作り方、考え方について、わかりやすく解説してくれているページを紹介します。 ■予測モデルの作り方(実務的な話) 1年ほど前に書かれているようですね。 予測モデル というものに初めて触れる方には、意味不明の言葉が少しあるかもしれません…

客観的確率が成立するのは前提条件がいっつも同じ時だけだ。トトは条件付き確率で考えるべき。

さて、アホみたいに予測がどうだとか、確率が~どうした?と言ってる私。 今回もそんなお話です。 まあ、知識がまったく乏しいことを前提?に書きます。 なので誤った認識や術語が適切でないことをお断りしておきます。突っ込みたい方は、どうか優しく接して…

予想難易度によるクラスター分析はいったん諦めます。これは不可能っぽい。

さて・・”予想難易度による分類”(クラスター分析)は結果が分かってから初めて可能になります。 ”どんな結果になるか?前もって知らない、分かってない状態”では実行不可能・・ということに気が付きました。 すなわち、これから予想しようと思っていること…

クラスター分析が鍵となるか・・?自己組織化マップでは上手く機能しないような気がする。。

さて、充分なバックテストを行ったわけではありませんが・・ 自己組織化マップ を用いたクラスタリングでのデータ分類・・ここまでは簡単に実行できます。 問題は、それで分類したデータをトレーニングデータとして予測を行った場合・・ ”予測精度が非常に悪…

第597回トトくじの結果がひどい。難易度はAクラスかそれ以上だな。

さて、案の定。。予想はひどい結果ですね。 今回はJ1はナビスコ杯、J2はリーグ戦という変則パターン。 でも、こういった対戦カードの構成の違いを予想の不調の原因にしちゃいけないです。 597の自分の予想は・・ダブル5で 2/13 という結果。。(…

クラスターを使って分析前にデータを分類してみる。

さて、飽きずに機械学習による予想を続けています。 今回は新たな手法として”予測の前にクラスタリングしてみる”ということを試します。 人力による任意の難易度設定による予測は失敗でした。 今度はクラスタリングを用いて、クラス分けしたデータをトレーニ…

ほとんど期待できないが・・第597回トトくじ13枠を予想する。

さて、まだまだ予想手法を確立するには時間が必要です。。 とりあえずは、少し手法を変えて記録を残しておきます。 596回は特殊だからデータとしては不採用としました。 まずは、いつものように最新回13枠(595)のデータを597回の予想に向けてト…

LIBSVM 予想難易度で分割したデータを使って、トト595回を予想させてみた。。

さて、前回に引き継続き、予想難易度による分析?・・予想です。 概要: 1、難易度によって分類され、かつ、リーグ戦以外を除いたトト13枠開催回のみをトレーニングデータとして使用。 2、パラメーター探索には、libsvm付属の ”EASY.PY”を使用。 本…

トト予想プロトタイプ1号 完成か?

さて、まだまだ試行錯誤で完成にはほど遠い状況ですが・・ プロトタイプ第一号として、忘れないうちに手順を記録しておきます。 1、まず分析に使用するデータを難易度によって分類する。 今回、改めてデータ全般について見直しを行いました。 いろいろと過…

データ 6パターン分割 は大失敗。しかし得るものはあった。

さて、何を言ってるのか・・さっぱり分からないとは思いますが、とりあえず記録ということで。 与えるデータを、その特徴別に分割して、それぞれを予測モデルとする案は失敗に終わりました。。 これではまともに機能しないことが判明。 時系列の要素はありま…

LIBSVM に与えるトレーニングデータセットを意図的に分類してみた。やったことの覚え書き。

とりあえあず備忘録ということで、「何を行ったか?」 記録に残します。 まずトレーニングデータ(今季のトトくじ対象ゲームのデータ)を前期、中期、後期 という具合に時系列要素を残したまま適当に3分割しました。 そして、それぞれに TOTO1,TOT…

第595回トトくじの結果が出ましたね。予想はボロボロですが・・。

さて、タイトルにあるように、予想結果はボロボロでした。 ですが、万策尽きたわけではありませんので、それほど落ち込んではいません。 ”SVMにおけるパラメーターを適正化しただけでは、トレーニングデータに対する識別度が向上しただけであり、未知のデ…

Feature Engineering (特徴選択)について調べてみた。特徴工学?って翻訳も、まあ間違いじゃないと思うんだが。

気になったので、先の記事で触れた Feature Engineering について、ちょこっと調べてみました。 意外にこの < Feature Engineering> というキーワードは、今の私にとってピッタリの内容なんじゃないか?と思ってるわけです。 何がピッタリなのか? それは…

どうやったら精度の高い予測ができるのか?現時点での考えを整理してみる。

さて、ことあるごとに・・というか、思い付くままといった方がいいけれども、 機械学習や予測といったキーワード、あるいは数値化とか・・まあ、その時々で浮かんだワードで検索を繰り返し、テキストを読みまくっているわけです。 ある程度ではありますが、…

第595回トトくじ13枠について、とりあえず予想したプロセスを記録しておく。

さて、ほぼ二週間を費やして新しい予想手法・・というか正しい?やり方を模索してきたわけで・・ まだ完全理解というわけではありませんが、間違ったプロセスを残しておくことも役に立つことがあるかもしれない・・というわけで記録に残しておきます。 まず…