clew

どっかの誰かの役にたてばうれしい。

2012-10-01から1ヶ月間の記事一覧

相変わらずのトトくじ予想に関するメモ。

最近はちょっくら”お疲れモード”なんですが、相変わらずトトデータについて思案しています。 データマイニングからお宝を発掘する必要最低条件について、いろいろ考えるわけですね。 トトとか・・まあギャンブル全般について、アルゴリズムを用いて予測して…

ベイズ的予測手法について。その1。

相変わらずトトのデータをいじくりまわしています。 SVMのほうも、いろいろ考えては試行しているといった状況。 求めてることは、ほんとに単純なことなんですが、なかなか手ごわいです。 さて、ベイズに関しても、ちょこちょこ資料を探しては理解に努めて…

サポートベクトルマシンによるトトくじ予測 作業工程のまとめ その1。

今回は”私的なトトくじの予測手法”についての作業工程のまとめです。 「興味がない」か、あるいは「何を言ってるのか、さっぱり分からないわ・・理解不能・・」のどちらかだと思いますけれども、万が一にも”役に立つ情報”があれば幸いです。 1、まずはデー…

予測モデル作成のための基本について。これは良い資料だと思う。

予測モデルの作り方、考え方について、わかりやすく解説してくれているページを紹介します。 ■予測モデルの作り方(実務的な話) 1年ほど前に書かれているようですね。 予測モデル というものに初めて触れる方には、意味不明の言葉が少しあるかもしれません…

客観的確率が成立するのは前提条件がいっつも同じ時だけだ。トトは条件付き確率で考えるべき。

さて、アホみたいに予測がどうだとか、確率が~どうした?と言ってる私。 今回もそんなお話です。 まあ、知識がまったく乏しいことを前提?に書きます。 なので誤った認識や術語が適切でないことをお断りしておきます。突っ込みたい方は、どうか優しく接して…

予想難易度によるクラスター分析はいったん諦めます。これは不可能っぽい。

さて・・”予想難易度による分類”(クラスター分析)は結果が分かってから初めて可能になります。 ”どんな結果になるか?前もって知らない、分かってない状態”では実行不可能・・ということに気が付きました。 すなわち、これから予想しようと思っていること…

クラスター分析が鍵となるか・・?自己組織化マップでは上手く機能しないような気がする。。

さて、充分なバックテストを行ったわけではありませんが・・ 自己組織化マップ を用いたクラスタリングでのデータ分類・・ここまでは簡単に実行できます。 問題は、それで分類したデータをトレーニングデータとして予測を行った場合・・ ”予測精度が非常に悪…

第597回トトくじの結果がひどい。難易度はAクラスかそれ以上だな。

さて、案の定。。予想はひどい結果ですね。 今回はJ1はナビスコ杯、J2はリーグ戦という変則パターン。 でも、こういった対戦カードの構成の違いを予想の不調の原因にしちゃいけないです。 597の自分の予想は・・ダブル5で 2/13 という結果。。(…

クラスターを使って分析前にデータを分類してみる。

さて、飽きずに機械学習による予想を続けています。 今回は新たな手法として”予測の前にクラスタリングしてみる”ということを試します。 人力による任意の難易度設定による予測は失敗でした。 今度はクラスタリングを用いて、クラス分けしたデータをトレーニ…

ほとんど期待できないが・・第597回トトくじ13枠を予想する。

さて、まだまだ予想手法を確立するには時間が必要です。。 とりあえずは、少し手法を変えて記録を残しておきます。 596回は特殊だからデータとしては不採用としました。 まずは、いつものように最新回13枠(595)のデータを597回の予想に向けてト…

LIBSVM 予想難易度で分割したデータを使って、トト595回を予想させてみた。。

さて、前回に引き継続き、予想難易度による分析?・・予想です。 概要: 1、難易度によって分類され、かつ、リーグ戦以外を除いたトト13枠開催回のみをトレーニングデータとして使用。 2、パラメーター探索には、libsvm付属の ”EASY.PY”を使用。 本…

トト予想プロトタイプ1号 完成か?

さて、まだまだ試行錯誤で完成にはほど遠い状況ですが・・ プロトタイプ第一号として、忘れないうちに手順を記録しておきます。 1、まず分析に使用するデータを難易度によって分類する。 今回、改めてデータ全般について見直しを行いました。 いろいろと過…

データ 6パターン分割 は大失敗。しかし得るものはあった。

さて、何を言ってるのか・・さっぱり分からないとは思いますが、とりあえず記録ということで。 与えるデータを、その特徴別に分割して、それぞれを予測モデルとする案は失敗に終わりました。。 これではまともに機能しないことが判明。 時系列の要素はありま…

LIBSVM に与えるトレーニングデータセットを意図的に分類してみた。やったことの覚え書き。

とりあえあず備忘録ということで、「何を行ったか?」 記録に残します。 まずトレーニングデータ(今季のトトくじ対象ゲームのデータ)を前期、中期、後期 という具合に時系列要素を残したまま適当に3分割しました。 そして、それぞれに TOTO1,TOT…

第595回トトくじの結果が出ましたね。予想はボロボロですが・・。

さて、タイトルにあるように、予想結果はボロボロでした。 ですが、万策尽きたわけではありませんので、それほど落ち込んではいません。 ”SVMにおけるパラメーターを適正化しただけでは、トレーニングデータに対する識別度が向上しただけであり、未知のデ…

Feature Engineering (特徴選択)について調べてみた。特徴工学?って翻訳も、まあ間違いじゃないと思うんだが。

気になったので、先の記事で触れた Feature Engineering について、ちょこっと調べてみました。 意外にこの < Feature Engineering> というキーワードは、今の私にとってピッタリの内容なんじゃないか?と思ってるわけです。 何がピッタリなのか? それは…

どうやったら精度の高い予測ができるのか?現時点での考えを整理してみる。

さて、ことあるごとに・・というか、思い付くままといった方がいいけれども、 機械学習や予測といったキーワード、あるいは数値化とか・・まあ、その時々で浮かんだワードで検索を繰り返し、テキストを読みまくっているわけです。 ある程度ではありますが、…

第595回トトくじ13枠について、とりあえず予想したプロセスを記録しておく。

さて、ほぼ二週間を費やして新しい予想手法・・というか正しい?やり方を模索してきたわけで・・ まだ完全理解というわけではありませんが、間違ったプロセスを残しておくことも役に立つことがあるかもしれない・・というわけで記録に残しておきます。 まず…

予測に使うデータ作成に関するメモ。データ属性について考えてみた。

さて、予想プログラムや、それの具体的な使い方についてはちょっと置いといて・・ 与えるデータについて少し考えたことをメモしておきます。 1、対戦カードの特徴を数値化する。 ”統計ソフト R ” とか "WEKA”、あと”LIBSVM”とかに渡すデータ形式…

LIBSVM でマニュアルに沿って分析してみるシリーズ <その2>

今回は・・EASY.PY を使って、一連の分類予測をオートマチックにやってみます。 使用するデータは前回と少し変えてみました。 変更点: 1、ベクトル数(次元の数)をひとつ減らした。 この意味は・・あまり完璧に理解しているわけではありませんが・…

LIBSVM用のトトデータが完成したので、マニュアルに沿って 分析してみる。<その1>

Introduction. さて、データを整形するためのEXCEL操作もなんとかクリアできました。 とりあえず、訓練用データ(trainingdata)と、テストデータ(testdata)の二つを用意。 訓練用データとして、2012のトトくじ・・第550回~第592回までのデ…