clew

どっかの誰かの役にたてばうれしい。

scikit-learn を使う。はじめの一歩。

scikit-learn って何から始めればいいの?

これから PYTHON を使って機械学習についてボチボチ勉強したいと思います。
知識レベルは ほぼゼロ といっていいです。
チュートリアルを行ってみるだけではまったく意味がありません。
(それは私のレベルでもできる)
"現実世界において問題を解決するために応用できるレベル"じゃないと知識の無駄です。

具体的な目標は?

数年前から機械学習でトトくじの結果を算出することをやっています。
このブログのカテゴリには過去に書いてきた関係記事がリンクされています。(他ブログからインポート、転載した)
PYTHONで予測したものは皆無であり、ほとんどがWEKAで行われています。
理由は私自身がプログラミングがまったくできないからです。

WEKAは理屈が分からなくても、データをスキーム(アルゴリズム)に渡せば結果がでます。
でもそれだけでは発展性が無いと思い PYTHON の SCIKIT という機械学習のライブラリーで”実際にコードを書いて”予測してみたいと考えました。

私にとってのゴールは・・・”目的に沿ったコードを設計、書けるようになること” です。
対象はべつにギャンブルじゃなくてもいいんです。

実際のコードと結果を見比べてみる。

今回はサンプルコードを走らせてみます。
やり方はサンプルページからコードを丸写しして、それを IPYTHON に貼り付けるだけです。

選んだサンプルは以下。

http://scikit-learn.org/stable/auto_examples/svm/plot_svm_iris.html

ページの下部に枠で囲まれたコードがあります。これを全部コピペして、IPYTHONで走らせるだけで同じグラフが再生できます。

f:id:swat777:20130711195109j:plain

PYTHONXY の SPYDER のエディタにそのまま貼り付けるとインデントエラーになります。
IPYTHON QT console を開いてコピペすると問題なく再生できます。

まとめ

scikit-learn の サンプルコードは簡単に再現できます。しかし重要な事は”自分のデータ”を読み込ませて望む結果を出力させること。

自分なりにものにするためには ”どうすればいのか?”ということを考えているんですが、コードの ”どこに” ”何を” "どう書けば” ”どうなるのか?” ってとこを把握することが一番実戦的かなと思っています。
とりあえずは ♯ で書かれたテキストメモ と 実際のコードを照合していくってとこかなと。
一から基礎を学ぶといっても、それすらよく分からないですから。

以上。