kazu22002の技術覚書

PHPer, Golang, AWS エンジニアの日々

kaggleを始めてみた

始めるに遅いはない。ということで、機械学習を触ってみることにしました。

www.kaggle.com

Kaggleは企業や研究者がデータを投稿し、世界中の統計家やデータ分析家がその最適モデルを競い合う、予測モデリング及び分析手法関連プラットフォーム及びその運営会社である。

機械学習用の問題が多数あり、結果をためしたり、notebookで考察が掲載されていたり、実践的な場になっています。

企業により、賞金が用意されている場合もありkaggle専門でお仕事にしている人がいたりします。

使い方と機械学習がどういうものか把握するために簡単な問題で試してみたいと思って調べると、「titanicの乗客の生存」についての問題がよく挙げられています。

www.kaggle.com

実践

取り組んでみた結果として、なにをすればいいのかさっぱりわかりませんでした。

本を何冊か読んでみて実際になにをすればいいのかわからないところがありました。取り組んでみると理解度が浮き彫りになり、さっぱり通用しないことを理解させられました。

基本はデータが提供されているので、データからこの場合の人はどうなる。という予測を算出する。ということですが、どういう分析をするのがいいのか、どういう手法があるのかを経験するところからでした。

データをみて統計をとり、どういうデータを作成すればいいのか。

事前処理の重要さがかなり理解でき、経験値が絶対的に足りていないことが実感できました。

事前処理自体は経験値により、似たケースになっていくと感じましたが、知識としてもっていると強みになると思えました。

誰にやってほしいか

経営層に一度やってもらいたいと感じた部分があります。

エンジニアにはもちろん、経営層がデータの重要さ、どういうデータを集めることで改善への結果につながりそうか。などを予測する要素になると感じています。

感覚で動くのもいいですが、データから思考するのも良いと感じています。

プログラミングなんてかけないよ。という時代ではないと思うので、手を出して欲しいですね。

deep leaning

deep leaningとは違うと思いますが、読んだことがある本での良本らしいです。

理論の部分で理解できず頭が痛くなりました。まだ理解できるまで読んでないです。

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

  • 作者:斎藤 康毅
  • 発売日: 2016/09/24
  • メディア: 単行本(ソフトカバー)