プロジェクト

全般

プロフィール

2017-02-18 勉強会

発表した人 簡単な内容
太田 POSのデータでバスケット分析する話
柴田 Embulk Getting Started
金盛 はじめよう機械学習。書籍の紹介など

発表資料を置いたり、上に自分の発表内容を追加したりしてください。
追加で書くことがあったら書いておいてください。(太田)

発表資料へのリンク

アソシエーション分析の結果例

UCI Machine Learning Repository Online Retail Data Set のデータを使って作ったルールを ElasticSearch に食わせて Kibana しました。触ってどうぞ。

http://apriori.dev-ask.net/kibana/app/kibana#/dashboard/4d428390-fc40-11e6-a860-851d1ef91a32?embed=true

  • データについて:オンライン小売店の売り上げデータらしい
  • 使い方:left, right に入っているのが商品の説明。クリックすると展開して+マーク、-マークが見つかる。含むとか含まないとかのフィルタ条件にできる。左側に "GREEN REGENCY TEACUP AND SAUCER" を含むときの右側は…とか、右側に "ROSES REGENCY TEACUP AND SAUCER" を含むときの左側は…とか、そういう見方をする。
  • あらかじめかけてあるフィルタ
    • support でソート: 左右が同時生起している確率順
    • confidence 0.2 : 左を満たすトランザクションの 0.2 (20%) は右を含む
    • lift 2.5 : 左を満たすトランザクションが右を含む確率が、単にトランザクションが右を含む確率の 2.5倍

なんとなく触ってみる例:
”GREEN REGENCY TEACUP AND SAUCER” が買われるとき、同時に "ROSES REGENCY TEACUP AND SAUCER" も買われているという何にも面白くない例がトップに来ている。left を "TEACUP AND SAUCER” でおおざっぱにフィルタして、right に "TEACUP AND SAUCER” を含まないフィルタを与えたら、right に "REGENCY CAKESTAND 3 TIER" が出てきた。これも面白くはないけど、"REGENCY TEAPOT" よりよく出ているらしいのは、まあ多少面白い知見。

太田-アソシエーション分析.pdf - 太田: バスケット分析するフレンズ (874 KB) Asuka Ohta, 2017/02/18 19:44

Embulk.pdf (430 KB) Takao Shibata, 2017/02/21 19:38

begining_ml.pdf - はじめよう機械学習 (1.02 MB) 克俊 金盛, 2017/02/23 13:36