kanayamaのブログ

twitter: @tkanayama_

ポケモン人気投票データを使って推薦システムを作る

[祝] ポケモン25周年 〜推薦システムに詳しい方へ〜 本編 ステップ1. 基本的な集計をする ステップ2. ポケモンどうしの共起度を計算する ステップ3. ポケモンどうしをグループ分けする ステップ4. 推薦システムを作る まとめ 宣伝 ポケモン系 推薦システム系…

ポケモンを題材に「SQLアンチパターン」を実践してみる

@tkanayama_です。「SQLアンチパターン *1」 という本を読みました。「ポケモンを題材に因果推論を実践してみる」のように、仮想的なストーリ上で実際に使ってみた感を出すことにより、自分の記憶に定着させることを狙います。 前提として、何をアンチパター…

Kaggleの学習から投稿までをAWS, GitHub Actionsを使って自動化する

金山(@tkanayama_)です。先日終了したKaggleの"M5 Forecasting"というコンペに参加した際、クラウドやCI/CDの勉強も兼ねて、AWS, GitHub Actionsを使って遊んでみました。 免責 N番煎じだったらすみません。一応、同じことをやっているネット記事は見つか…

ポケモンを題材に因果推論を実践してみる

問題設定 有意差検定 交絡因子の存在 線形重回帰によるモデル化 回帰係数の推定 回帰係数の仮説検定 補足など 残差の分布について 他の交絡因子について データの生成方法について 参考文献 @tkanayama_です。最近「計量経済学*1」と「効果検証入門 *2」を読…

userの閲覧確率を考慮したMatrix Factorization

Modeling User Exposure in Recommendation [Liang et al., WWW2016] を読んだので、今回も行間を補いつつ、主にアルゴリズムの導出部分をブログにしました。 論文の一言要約 「itemが閲覧されたかどうか」(言い換えると、ユーザーの目に入ったかどうか)を…

Matrix Factorizationを確率モデルから導出する

Probabilistic Matrix Factorization [Salakhutdinov and Mnih, NIPS 2008] を読んだので、自分の言葉で行間を補いつつモデルの導出過程をまとめてみます。古典的な論文ですが、グラフィカルモデルを用いた独立性判定やベイズ推論を使いこなすための良い訓練…