推薦システム
結構仕事のメイルが来る。
学科のwikiのメインページのアクセス数が100万回を越えていた。けっこうすごい。
さて、少しお勉強したのでまとめておく。
K-PAX | Life of Brian | Memento | Notorious | |
Alice | 4 | 3 | 2 | 4 |
Bob | Φ | 4 | 5 | 5 |
Cindy | 2 | 2 | 4 | Φ |
David | 3 | Φ | 5 | 2 |
ユーザ空間とアイテム空間というものがあり、上記のようなマトリクスができる。 上の例ではアイテムとは映画で、 K-PAX、Life of Brian、Memento、Notoriousという四つのアイテムがアイテム空間内にある。 ユーザはAlice、Bob、Cindy、Davidの四人居る。 マトリクスの要素は映画の良さの評価(rating)で、1から5までで点数が付けてある。 Φは評価が欠落している場所である。 推薦システムの問題というのは、ユーザ空間、アイテム空間ともに非常に大きくなり、 しかもマトリクスの中で評価が欠落している箇所(値がΦとなっている箇所)が圧倒的多数を占める、ということである。 このΦの値を推測するのが、要するに、今日非常に重要性を増してきた推薦システムの問題だというわけだ。
しかし、私がやっていること、やりたいことは実はΦをできるかぎり正確に外挿補完すること、ではないのだ。 あるアイテムに対してそれに類似するアイテム群を探し出せばそれで良い。 それは推薦システムの副産物として得られるものではあるが、Φを推定することではない。