はてブを用いた興味分析
はじめに / 何をやりたいのか?
- 「興味はどこからはじまって,どこへ向かうのか。」知りたい*1
- 「ある時点までの自分自身の興味推移に即して,いま最も面白いと感じるであろうコンテンツ*2を推薦したい」
- 「ある時点までの自分自身の興味推移に即して,興味を持ちたい対象まで,最も面白いと感じるであろう経路でコンテンツを推薦したい」
というモチベーションで、興味分析関係の記事を連載します.
試行錯誤中ですので,どの程度の性能を実現できるか不明ですが,その試行錯誤内容を記事にまとめたいと思います.
アプローチをざっくり書くと,次の通りです.
- インプットとして,はてブに登録したブログ記事群/付与したタグをこれまでの自分自身の興味の推移として扱う.
- トピック解析/ネットワーク解析関連の技術を用いて,これまでの興味を分析,これからの興味を予測する.
- アウトプットとして,ブログ記事を推薦する.
進捗次第,以下の記事一覧に記事を追加していきたいと思います.
記事一覧(目次)
- データの準備。後続の3記事に対するデータ準備です。 ni66ling.hatenadiary.jp
- LDAによるトピック解析 ni66ling.hatenadiary.jp
- HDP-LDAによるトピック数自動決定可能なトピック解析*3 github.com
- DTMによるトピックの時系列解析*4 *5 github.com
- 共起ネットワークによるタグ付けネットワーク可視化 ni66ling.hatenadiary.jp
- 因果ネットワークによるタグ付け因果ネットワーク可視化 ni66ling.hatenadiary.jp
記事を追加したら、順次更新します。