どこでも見れるメモ帳

ソフトウェアに関する備忘録を投稿します.何かあれば気軽にコメントください♪

はてブの共起タグをネットワーク表示してみた(大規模版)

はじめに

はてブの共起タグをネットワークを表示してみました。

下図は、「機械学習」タグがついたWebページをほぼ全て取得し、「機械学習」タグと一緒についているタグをGephiでネットワーク表示してみたものです。*1
「機械学習」タグまわりの共起タグ

また、流行りの「deep learning」タグまわりの共起タグだけピックアップして表示すると、このような感じです。 「deep learning」タグ周りの共起タグ

このように表示することで、「機械学習」の広がりをパッと確認できて、面白いですよね。*2

別例で

同様に「エロ」タグまわりの共起タグをネットワーク表示してみました。*3 「エロ」タグ全体

また、せっかくなので、コミュニティ分析でクラスタリングしてみたところ、以下のように分類できました。 「画像・フェチ」クラスタ 「ニュース・日本」クラスタ 「ジェンダー」クラスタ 「ビジネス・テクノロジ」クラスタ

なんだかそれっぽい感じ!
ふむふむ、思っていたよりも幅のあるタグが一緒に付けられてる印象がします。

おわりに

にしても、Gephiがすごいです!想像してたよりもビックリするくらい手軽に色々できました*4
今後も、機会があれば積極的に使っていこうと思います。

今回作ったスクリプトGitHubにアップしておきます。 github.com

関連記事

ni66ling.hatenadiary.jp

*1:画像は結構高画質なので、画像だけで表示すれば、タグ名もギリギリ見えるはず

*2:性能の問題で、表示数を閾値で切ってますが、全部出してみるともっと面白そう

*3:みんな、どんなタグを一緒に付けているのかなぁと気になって

*4:クラスタリングとか、各種レイアウトアルゴリズムとか、各種中心性算出とか…