どこでも見れるメモ帳

とあるSEの備忘録。何かあれば気軽にコメントください〜

2014-12-01から1ヶ月間の記事一覧

sedによる文字列操作

はじめに sed*1便利ですよね.ちょっとした文字列操作が簡単にできます. ただ,日常的に使わないと,コマンドとかオプションとかを覚えるのが難しいですよね. ワンライナーな用途を前提として,どういった使い方ができるのか,整理してみました. sedコマ…

はてブを用いた興味分析

はじめに / 何をやりたいのか? 「興味はどこからはじまって,どこへ向かうのか。」知りたい*1 「ある時点までの自分自身の興味推移に即して,いま最も面白いと感じるであろうコンテンツ*2を推薦したい」 「ある時点までの自分自身の興味推移に即して,興味…

1. データの準備(はてブからブログ記事取得・形態素解析)

はじめに 連載記事 はてブ記事を用いた興味分析 の1つ目の記事です. 本記事では,次の説明を行います.ただし,具体的な処理内容については割愛します. 個人のはてブRSSファイルから,そのそれぞれのWebページに対して本文抽出し,DBに登録する. 本文抽出…

2. LDAによるトピック解析

はじめに 連載記事 はてブ記事を用いた興味分析 の2つ目の記事です. ここでは,はてブに登録したWebページ全てに対して,LDA*1によるトピック解析を行い, はてブに登録している内容のトピック(話題,興味の対象)を分析します. 実装の前提として,データ…