Text mining: Sentiment Analysis 2, Python

現在は有料になっていますが、次のスクリプトにしたがって石川啄木(いしかわたくぼく)のローマ字日記の一部(4月7日−20日)のテキストの頻出語(ひんしゅつご)をグラフにしました。   Very simple Python script for extracting most common words from a story   ローマ字だと単語が別れているので、文節で区切らなくても良いのでその分簡単です。 通常の日本語の場合、文節に区切るスクリプトが必要となります。      …

Continue reading

Python: Sentiment Analysis 1

Python or Rを利用したテキスト・マイニングを学び始めました。系統だったものにはなりませんが、学んだことを順次書き込みます。 今回は次の文書に従い、出現回数の多い言葉を選び出すスクリプトです。ストップワードについて一部書き換えています。準備するのは対象とするテキストだけです。   Very simple Python script for extracting most common words from a story   学生のころ、ある哲学者の著作の’Wir’や’uns’の数を数えて論文を書いた友人がい…

Continue reading