TextMining: テキストの収集とWord cloudの表示

下のリンクにより、Twitterの現在の書き込みデータでテキスト解析をしようと思いました。

Twitterの書き込み情報を得るためにデベロッパー登録しましたが、高度な利用項目を選択してしまったため、「厳重チェック」対象になってしましました。ネット情報では、許可されるかどうかのメールを受け取るのは30日が目処だそうです。

 

Your First Text Mining Project with Python in 3 steps

 

デベロッパー登録ができてば上のプログラムを試したいと思いますが、その前に既存のデータを用いた下のプログラムを試しました。

 

Twitter Analysis with Python

 

文書の冒頭にリンクされているデータファイルをダウンロードしてPythonを実行するフォルダにおきます。

フォルダ名とファイル名をスクリプトに書き込んで実行すれば、Word Cloudが作成されました。

 

 

読み込んだデータの構造

 

読み込んだデータの冒頭6行

 

出現回数の多い単語が大きく表示される

 

 

About shibatau

I was born and grown up in Kyoto. I studied western philosophy at the University and specialized in analytic philosophy, especially Ludwig Wittgenstein at the postgraduate school. I'm interested in new technology, especially machine learning and have been learning R language for two years and began to learn Python last summer. Listening toParamore, Sia, Amazarashi and MIyuki Nakajima. Favorite movies I've recently seen: "FREEHELD". Favorite actors and actresses: Anthony Hopkins, Denzel Washington, Ellen Page, Meryl Streep, Mia Wasikowska and Robert DeNiro. Favorite books: Fyodor Mikhailovich Dostoyevsky, "The Karamazov Brothers", Shinran, "Lamentations of Divergences". Favorite phrase: Salvation by Faith. Twitter: @shibatau

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.