R: アニメ好きが始めるデータ分析 ver. 1

Mediumにアニメのデータの分析が紹介されていました。アニメに興味のある方はアニメでRを始めるのもいいですね。   Analyzing Anime data in R   上には、美しいグラフのスクリプトと解説があります。ただし、英文タイトルを日本語に変えました。     たぶん有料コンテンツですのでMediumを購読されていない方は見えないと思います。ちなみに、月額購読料は$5です。   データ元のアニメサイトは次です。   MyAnimeList   分析に使用したデータは、the Tidy Tuesday initi…

Continue reading

R: tidyverse or data.tableどちらを使いますか?

Tidyverseの出現によってRは易行(いぎょう)になったと思っていて、最近はもっぱらtidyverseを使っています。 でも、ネット上では、tidyverse versus data.tableのようなタイトルを見かけることよくあり、「datata.tableって何?」、「どこがtidyverseより優れてるの?」と思っていました。 調べたところ、大変わかりやすい説明がありました。   Tidy Data: Why It Matters, the data.table Way   それでも、tidyverseをご存知ない方にはわかりにくかと思いますので、少し補足して解説…

Continue reading

R : 国別色付け地図の簡単な描き方, choroplethr

Rのライブラリchoroplethrを使用して、簡単に、特定の国に色をつけること、および、任意の国に別々の数値を指定して色に濃淡をつける方法を紹介します。全般的な解説ではありません。   参考:https://cran.r-project.org/web/packages/choroplethr/choroplethr.pdf   I.国名リスト   172国のリストを次に作成しました。G20加盟国を示す列を含んでいます。   https://pastebin.com/raw/1qMAbSQ9     サンプルの世界各国の人口に基づく…

Continue reading

R: 地図を描きたくなるとき, choroplethr

I.地図で地域別に色をつける   1.特定の国に色をつける。   a.例えば、G20のメンバー。     b.例えば、歴史的会談。     2.数値によって色を変える   Choroplethマップの本来の使い方です。   a.例えば、日本の県別人口     b.例えば、ズーム     c.例えば、留学生の出身国の人数の多寡(たか)を表現     II.さらに、こんなことがしたい   Iは、Rのchoroplethrで比較的簡単にできます。その解…

Continue reading

R: 簡単にChoroplethマップを描く, choroplethr ver. 3

目標は日本の将来の人口推計を利用して都道府県別コロプレス地図を描くことです。Rのライブラリchoroplethrを使用するのが簡単そうです。   https://cran.r-project.org/web/packages/choroplethr/choroplethr.pdf   I.choroplethrの紹介   マップをshapeファイルから作成するのは手間がかかります。Rのライブラリchoroplethrなら簡単にマップを描くことができます。   Providing ready-made functions for creating chor…

Continue reading

R: tidyverseの紹介, tidyverse, heaven

Rをこれから学ぶなら、ライブラリtidyverseからはじめるのがおすすめです。たぶん、Pythonからはじめるよりわかりやすいと思います。 Tidyverseの紹介がMediumに掲載されましたので、私見を交えて紹介します。   Using tidyverse tools with Pew Research Center survey data in R   I.Tidyverseとは   Hadley Wickham (Wikipedia) Tidyverse は、統一した思想のもとに複数のライブラリをまとめた“umbrella-package”で、Hadle…

Continue reading

R: 歌詞の感情分析, R, spotifyr, Spotify, Genius

Spotifyを使っていませんので、APIを使用することはできないのですが、Spotifyの音楽情報を用いた興味深い分析がありましたので紹介します。   Simran Vatsa, tayloR   Rのライブラリspotifyrで曲の関連情報を取得し、歌詞解説サイトGeniusで取得した歌詞情報を加えて、分析しています。   I.歌詞の感情分析   歌詞と関連情報をSimran Vatsa氏がまとめた次のデータを用います。   https://raw.githubusercontent.com/simranvatsa/tayloR/…

Continue reading

Lecture: 小テスト「次は表か裏か?」の結果の集計, R, Google Sheets

I.課題   前回実施した小テストの結果を集計し、次のグラフを作成してください。グラフはIIに示したスクリプトによりRで作成したものですが、授業ではExcelで作成してください。   試験結果のデータは次にあります。   https://pastebin.com/raw/nDqkXGLH   質問文は次です。     II.Rのスクリプトのサンプル   tidyverseを用いると、集計部分は#count()の次の行から3行だけです。   # install a package install.packages(“…

Continue reading

R: データを様子を調べる, inspectdf ver. 2

データフレームの様子を調べるのは、tibbleならデータを表示するだけで、行数や列数、列データの種類がわかります。参考に下で扱うtibbleデータを示します。     さらに、str()で構造を示すことができます。     しかし、データの様子をもっとわかやすい表やグラフにするライブラリがinspectdfです。次の文書にしたがってその概要を紹介します。   Part 2: Simple EDA in R with inspectdf   I.inspectdfのインストールとデータの読み込み   tidyverseをインス…

Continue reading

R: わかりやすく美しくかっこいいグラフ, see

Seeは美しいグラフを描くためのライブラリで、easystats projectの一部です。 このプロジェクトについては次のように説明されています。   This project encompasses several packages, devoted for instance to model access or Bayesian analysis, indices of model performance or visualisation.   次にseeの説明があります。   The ‘see’ …

Continue reading