R: tidyverseを使えるようになる2/5 ver. 1

II.tidyverseの使い方   次の解説にしたがって、実際のデータを用いて、tidyverseの使用法を学びます。   https://www.analyticsvidhya.com/blog/2019/05/beginner-guide-tidyverse-most-powerful-collection-r-packages-data-science/     Microsoft Azure Notebooksで実行します。クラウドですので、Rのインストールは不要です。 上の解説のデータではなく、自作の試験結果のデータフレームを使用し…

Continue reading

R: tidyverseを実際に使えるようになる1/5

I.まずは整理から   これまで何度かtidyverseについて書きました。ここで、実際に使えるtidyversのスキルを身に付けたいと思います。。 データ・サイエンティストの仕事の705-80%は、集計できるようにデータ整えることだと言われます。データ・サイエンティストでない私にも、それはよくわかります。 大学に勤務していたとき、数年間、在学生の学力試験や留学生の日本語学力試験の集計を担当しました。このブログにも書いていますが、はじめは、スマートフォンのZipGradeというアプリケーションを使いました。   https://www.zipgrade.com/%MCEPA…

Continue reading

R: 項目反応理論(IRT)のライブラリxxIRTの紹介

入学試験が学力判定試験やアンケート、特にビジネスに関わるアンケートや調査に応用できないかと考えて、項目反応理論を実行できるライブラリを探していて、RのxxIRTを見つけました。3年ほどまえに公開され、今年も更新されている新しいライブラリです。   https://github.com/xluo11/xxIRT   REEDMEファイルをざっと読んだところ、非常に詳しく解析できるようで、グラフも豊富です。 項目反応理論の内容も含めて、これから勉強するのですが、インストール方法を解説します。なお、Microsoft Azure Notebooksを使用してインストールしようとし…

Continue reading

R: Excelを捨ててプログラムの世界へ(超初心者向け), azure notebooks ver. 1

はじめてRにふれる方を対象にしています。 日常使いのExcelやスマートフォンの計算アプリの代わりにRを使えるようになります。確かに、ExcelよはRのほうが手間がかかりますが、プログラムの勉強になります。 クラウドを使用しますので、Rのインスールは不要です。   準備   インターネットに接続されているコンピュータ Microsoftのアカウント   I.Microsoft Azure Notebooksの始め方   Microsoft Azure NotebooksはオンラインでRを実行できる環境を提供しています。自由にライブラリをインストールできる…

Continue reading

R: tidyverseで簡単にデータフレームに行を追加

家計簿をRで作成しています。ごく簡単な支出簿なので、既存のデータフレームに新しい支出を足すだけでよいです。tidyverseを使うと簡単にできます。 tibble(データたフレームの一種)を作成し、行を追加する方法を次の解説にしたがって紹介します。   https://tibble.tidyverse.org/reference/add_row.html   ちなみに、tidyverseは複数のライブラリを含む、いわゆるumbrella-packageです。Rを学ぶ場合も、はじめからtidyverseを使うことをお勧めします。   あまりに簡単なので、スクリプトと…

Continue reading

R: ggplot2の拡張ライブラリで美しいグラフを作成, ggforce

Rの標準的なグラフ作成ライブラリggplot2の一般使用目的の拡張ライブラリで、 グラフは、私にはやはり色と形なので、とてもユニークで好きです。   The ggforce Awakens (again)   上の解説の通りで次のグラフが描けます。   1.どういう場合に使うのかわりませんが   library(ggforce) ids <- factor(c(“1.1”, “2.1”, “1.2”, “2.2”, “1.3”, “2.3”)) values <- data.frame( id = ids, value = c(3, 3.1,…

Continue reading

R: Rで描くライン・アート

I.Adam Richesのライン・アート   BBCでAdam Riches氏のラインポートレートが紹介されていました。コンピュータが筆をもっているような描き方です。   Artist Adam Riches: ‘I turned drawing doodles into a career’     II.Rでライン・アート   1.@aschinchonのライン・ポートレート   動画を見ていて、R-bloggerで写真から機械学習でライン・アートを作成するスクリプトが紹介されていたことを思い出しました。 …

Continue reading

R: Waffle チャート

久しぶりWaffleチャートを描こうしたところ、エラーがたくさんでました。ダウンロード版はしばらくさわってなかったこともあって、その対応に半日以上かかりました。RとRstudioもアップデートしました。   https://github.com/hrbrmstr/waffle   Infographic-style charts using the R waffle package   次は、Azure Notebooksで作成しました。Azure Notebooksもstoppedが表示されて使用できませんでした。結局ブラウザのキャッシュを削除することになりまし…

Continue reading

R: アニメ好きが始めるデータ分析 ver. 1

Mediumにアニメのデータの分析が紹介されていました。アニメに興味のある方はアニメでRを始めるのもいいですね。   Analyzing Anime data in R   上には、美しいグラフのスクリプトと解説があります。ただし、英文タイトルを日本語に変えました。     たぶん有料コンテンツですのでMediumを購読されていない方は見えないと思います。ちなみに、月額購読料は$5です。   データ元のアニメサイトは次です。   MyAnimeList   分析に使用したデータは、the Tidy Tuesday initi…

Continue reading

R: tidyverse or data.tableどちらを使いますか?

Tidyverseの出現によってRは易行(いぎょう)になったと思っていて、最近はもっぱらtidyverseを使っています。 でも、ネット上では、tidyverse versus data.tableのようなタイトルを見かけることよくあり、「datata.tableって何?」、「どこがtidyverseより優れてるの?」と思っていました。 調べたところ、大変わかりやすい説明がありました。   Tidy Data: Why It Matters, the data.table Way   それでも、tidyverseをご存知ない方にはわかりにくかと思いますので、少し補足して解説…

Continue reading