GooglSheets&Julia&Python&R: HTMLの表を読み込む ver. 2

I.何をする   コピー&ペーストせずに、Webページの表を読み込みます。 さまざまな解説がありますが、実際にはうまくできなくてコピー&ペーストでやってしまうことも多いのではないでしょうか。 ここでは、実際に使用する際のポイントを紹介します。   II.Wikipediaの表   Webページ   COVID-19 pandemic in Japan   読み取る表: 複雑な(nested)構成 です。     1.Google Sheetsが一番わかりやすい   次の関数で、非常にわかりやすく表示されます…

Continue reading

Lecture: COVID-19のデータを集計, r ver. 2

グラフのidを国名に修正しました。 授業でCOVID−19につて説明するための資料です。   I.データ   COVID-19の包括的な最新データを次で入手できます。RやPythonやJuliaなどによるロード方法も紹介されています。   COVID-19 Data Hub   次のように35の変数があります。   > colnames(x) [1] “id” “date” [3] “tests” “confirmed” [5] “recovered” “deaths” [7] “hosp” “vent” [9] “icu” “popul…

Continue reading

Lecture: ログから各回の「課題」の提出者数を算出

I.何をする?   Moodleでログから「課題」の提出者数を算出する。 私の授業では、毎回Excelのノートを「課題」に提出します。ノートは、授業で指定した内容で、Excelの使い方の学習をかねています。 Moodleでは、各週の「課題」それぞれのページに提出者数が表示されますが、毎回の提出者数の一覧を作成するには、それぞれのページを見てコピーしないければなりません。 手間を省いて、ログによりすべての回のノートの提出者数の一覧を算出します。   II.「課題」提出者人数の算出   1.不十分なやり方   Event.contex列の “ノー…

Continue reading

COVID-19: 東京都のデータを集計, r

授業向けです。   I.課題   下の東京都の感染者数のデータから、次のグラフを作成しなさい。 グラフの作成には、表計算ソフトウェア(Excel (online)、Google Sheets、LibreOffice Calc、Numbers)、Python、Rのどれかを用いてください。   日ごとの感染者数の推移   データ   https://catalog.data.metro.tokyo.lg.jp/dataset/t000010d0000000068/resource/c2d997db-1450-43fa-8037-ebb11ec28d…

Continue reading

R: ネットワーク・トポロジーを学ぶ , igraph ver.3

I: Rのネットワーク・グラフを学ぶ   トポロジーを学ぼうと思った特別の理由はありません。おもしろそうだから、強いていえば、見た目の美しさからです。 先にトポロジーについて書き始めた記事があるのですが、ここに書くのは、Rのネットワークのグラフ化学の方法です。次に非常にわかりやすく書かれた解説があります。   Static and dynamic network visualization with R   解説のとおりのスクリプトで、簡単に次の図を描くことができました。まだ、何もわかりませんが、Königsbergの7つの橋の問題を解いたりできるのでしょうか? …

Continue reading

R: グラフをアニメーションにする, gganimate ver. 2

I.グラフをアニメーションにする   Rで描いたグラフをアニメーションにします。 久しぶりに、gganimateを使用しました。あまりgganimateを使用しなかったのは、ブログにアップするのにGIFアニメーションはサイズが大きく負担になるからです。 しかし、GIFアニメーションを無料で簡単にアップロードできて、サイトに埋め込むことができるGIPHYを知って、GIFアニメーションを気楽に描けるようになりました。   II.作成例   1.東京都の毎日の感染者数の推移   参考にした解説   Tweenr/gganimate with line…

Continue reading

R: 新しいサンプル・データを用いたR入門, dataexploratory, rstudio cloud ver. 1

I.新しいサンプル・データPenguins   データ解析のプログラミングを学ぶとき、機械学習を学ぶとき、もっともよく用いられるサンプルデータは、irisだと思います。Rにirisは同梱されており、”iris”を実行するだけで呼び出すことができます。 これにかわる新しいデータセット”penguin”が下の3っつめの文書に紹介されていましたので、どのようなデータかをDataExplorerで分析します。 インストールせずにRStudioを使えるRStudio cloudを使用しましました。予め登録を必要としますが、登録は無料です。 &nb…

Continue reading

Python: Word cloudの作成, wordcloud ver. 1

I.何をする   Word Cloudは、単語の出現回数を語の大きさで表しがグラフです。作成したいのは次のリンクにあるように、背景画像をいくつかに分けて単語を配置する画像です。 サンプル・スクリプトのままだとエラーになります。修正方法がわかりませんので、基礎から勉強します。   Creating typography using word cloud in python   II.Wardcloudの作成方法   次に解説されています。   Generating WordClouds in Python     サンプル画像…

Continue reading

Lecture: MoodleのログのIPアドレスの都市情報を集計, r, rgeolocate

I.何をする   Moodleのコース登録者のIPアドレスはログに記録されます。 IPアドレスの都市情報をRで集計します。 先に、RとPythonを使う方法を紹介しましたが、Rだけで集計できましたので、ここに解説します。   II.Rによる集計   1.使用するライブラリとデータ   IPアドレスの集計には、rgeolocateを使用します。 IPアドレスのデータベースとして、フリーで提供されているMax Mind databesesのcityレベルのデータを使用します。ダウンロードした.mmdbのファイルをrgeolocateのsystemフォルダに保…

Continue reading