Statistics: T-valuesとP-valuesを学ぶ, r ver. 3

赤字部分を追加しました。 I. 何を学ぶ   統計のレポートには、t値やp値が書かれていて、統計学を学んだことがないと読み飛ばしてしまいますが、これらの意味は意外に簡単です。簡単なサンプルで説明します。   II.サンプル   次に解説にしたがい、Rのサンプルデータでt値とp値を集計します。   How to Do a T-test in R: Calculation and Reporting   データ   10匹のネズミの体重のデータです。     name weight 1 M_1 18.9 2 M_2 1…

Continue reading

R: 写真をスケッチに, sketcher, krita ver. 2

I.何をする?   Rのsketcherで、写真をスケッチにします。パラメータで細かくコントロールできて、非常によい結果が得られます。   Hiroyuki Tsuda, Sketcher: An R package for photo to sketch effects   II.スケッチの作成   スクリプト   library(sketcher) im2 <- im_load(“https://upload.wikimedia.org/wikipedia/commons/6/6d/Shinz%C5%8D_Abe_Offic…

Continue reading

R: COVID-19に関心があるなら、はじめてのプログラミングはRでしょう ver. 5

リンクの誤りを修正し、赤字部分を追加しました。 I.はじめてのプログラミングにRを選ぶ理由   1.プログラムの学びかた   プログラムを学び始めたがなかなか進まない、途中であきらめてしまった、という方も多いのではないでしょうか。 プログラミングを「独学」する場合は、興味のもてないデータでの作業はつらいものです。ですが、関心のあるデータであれば、がんばれます。 COVID-19のデータやグラフに関心があるなら、Rでプログラミングをはじめることをお勧めします。   2.PythonよりR?   Pythonはなんでもできる汎用言語で、統計も得意です。しかし…

Continue reading

R: COVID-19のライブラリー_初心者向け ver. 2

赤字部分を追加しました。 I.COVID-19のライブラリー   Rでは、ライブラリをCRANで公開されています。どのようなライブラリがあるかは、RStudioで次のように簡単に調べられます。     II.covid19italy   イタリアのデータです。次に使い方が説明されています。   https://github.com/Covid19R/covid19italy   データの最終日を確認   #ライブラリのインストール # install.packages(“covid19italy”) # ライブラリのインポー…

Continue reading

R: Rではじめにつまずくfactorsを学ぶ ver. 1

I.カテゴリカルなデータ   Rを学び始めたころfactorsに悩まされました。ベースで学んでいたので、集計をするとデータの形式が変わることが多く、factorsにかかわりよくエラーになりました。 Factorsはcategoricalなデータのタイプで、例えば、政治的立場の進歩派と保守派、あるいは、血液型のA, B, AB , Oなどはfactorsとして扱います。 一般に、データはCategoricalなものとNumeralなものとに別れますが、次に図で示すように、さらにそれぞれNominalとOrdinal、DiscreteとContinuousに別れます。   &n…

Continue reading

R: 米国の人々は何を恐れているか?PDFのテーブルを読み取る, tabulizer

I.PDFの表を読み取る   8月6日の広島の原爆記念日にThe New York Timesに社説で原爆を取り上げ、米国の人々が原爆の脅威をあまり感じていないことに懸念を表明しました。   The World Can Still Be Destroyed in a Flash   米国の人々が何を恐れているかについては、Chapman Universityが毎年調査しPDFで公表しています。   https://www.chapman.edu/wilkinson/research-centers/babbie-center/_files/america…

Continue reading

Python&R&Julia: COVID-19のデータでスクリプトを覚える ver. 10

I.COVID-19の集計   簡単な集計をするにしてもグラフを描くにしても、RのTidyverseならだいたいできますが、PythonやJuliaはスクリプトを覚えていないので、いちいち調べなければならずめんどうです。 そこで、手書きでCOVID-19の最新データの集計を繰り返し、それぞれのスクリプトを暗記しようと思います。 次の項目のスクリプトを書きます。   1.世界   1_1.世界の感染者数と死亡者数の推移 1_2.感染者上位10ヵ国 1_3死亡者上位10ヵ国   2.選んだ国   2_1.選択した国の直近の感染者数 2_2.選択した…

Continue reading

Lecture: ベーシックインカムのグラフを作成, R

下記のページを参考にさせていただき、Rでベーシックインカムの所得モデルを描きました。   生活保護制度とベーシックインカムと負の所得税の違い   グラフを描いて、多角形やテキストをx軸、y軸で指定して重ねて描きます。 プロットに日本語を表示していますが、Macの場合は人後を表示するのに下の行を加える必要があります。   par(family=”HiraKakuProN-W3″)   I.スクリプト   # ベーシックインカム # 枠を作成 plot(NA, xlim = c(0, 80), ylim = c(0, 80)…

Continue reading

Statistics: どこまで信じる平均と相関係数と偏差値? 2/3 ver. 2

V.Anscombe’s quartet   要約統計量では適切に表現できないデータの極端な例を紹介します。   1.平均、標準偏差、相関係数を算出   Anscombe’s qurtetは、Rのサンプル・データに含まれています。x1とy1、x2とy2、x3とy3、x4とy4とがセットです。     それぞれのxとyの平均と標準偏差と相関係数を算出します。みやすい一覧にするのに、ライブラリTmiscをインポートして集計します。   スクリプト   library(Tmisc) data(quartet…

Continue reading

Statistics: どこまで信じる平均と相関係数と偏差値? 3/3 ver. 1

VII.標準偏差とZ   偏差値は平均を50とし、標準偏差を10したものです。偏差値はデータが正規分布する場合にデータを適切に表現します。 一般に、学力や身長などは正規分布するとされていますので、学力試験に偏差値を用いることは適切ですが、学力を適切に測定できない問題であったり、得点が正規分布せずいちじるしくかたよっている場合には、偏差値を用いるべきではありません。 偏差値(T Scores)と標準偏差(Standard Deviations)とZスコアとは基本的には同じもので表現が違うだけです。3者の数値の関係は次のようになります。   https://ja.wikiped…

Continue reading