Python&R: コンピュータ英語IIのPython入門, Google Chrome ver. 9

コンピュータ英語IIのアンケートでPythonに関心がある学生が比較的多かったので、毎回30分ほどPythonを教えます。やってみて、うけなかったら中断します

Pythonに関心のない学生にも興味を持てるように、同じことをExcelでもやります。このブログでは、さらに、同じことをRとGoogle Chromeでも算出します。

毎回30分で、休む学生もおり、毎回復習しながらになりますので、広い、あるいは、深い内容にはなりませんが、目標は:

 

  • Pythonに関心のある学生は、自分で学習できるようになる。
  • Pythonに関心のない学生は、Rを学ぶ。
  • PythonにもRにも関心のない学生は、Google Chromeを学ぶ。
  • PythonにもRにもGoogle Chromeにも関心のない学生は、Excelを学ぶ。
  • PythonにもRにもGoogle ChromeにもExcelにも関心のない学生は、プログラムやコンピュータにかかわる英語を学ぶ。

 

Microsoft Azure Notebooksを使用します。学生はOffice365を使っているのですでに登録済みです。

Microsoft Azure Notebooksの使用法は次に書きました。ただし、Rの場合についての説明です。Notebookの作成でRを選ばす、Python 3.6を選んでください。プロジェクト名、ファイル名に「Python」を入れてください。ファイル名だけでは、PythonかRかわからなくなるのを避けるためです。

 

R: Excelを捨ててプログラムの世界へ(超初心者向け)

 

教える内容は:

 

  1. データフレーム(Pandas)が中心です。
  2. 平均や偏差、相関係数などの説明を通して統計の考え方を学びます。
  3. 実際に使えるスクリプトを学びます。
  4. Pythonと同じことをExcelでもやります。
  5. Pythonでどのようなことができるかを紹介します。
  6. 公開します。Pythonに対応するRのスクリプトも掲載します:https://notebooks.azure.com/shibata/projects/pythonbasics

現在、上のリンク先のページのファイル名をクリックするとスクリプトは見えますがページがいたんでおり、グラフは見えません。原因は不明で、今の所様子を見ています。

 

参考:

 

Cheat sheet for Python dataframe ↔ R dataframe syntax conversions

 

第1回シンプルな計算

 

1_1.Python

 

ファイル名:pythonArithmetics.ipynb

 

単純な計算ならライブラリをインストールしなくてもよいですし、数式はわかるので、はじめてのPythonは、やはり、計算からはじめるのがよいのでは?

 

 

1_2.R

 

ファイル名:rArithmetics.ipynb

 

 

1_3.Google Chrome

 

 

1_4.Excel Online

 

Google Sheetsと同じなので省略。

 

第2回データフレームの作成

 

2_1.Python

 

ファイル名:pythonPandasSeriesDataframe.ipynb

 

一般の人がPythonを使うとすれば、データフレーム(Excelの表)だと思います。はじめは面倒かも知れませんが、慣れればExcelがわりに使えます。

データフレーム(Excelの表)を作成するのは、いくつか方法がありますが、ここではdictionaryを使います。データをobservationごと、この場合は、学生一人一人の第1回目と第2回目の得点を順に書けばよいのでわかりやすいです。

dictionaryはデータの形式でkey(下の図の[29]では’a’, ‘b’, ‘c’, ‘d’)とvalue([]の中の数値)からなっており、キーで値を呼び出すことができます。

キーをindexとしてデータフレームを作成しています。Pythonでは行名をindexと呼びます。

 

 

2_2.R

 

ファイル名:rDataframe

 

 

2_3.Google Sheets

 

Add-onのXLMiner Analysis ToolPak(Free)をインストールすると、次のようにデータを要約できます。

 

 

2_4.Excel

 

分析ツールでデータを要約できますが、私はExcel Onlineを使っており、Excel Onlineには分析ツールはありませんので、関数で計算します。

 

 

第3回CSV読み込みと頻度と棒グラフ

 

3_1.Python

 

使用するファイル名:pythonCSV.ipynb

 

CSV(カンマ区切り)を読み込む式は次です。ダウンロードしファイルはパス、ネット上のCSVの場合はそのURL。ただし、URLの場合はrawでなければなりません。

 

pd.read_csv("https://pastebin.com/raw/CQgAJ8x3") 

 

アンケートの場合は、選ばれた選択肢の頻度(frequency)をもとにグラフを描きます。frequencyを計算する式は次です。

 

データの列名.value_counts() 

 

 

3_2.R

 

Rの場合のファイル名:rCSV

 

 

3_3.Google Sheets

 

さっとできれば、Google Sheetsを実際に使えるレベルに達していると思います。

unique()で選ばれた選択肢一覧を作成します。

countif(範囲,”アプリの名”)で出現回数を数えます。

コピーして値で貼り付けてグラフを作成します。コピーしなくてもできるかもしれませんが、今の所やり方がわかりません。

 

 

3_4.Excel

 

さっとできれば、Excelを実際に使えるレベルに達していると思います。

フィルターで重複行を削除します。

他の式はGoogle Sheetsに同じです。

 

 

第4回ヒストグラム(度数分布図)を描く

 

 

続く

Please follow and like us:
error

About shibatau

I was born and grown up in Kyoto. I studied western philosophy at the University and specialized in analytic philosophy, especially Ludwig Wittgenstein at the postgraduate school. I'm interested in new technology, especially machine learning and have been learning R language for two years and began to learn Python last summer. Listening toParamore, Sia, Amazarashi and MIyuki Nakajima. Favorite movies I've recently seen: "FREEHELD". Favorite actors and actresses: Anthony Hopkins, Denzel Washington, Ellen Page, Meryl Streep, Mia Wasikowska and Robert DeNiro. Favorite books: Fyodor Mikhailovich Dostoyevsky, "The Karamazov Brothers", Shinran, "Lamentations of Divergences". Favorite phrase: Salvation by Faith. Twitter: @shibatau

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.