Python&R: クラウドで学ぶはじめてのプログラミング4, グラフを描くver. 5

赤字部分を修正しました。 I.Pythonの場合(ファイル名pythonGraph.ipynb)   私の担当する授業の出席状況のデータでグラフを描きます。データは次にあります。   https://pastebin.com/raw/jdawqqGm   データは、1回から6回までの出席のデータです。ただし、個人を特定できないように学籍番号を通し番号にし、一部データを修正しています。 idは通し番号です。departmentは学部です。yearは学年です。l1(エルイチ)-l6(エルロク)までが授業の回数です。 数字の前にアルファベットをつけたのは、Rでは列名を数…

Continue reading

Python: 読書リストの作成, dictionary ver. 5

これから読む本のリストを作成しています。Pythonの練習もかねて、Pythonのdictionaryを使います。 Dictionaryの中に、本のタイトルをキーとして、その下に各項目名のキーのある入れ子型のdictionaryです。並べ替えや集計は、Pandasでデータフレームに変更して実行します。 たまたま、MediumにPythonの同種のデータベース作成の手順の解説を見つけました。Dictionaryを使わずにPandasで直接データフレームを作成して、データフレームに一件ずつ追加していくやり方です。   Using the Pandas Data Frame as a Da…

Continue reading

Python&R: クラウドで学ぶはじめてのプログラミング5, histogram

現在グラフが消えています。近日修復する予定です。 データが与えられたら、まず、ヒストグラムか散布図を描きます。 今回は、histogram(度数分布グラフ)を取り上げます。histogramはy軸に度数(frequency)、x軸に階級(bins)をとったグラフです。   第4回ヒストグラムを描く   4_1.Python(ファイル名:pythonHistogram)   データの初めの5行を表示する式は次です。()の中に数字を書いて表示する行数を指定することができます。   データ名.head()    histogramを作成する…

Continue reading

Python&R: クラウドで学ぶはじめてのプログラミング3, csv読み込みと頻度のグラフ 改訂版2

第3回CSV読み込みと頻度の棒グラフ   データは次にあります。   https://pastebin.com/raw/5cttnVTx   3_1.Python(ファイル名:pythonCSV)   データフレームとして読み込むためにはPandasが必要です。 CSV(カンマ区切りのデータ)を読み込む式は次です。ダウンロードしたファイルはパス、ネット上のCSVの場合はそのURLを書き込みます。ただし、URLの場合はrawのページです。   pd.read_csv(“データのパスかURL”)    アンケートなので、選ばれた…

Continue reading

Python&R: クラウドで学ぶはじめてのプログラミング2, dataframes 改訂版1

データフレームは、Excelでおなじみのデータの形です。プログラムはいろいろはデータの形を扱いますが、なじみのあるデータフレーム(Excelの表のように行名や列名がある)から学ぶのが実用的です。   第2回データフレームの作成   2_1.Python(ファイル名:pythonPandasSeriesDataframe)   データフレームを作成するいくつか方法がありますが、ここではdictionaryを使います。学生a、b、c、dの第1回目と第2回目のテストの得点を順に書きます。 dictionaryは、key(下の図の[29]では’a’…

Continue reading

Python&R: クラウドで学ぶはじめてのプログラミング1, arithmetics 改訂版1

何を学ぶ   初めてプログラミングを学ぶ方のための解説です。学ぶ言語はPythonとRです。両方同時でも一方だけでも学ぶことができます。 PythonとRで実行したこととをGoogle SheetsとExcel Onlineでも実行します。これらと比較するとプログラミングが理解しやすくなります。 PythonとRは、Microsoft Azure Notebooksを使用します。PythonとR両方を使用でき、ライブラリもインストールすることができるので、両方同時に学ぶのに適しています。 フリーズして作業ができなくなった場合は、Kernel>Change kernelで他のke…

Continue reading

Python: Lamada functionsとList comprehensionとZip ver. 2

Pythonの基本的なスキルを学びます。 Pure Python、つまり、ライブラリを使用せずにできることです。Rだと「ベース」というところですが、Pythonでは、”pure”と呼ぶようです?   次に解説があります。   3 Essential Python Skills for Data Scientists   I.Lambda Functions   ふつう関数はdefで作成しますが、シンプルなものはLambda Functionsで書くと短く表現できます。 次は、2乗する関数と2数を乗じる関数を、それぞれdefで作成す…

Continue reading

Python: データフレームなら、これだけでなんとかなる, Pnadas

一般の人がデータを処理する場合、普通はデータフレームを使います。データフレームというと難しそうですが、Excelの表のように、列名や行名のあるシートです。 PythonやRを学ぶ場合、データフレームからはじめると、身近なデータに応用できるので、実用的です。 Pythonで、ダータフレームを扱うのはPandasです。ここでは、データフレームを扱うのに最低限必要なPandasのスクリプトを学びます。 Azure NotebooksのJupyter Notebookを使用しています。   I.データフレームの作成   ふつうは既存のデータを読み込んで作業するので、初心者が自分でデ…

Continue reading

Python: ロゴのwaffle chartsを作成, pywaffle ver. 1

アイコンを使ったワッフル・チャートを作ります。 Pythonだと、ライブラリpywaffleでFont Awesomeを使って簡単に作成できます。また、Azure Notebooksでも表示できます。   https://github.com/gyli/PyWaffle   Rだと、ライブラリwaffleを使って簡単にできるはずですが、私の場合、Font Awesomeをうまくインストールできなくて、手間取っています。emojiFontを使用して描くことができると思いますが、グラフの表示にshowtextを使っているのでAzure Notebooksでは表示できません、、、…

Continue reading

Python: Webページの表をクリッポードでコピー ver. 1

PythonでWebページのHTMLテーブルをコピーし、Pandasで読み込みます。 もとのデータは次にあります。   https://ceoworld.biz/2019/05/20/richlist/     上をコピーして、次を実行します。   pd.read_clipboard()   下に、PyCharmで実行した画面を示します。たぶん、クラウドではクリップボードからデータの取得はできないと思います。 表の左端のインデクスをみると0−3の4行になっています。また、列名が1から始まっています。 つまり、1行目を列名として取得したため、デー…

Continue reading