Economy: Libya情報, wbstats ver. 1

リビアの内戦がアフリカ中部のSahel周辺諸国に波及することが懸念されています。   I.Libia周辺地図         II.リビア内戦   UN’s Guterres warns of ‘impact’ on Sahel region from Libya war       III.GDPにおける石油依存   次は、2017年のGDPにおける石油の貢献度の高い上位20国をグラフにしたものです。 石油算出国のリビアは、石油利権を求め内外の激しい利益獲得…

Continue reading

Python&R: RでPythonを使う, rstudio, reticulate ver. 1

Rのライブラリreticulateで直接Pythonのスクリプトを実行できます。RStudioの場合は、File>New File>Python Scriptを選択するだけPythonのスクリプトを書くことができます。 Dictionary を使って簡単な読書リストを作成しましたが、ふつうにPythonがそのまま使用できました。大変便利です。     仮想環境やバージョンの管理などについてはこれから勉強します。解説は次にあります。   https://docs.rstudio.com/tutorials/user/using-python-with-r…

Continue reading

Python: はじめてのdictionary ver. 5

I.Dictionaryって何?   Pythonのdictionaryというと、Pythonの言葉を説明した辞書かなと思いますが、そうではありません。辞書のようなデータの形式のことです。 例えば、英和辞書は、英語の単語と意味がペアになっていて、単語をみつければその意味がわかります。Pythonのdictionaryもkeyとvalueがペアになっていて、keyをみつければvalueがわかります。 「わかったけど、どうしてそんな形にするの?ふつうにExcelのシートのような表にすればいいのに?」と思われるかもしれません。 確かに、英語辞書の単語と意味をペアにして一覧にするならExce…

Continue reading

R: 複数の度数分布を比較表示, see

同じグラフを用いているとあきます。みんなが用いているグラフだと、ちょっと恥ずかしくなります。だれもが、RやPythonで同じグラフを描くとおなじように嫌になるでしょうが、プログラムの場合は、いろいろなグラフがあるのであきません。目的に応じてグラフを選択できます。今回はグラフを描くライブラリseeのお話です。 以前に、コンピュータ英語IIの第14回までの出席率について簡単に分析しました。   Computer English II14回の出席データの分析   次のように学部3と学部4の出席率には差がありました。   学部3 0.952 学部4 0.796 …

Continue reading

R: The New York Times APIで検索し1941年の記事を読む ver. 2

I.The New York Timesを購読しました   通常は週2ドルのところが、1年間だけですが、週0.5ドルです。月に200円程度です。4週ごとの支払いなので、4週で解約することもできます。 以前にNauruについて書きました。   人口1万人あまりの国 Nauruについて   1942年に日本が占領しました。当時、Nauruについてどのような記事が書かれていたかを調べようと思いましたが、ふつうの検索では1970年より前にはさかのぼれないようです。 そこで、The New York TimesのAPIで記事を調べ、The New York Timesのサイ…

Continue reading

Python: 読書リストに現代通貨理論(MMT)を加える ver. 3

これから読む本のリストを作成しています。MMTに関する書籍を追加しました。Pythonの練習もかねて、Pythonのdictionaryを使います。 Dictionaryを使わずにPandasのデータフレームでデータベースを作成する場合は、次に解説があります。   Using the Pandas Data Frame as a Database.   I.MMTはとんでもか?   どれぐらい赤字国債をだせるのか?発行限度に関する一般理論はあるのか?について非常に関心がありました。 これは、いきすぎた自由競争やグローバル化による経済格差を是正する金融政策、財政政策…

Continue reading

Python&R: JSONをデータフレームにする ver. 2

JSONの学習メモです。   I.JSONの便利なところ   JSONは構造をもったデータを保存できます。 構造というのは、階層があるということです。例えば、CIA The World FactbookのAPIがJSON形式で公開されていますが、次のような階層構造になっています。   RのRStudioによる   data0の下に国別にデータがあります。afghanistanとakrotiriの2国の階層の深いところにあるintroductionの文を表示しています。 このデータ全体ををCSVやExcel形式で保存しようとすると、多くのファイルやシートに…

Continue reading

R: The New York Timesが一週間0.5ドルで読める

I.The New York Timesを購読する?   通常は週2ドルのところが、1年間だけですが、週0.5ドルです。月に200円程度ですので購読しようと思います。現在、情報関連で購読しているのはICT系のMediumだけです。月5ドルほどで1年分支払っています。The New York Timesを読み始めたら、その内容についてここにも書きたいと思います。 通常は、テレビ局のサイト、BBC、CNN、Aljazeeraはよく読みますが、新聞の場合は、The Washington Postの無料で読めるのはごくわずかですし、The New York Timesは基本的に読めません。 …

Continue reading

Lecture: 基礎英語IIの出席データで考えるoutliers, python, r ver. 5

授業のデータを下にしていますが、個人が特定されないように、また、わかりやすい集計にするために数値が変えてありますので実際の出席とは異なります。 はずれ値(outlier)を見つけて取り除くことはデータを適切に分析ための前提条件です。 例えば、日常的によく使われている平均はoutliersに非常に弱いです。特別高い、あるいは、特別低い値があると平均値より中央値(median)のほうが「中ぐらいの値」をよく表しますが、これもデータによります。実際、ここで扱うクラスの出席率の中央値は100%となり、あまり役立ちません。 平均値が役立つ数値であるためには、先にoutliersをのぞく必要がああるという…

Continue reading

Lecture: Computer English II14回の出席データの分析, r

Computer EnglishII(全学年対象選択科目)の第14回(全15回)までの授業の出席データの分析です。分析と言っても基本データを要約しただけですが、それでも全体の平均だけではわからない情報を得ることができます。   I.クラス全体の出席   どのような印象でしょうか? 14回までのクラス出席率は次です。    86.3%   次は各回の出席率の推移のグラフです。横軸が授業回数、縦軸が出席率です。     選択科目ですが、出席率が80%をこえているので出席率は高いほうです。しかし、これだけではデータの解釈としては全…

Continue reading