Python: 面白そうなグラフを教えてくれるEDA, lux ver. 1

Last Updated on December 26, 2020 by shibatau

I.面白いグラフを推薦してくれる?

 

あるデータについて知りたいことがわかっていれば、その表やグラフを作成すればよいです。

しかし、データの全体的な様子を知りたい時には、それぞれの変数や変数の関係を簡単にグラフを作成するEDAのライブラリを使うと便利です。

PythonにもRにも大変優れたEDAライブラリがあり、簡単に多くのグラフが表示されます。

しかし、グラフがたくさんあれば見いちいち見るのは手間です。

初めから面白いグラフ順に表示されれば楽です。そうしてくれるのがLuxです。

次に使い方が解説されています。

 

Intelligent Visual Data Discovery with Lux — A Python library

 

II.使い方

 

1.準備

 

ターミナルで次を実行します。

 

pip install lux-api
#Jupyter notebookの場合
jupyter nbextension install --py luxwidget
jupyter nbextension enable --py luxwidget
# Jupyter labの場合
jupyter labextension install @jupyter-widgets/jupyterlab-manager
jupyter labextension install luxwidget
 

 

2.Luxがグラフを推薦

 

Pythonで次を実行します。データは、下のURLにある英語と日本語試験結果です。

 

import pandas as pd
import lux
df0 = pd.read_csv('https://pastebin.com/raw/nWkAe1qR')

 

Toggleをクリックすると、Correlation、Distribution、Occurrenceのタブが表示され、次のグラフが作成されます。

相関が強いものから弱いもの正規分布と異なるものから正規分布に近いものの順に並んでいます。

カテゴリカルなデータについては、頻度の棒グラフが作成されます。

 

 

To be continued.

 

About shibatau

I was born and grown up in Kyoto. I studied western philosophy at the University and specialized in analytic philosophy, especially Ludwig Wittgenstein at the postgraduate school. I'm interested in new technology, especially machine learning and have been learning R language for two years and began to learn Python last summer. Listening toParamore, Sia, Amazarashi and MIyuki Nakajima. Favorite movies I've recently seen: "FREEHELD". Favorite actors and actresses: Anthony Hopkins, Denzel Washington, Ellen Page, Meryl Streep, Mia Wasikowska and Robert DeNiro. Favorite books: Fyodor Mikhailovich Dostoyevsky, "The Karamazov Brothers", Shinran, "Lamentations of Divergences". Favorite phrase: Salvation by Faith. Twitter: @shibatau

Leave a Reply

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.