Nauč se Python > Kurzy > Datový kurz PyLadies > EDA — více proměnných a vztahy > Feedback k minulé lekci a dotazům

Feedback k minulé lekci a dotazům

In [1]:
import pandas as pd
from matplotlib import pyplot as plt

%matplotlib inline
In [2]:
data = pd.read_csv("../../pydata/pandas/static/pokemon.csv")
In [3]:
data.head()
Out[3]:
id name height weight color shape is baby type 1 type 2 hp attack defense speed
0 1 bulbasaur 0.7 6.9 green quadruped False Grass Poison 45 49 49 45
1 2 ivysaur 1.0 13.0 green quadruped False Grass Poison 60 62 63 60
2 3 venusaur 2.0 100.0 green quadruped False Grass Poison 80 82 83 80
3 4 charmander 0.6 8.5 red upright False Fire NaN 39 52 43 65
4 5 charmeleon 1.1 19.0 red upright False Fire NaN 58 64 58 80

Více grafů najednou a přehledně

Grafy si můžeme nechat vykreslit i pro celý dataset najednou, ale ne vždy je to přehledné.

In [4]:
data.plot();
In [5]:
data.plot.box();
In [6]:
data.plot(subplots=True);
In [7]:
data.plot.box(subplots=True);
In [8]:
data.plot(subplots=True, figsize=(10,10));
In [9]:
data.plot.box(subplots=True, figsize=(10,10));
In [10]:
data.plot(subplots=True, figsize=(15,10), layout=(4,2));
In [11]:
data.plot.box(subplots=True, figsize=(15,10), layout=(2,4));

Čáry v grafech

Do grafů lze libovolně vkládat čáry a další prvky.

In [12]:
fig = plt.figure(figsize=(10,5))
ax = fig.add_subplot()
data.groupby("shape").mean().weight.sort_values().plot.bar(ax=ax);
ax.axhline(y=50, color="red", linestyle="--");

Vylepšený scatter plot

Scatter plot umí najednou zobrazit více než dvě dimenze dat.

In [13]:
data.plot.scatter(
    figsize=(15, 15),
    x="attack",
    y="defense",
    marker="h",
    color=data.color,
    s=data.id,
    edgecolor="black",
    alpha=0.5,
);

Interaktivní grafy a plotly

plotly je další knihovna na kreslení grafů a její podmnožina express je umí dělat i interaktivní. Více informací je v dokumentaci.

In [ ]:
%pip install plotly
In [ ]:
from plotly import express as px
In [ ]:
px.scatter(
    data,
    x="attack",
    y="defense",
    size="weight",
    color=data["shape"],
)

Interaktivní prohlídka dat a dtale

dtale je knihovna pro interaktivní práci s tabulkovými daty přímo v notebooku. Může v něčem práci usnadnit, ale pozor na to, že co si naklikáte se nikam neukládá. Více informací je k dispozici na GitHubu.

In [ ]:
!python -m pip install dtale
In [ ]:
import dtale
In [ ]:
dtale.show(data)

Toto je stránka lekce z kurzu, který probíhá nebo proběhl naživo s instruktorem.