import pandas as pd
from matplotlib import pyplot as plt
%matplotlib inline
data = pd.read_csv("../../pydata/pandas/static/pokemon.csv")
data.head()
Grafy si můžeme nechat vykreslit i pro celý dataset najednou, ale ne vždy je to přehledné.
data.plot();
data.plot.box();
data.plot(subplots=True);
data.plot.box(subplots=True);
data.plot(subplots=True, figsize=(10,10));
data.plot.box(subplots=True, figsize=(10,10));
data.plot(subplots=True, figsize=(15,10), layout=(4,2));
data.plot.box(subplots=True, figsize=(15,10), layout=(2,4));
Do grafů lze libovolně vkládat čáry a další prvky.
fig = plt.figure(figsize=(10,5))
ax = fig.add_subplot()
data.groupby("shape").mean().weight.sort_values().plot.bar(ax=ax);
ax.axhline(y=50, color="red", linestyle="--");
Scatter plot umí najednou zobrazit více než dvě dimenze dat.
data.plot.scatter(
figsize=(15, 15),
x="attack",
y="defense",
marker="h",
color=data.color,
s=data.id,
edgecolor="black",
alpha=0.5,
);
plotly
plotly
je další knihovna na kreslení grafů a její podmnožina express
je umí dělat i interaktivní. Více informací je v dokumentaci.
%pip install plotly
from plotly import express as px
px.scatter(
data,
x="attack",
y="defense",
size="weight",
color=data["shape"],
)
dtale
dtale
je knihovna pro interaktivní práci s tabulkovými daty přímo v notebooku. Může v něčem práci usnadnit, ale pozor na to, že co si naklikáte se nikam neukládá. Více informací je k dispozici na GitHubu.
!python -m pip install dtale
import dtale
dtale.show(data)