V rámci minulé lekce jsem si ukázali možnost opravy dat v jednom sloupci, který byl zřejmě chybný. Pokud ovšem data přicházejí v nějakém formátu, kterému pandas nerozumí, a formát je konzistentní v celém souboru, je možné opravu zajistit už při načtení souboru. Funkce read_csv
má k tomu mnoho možností nastavení.
import pandas as pd
pd.read_csv("static/vaha-vyska.csv")
pd.read_csv("static/vaha-vyska.csv",
sep=";",
decimal=",",
na_values="-",
names=["pohlavi", "vyska", "vaha"]
)
pd.read_csv("static/vaha-vyska.cs")
Je možné zjistit v příkazové řádce příkazem pwd
nebo pomocí modulu os
v Pythonu.
!pwd
import os
os.getcwd()
Cesta k souboru je buď absolutní nebo relativní. Absolutní cesta obsahuje celou cestu od kořene souborového systému až po soubor samotný. Relativní cesta obsahuje cestu od jednoho souboru k druhému. V relativní cestě tečka .
znázorňuje aktuální složku a dvě tečky ..
složku nadřazenou.
/home/hanka/slozka/soubor.txt
C:\Users\Hanka\slozka\soubor.txt
slozka/soubor.txt
./slozka/soubor.txt
../../slozka/soubor.txt
slozka\soubor.txt
..\..\slozka\soubor.txt
os.path.join("složka", "složka", "soubor.csv")
os.path.expanduser("~/slozka/u/me/doma")