Některé hodnoty v Pythonu jsou iterovatelné (angl. iterable):
obsahují sekvenci jiných hodnot a lze je „projít“ (iterovat) cyklem for
nebo
je převést na seznam.
Už jich známe několik:
>>> list(range(10)) # sekvence čísel
>>> list('ahoj') # řetězec
>>> list(['Ahoj', 'Hello', 'Hei']) # seznam
>>> list((12, 'Sr', True)) # n-tice
Spousta těchto typů umí něco navíc: zjistit jestli obsahují nějaký prvek
(4 in range(10)
), zjistit délku (len([1, 2, 3])
), převést na velká písmena
('abc'.upper()
).
Nic z toho ale není potřeba, aby byl objekt iterovatelný.
Podívejme se na dva dalších iterovatelné objekty: enumerate
a zip
.
Funkce enumerate
vezme nějakou existující sekvenci a očísluje ji:
ve vrácené sekvenci budou dvojice (index, původní hodnota).
Řekněme že máš tento seznam:
trpaslici = ['Prófa', 'Stydlín', 'Dřímal', 'Kejchal', 'Štístko',
'Šmudla', 'Rejpal']
Když na něj použiješ enumerate
, dostaneš objekt enumerate
,
který podobně jako range()
neukáže svůj obsah „rovnou“,
ale můžeš se „do něj“ podívat převedením na seznam.
Uvidíš tak seznam dvojic (číslo, trpaslík):
>>> enumerate(trpaslici)
<enumerate object at 0x7f0db61b29d8>
>>> list(enumerate(trpaslici))
[(0, 'Prófa'), (1, 'Stydlín'), (2, 'Dřímal'), (3, 'Kejchal'), (4, 'Štístko'), (5, 'Šmudla'), (6, 'Rejpal')]
Místo převedení na seznam můžeš přes objekt enumerate
iterovat cyklem for
a pro každou dvojici něco udělat.
Třeba ji hezky vypsat:
for dvojice in enumerate(trpaslici):
# Rozbalení dvojice
index, trpaslik = dvojice
# Vypsání
print(f'Na pozici {index} je {trpaslik}!')
Objekt, který funkce enumerate
vrací, je iterátor dvojic – sekvence,
jejíž prvky jsou dvojice.
„Trpasličí“ cyklus se dá rozepsat takto:
dvojice = 0, 'Prófa' # toto dělá `for`
index, trpaslik = dvojice
print(f'Na pozici {index} je {trpaslik}!')
dvojice = 1, 'Stydlín' # toto dělá `for`
index, trpaslik = dvojice
print(f'Na pozici {index} je {trpaslik}!')
dvojice = 2, 'Dřímal' # toto dělá `for`
index, trpaslik = dvojice
print(f'Na pozici {index} je {trpaslik}!')
# A tak dále
Kdybys to psala ručně, lze to zjednodušit – přiřadit do dvou proměnných
najedno, bez pomocné dvojice
:
index, trpaslik = 0, 'Prófa' # toto by mohl dělat `for`
print(f'Na pozici {index} je {trpaslik}!')
index, trpaslik = 1, 'Stydlín' # toto by mohl dělat `for`
print(f'Na pozici {index} je {trpaslik}!')
index, trpaslik = 2, 'Dřímal' # toto by mohl dělat `for`
print(f'Na pozici {index} je {trpaslik}!')
# A tak dále
A for
tohle ve skutečnosti umí: místo do proměnné dvojice
může přiřadit
rovnou do dvou proměnných index, trpaslik
:
for index, trpaslik in enumerate(trpaslici):
print(f'Na pozici {index} je {trpaslik}!')
Tohle je docela častẙ způsob práce s iterátorem n-tic – máš-li sekvenci,
jejíž prvky jsou n-tice, můžeš jednotlivé součásti n-tice
rozbalit přímo v hlavičce for
cyklu.
Zkus si to! Zkopíruj si tento seznam:
dny = ['Po', 'Út', 'St', 'Čt', 'Pá', 'So', 'Ne']
… a zkus vypsat:
1. Po
2. Út
3. St
4. Čt
5. Pá
6. So
7. Ne
Další iterátor n-tic je funkce zip
, která umí projít dvě sekvence
naráz.
Řekněme že máš seznam věcí a k nim příslušných barev:
veci = ['tráva', 'slunce', 'mrkev', 'řeka']
barvy = ['zelená', 'žluté', 'oranžová', 'modrá']
Kdtyž tyto dva seznamy dáš funkci zip
, dostaneš iterátor který příslušné
hodnoty spáruje.
Bude tedy obsahovat:
for vec, barva in zip(veci, barvy):
print(f"{vec} je {barva}")
Funguje to i pro více sekvencí.
V následujícím případě je výsledný zip
iterátor čtveřic (věc, barva,
místo, číslo):
veci = ['tráva', 'slunce', 'mrkev', 'řeka']
barvy = ['zelená', 'žluté', 'oranžová', 'modrá']
mista = ['na zemi', 'nahoře', 'na talíři', 'za zídkou']
cisla = range(4)
for vec, barva, misto, cislo in zip(veci, barvy, mista, cisla):
print(f"{cislo}. {barva} {vec} je {misto}")
Když si ale vypíšeš samotný objekt zip
, zjistíš že o sobě nic moc neřekne
– podobně jako enumerate
:
>>> zip(veci, barvy, mista, cisla)
<zip object at 0x7f0db61b1f48>
Jak se zip
chová, když dostane seznamy různých délek?
veci = ['tráva', 'slunce', 'mrkev', 'řeka', 'myšlenka', 'spravedlnost']
barvy = ['zelená', 'žluté', 'oranžová', 'modrá']
for vec, barva in zip(veci, barvy):
print(f"{vec} je {barva}")
Občas je potřeba projít všechny záznamy.
Na to slouží funkce zip_longest
z modulu itertools
:
from itertools import zip_longest
for vec, barva in zip_longest(veci, barvy, fillvalue='(nevím)'):
print(f"{vec} je {barva}")
Argument fillvalue
říká, co se doplní za chybějící hodnoty.
Když ho nezadáš, doplní se None
(„nic“, hodnota kterou např. vrací procedury).
To se často používá, když je pro chybějící hodnoty potřeba nějaká
složitější logika:
from itertools import zip_longest
for vec, barva in zip_longest(veci, barvy):
if vec == None:
vec = 'nějaká věc'
if barva == None:
barva = 'bez barvy'
print(f"{vec} je {barva}")