Některé hodnoty v Pythonu jsou iterovatelné (angl. iterable):
obsahují sekvenci jiných hodnot a lze je „projít“ (iterovat) cyklem for
nebo
je převést na seznam.
Už jich známe několik:
>>> list(range(10)) # sekvence čísel
>>> list('ahoj') # řetězec
>>> list(['Ahoj', 'Hello', 'Hei']) # seznam
>>> list((12, 'Sr', True)) # n-tice
Spousta těchto typů umí něco navíc: zjistit jestli obsahují nějaký prvek
(4 in range(10)
), zjistit délku (len([1, 2, 3])
), převést na velká písmena
('abc'.upper()
).
Nic z toho ale není potřeba, aby byl objekt iterovatelný.
Podívejme se na dva další iterovatelné objekty: enumerate
a zip
.
Oba jsou sekvence vytvořené z jiných, jednodušších sekvencí.
Funkce enumerate
vezme nějakou existující sekvenci a očísluje ji:
ve vrácené sekvenci budou dvojice (index, původní hodnota).
Řekněme, že máš tento seznam:
trpaslici = ['Prófa', 'Stydlín', 'Dřímal', 'Kejchal', 'Štístko',
'Šmudla', 'Rejpal']
Když na něj použiješ enumerate
, dostaneš objekt enumerate
,
který podobně jako range()
neukáže svůj obsah rovnou,
ale můžeš se „do něj podívat“ převedením na seznam.
Uvidíš tak seznam dvojic (číslo, trpaslík):
>>> enumerate(trpaslici)
<enumerate object at 0x7f0db61b29d8>
>>> list(enumerate(trpaslici))
[(0, 'Prófa'), (1, 'Stydlín'), (2, 'Dřímal'), (3, 'Kejchal'), (4, 'Štístko'), (5, 'Šmudla'), (6, 'Rejpal')]
Místo převedení na seznam můžeš přes objekt enumerate
iterovat cyklem for
a pro každou dvojici něco udělat.
Třeba ji hezky vypsat:
for dvojice in enumerate(trpaslici):
# Rozbalení dvojice
index, trpaslik = dvojice
# Vypsání
print(f'Na pozici {index} je {trpaslik}!')
Objekt, který funkce enumerate
vrací, je iterátor dvojic – sekvence,
jejíž prvky jsou dvojice.
Sekvence enumerate
toho „umí“ ještě míň než seznam nebo range
.
Nejde z ní ani vybírat prvky, o metodách jako append
ani nemluvě:
>>> enumerate(trpaslici)[3]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'enumerate' object is not subscriptable
Když budeš od sekvence enumerate
chtít něco víc než iterování,
převeď ji na seznam.
Cyklus for
umíš rozepsat: opakuje se v něm nastavení proměnné (které dělá
for
za tebe), pak tělo cyklu, a znovu nastavení proměnné, tělo cyklu atd.
Pro „trpasličí“ cyklus to je:
dvojice = 0, 'Prófa' # nastavení proměnné dělá `for`
index, trpaslik = dvojice
print(f'Na pozici {index} je {trpaslik}!')
dvojice = 1, 'Stydlín' # nastavení proměnné dělá `for`
index, trpaslik = dvojice
print(f'Na pozici {index} je {trpaslik}!')
dvojice = 2, 'Dřímal' # nastavení proměnné dělá `for`
index, trpaslik = dvojice
print(f'Na pozici {index} je {trpaslik}!')
# A tak dále
Kdybys to psala ručně, lze to zjednodušit – přiřadit do dvou proměnných
najednou, bez pomocné proměnné dvojice
:
index, trpaslik = 0, 'Prófa' # nastavení proměnných
print(f'Na pozici {index} je {trpaslik}!')
index, trpaslik = 1, 'Stydlín' # nastavení proměnných
print(f'Na pozici {index} je {trpaslik}!')
index, trpaslik = 2, 'Dřímal' # nastavení proměnných
print(f'Na pozici {index} je {trpaslik}!')
# A tak dále
Cyklus for
tohle ve skutečnosti umí: místo do proměnné dvojice
může
přiřadit rovnou do dvou proměnných index, trpaslik
:
for index, trpaslik in enumerate(trpaslici):
print(f'Na pozici {index} je {trpaslik}!')
Tohle je docela častý způsob práce s iterátorem n-tic – máš-li sekvenci,
jejíž prvky jsou n-tice, můžeš jednotlivé součásti n-tice
rozbalit přímo v hlavičce for
cyklu.
Zkus si to! Zkopíruj si tento seznam:
dny = ['Po', 'Út', 'St', 'Čt', 'Pá', 'So', 'Ne']
… a zkus vypsat:
1. Po
2. Út
3. St
4. Čt
5. Pá
6. So
7. Ne
Další iterátor n-tic je funkce zip
, která umí projít dvě sekvence
naráz.
Řekněme, že máš seznam věcí a druhý seznam, ve kterém jsou barvy těch věcí:
veci = ['tráva', 'slunce', 'mrkev', 'list']
barvy = ['zelená', 'žluté', 'oranžová', 'zelený']
Když na ně zavoláš zip
, dostaneš iterátor, který (podobně jako enumerate
nebo range
) sám od sebe nic neříká:
>>> zip(veci, barvy)
<zip object at 0x7f0db61b1f48>
Po převedení na seznam se ale ukáže seznam odpovídajících si dvojic:
tráva
, zelená
)slunce
, žluté
)mrkev
, oranžová
)>>> list(zip(veci, barvy))
[('tráva', 'zelená'), ('slunce', 'žluté'), ('mrkev', 'oranžová'), ('list', 'zelený')]
Takové dvojice jsou připravené na to, že je rozbalíš v cyklu for
:
for vec, barva in zip(veci, barvy):
print(f"{vec} je {barva}")
Funguje to i pro více sekvencí. V následujícím případě vznikne iterátor čtveřic (věc, barva, místo, číslo):
veci = ['tráva', 'slunce', 'mrkev', 'list']
barvy = ['zelená', 'žluté', 'oranžová', 'zelený']
mista = ['na zemi', 'nahoře', 'na talíři', 'na stromě']
cisla = range(4)
for vec, barva, misto, cislo in zip(veci, barvy, mista, cisla):
print(f"{cislo}. {barva} {vec} je {misto}")
Jak se zip
chová, když dostane seznamy různých délek?
veci = ['tráva', 'slunce', 'mrkev', 'list', 'myšlenka', 'spravedlnost']
barvy = ['zelená', 'žluté', 'oranžová', 'zelený']
for vec, barva in zip(veci, barvy):
print(f"{vec} je {barva}")
Občas je potřeba projít všechny záznamy.
Na to slouží funkce zip_longest
z modulu itertools
:
from itertools import zip_longest
for vec, barva in zip_longest(veci, barvy, fillvalue='(nevím)'):
print(f"{vec} je {barva}")
Pojmenovaný argument fillvalue
říká, co se doplní za chybějící hodnoty.
Když ho nezadáš, doplní se None
(„nic“, hodnota kterou např. vrací procedury).
To se často používá, když je pro chybějící hodnoty potřeba nějaká
složitější logika:
from itertools import zip_longest
for vec, barva in zip_longest(veci, barvy):
if vec == None:
vec = 'nějaká věc'
if barva == None:
barva = 'bez barvy'
print(f"{vec} je {barva}")