Nauč se Python > Kurzy > Začátečnický kurz PyLadies > Slovníky > Iterátory n-tic

Iterátory n-tic

Některé hodnoty v Pythonu jsou iterovatelné (angl. iterable): obsahují sekvenci jiných hodnot a lze je „projít“ (iterovat) cyklem for nebo je převést na seznam. Už jich známe několik:

>>> list(range(10))                 # sekvence čísel
>>> list('ahoj')                    # řetězec
>>> list(['Ahoj', 'Hello', 'Hei'])  # seznam
>>> list((12, 'Sr', True))          # n-tice

Spousta těchto typů umí něco navíc: zjistit jestli obsahují nějaký prvek (4 in range(10)), zjistit délku (len([1, 2, 3])), převést na velká písmena ('abc'.upper()). Nic z toho ale není potřeba, aby byl objekt iterovatelný.

Podívejme se na dva další iterovatelné objekty: enumerate a zip.

Enumerate: očíslování sekvence

Funkce enumerate vezme nějakou existující sekvenci a očísluje ji: ve vrácené sekvenci budou dvojice (index, původní hodnota).

Řekněme že máš tento seznam:

trpaslici = ['Prófa', 'Stydlín', 'Dřímal', 'Kejchal', 'Štístko',
             'Šmudla', 'Rejpal']

Když na něj použiješ enumerate, dostaneš objekt enumerate, který podobně jako range() neukáže svůj obsah rovnou, ale můžeš se „do něj podívat“ převedením na seznam. Uvidíš tak seznam dvojic (číslo, trpaslík):

>>> enumerate(trpaslici)
<enumerate object at 0x7f0db61b29d8>
>>> list(enumerate(trpaslici))
[(0, 'Prófa'), (1, 'Stydlín'), (2, 'Dřímal'), (3, 'Kejchal'), (4, 'Štístko'), (5, 'Šmudla'), (6, 'Rejpal')]

Místo převedení na seznam můžeš přes objekt enumerate iterovat cyklem for a pro každou dvojici něco udělat. Třeba ji hezky vypsat:

for dvojice in enumerate(trpaslici):
    # Rozbalení dvojice
    index, trpaslik = dvojice
    # Vypsání
    print(f'Na pozici {index} je {trpaslik}!')

Objekt, který funkce enumerate vrací, je iterátor dvojic – sekvence, jejíž prvky jsou dvojice.

Rozbalování v cyklu for

Cyklus for umíme rozepsat: opakuje se v něm nastavení proměnné (které dělá for za tebe), pak tělo cyklu, a znovu nastavení proměnné, tělo cyklu, atd. Pro „trpasličí“ cyklus to je:

dvojice = 0, 'Prófa'    # nastavení proměnné dělá `for`
index, trpaslik = dvojice
print(f'Na pozici {index} je {trpaslik}!')

dvojice = 1, 'Stydlín'  # nastavení proměnné dělá `for`
index, trpaslik = dvojice
print(f'Na pozici {index} je {trpaslik}!')

dvojice = 2, 'Dřímal'   # nastavení proměnné dělá `for`
index, trpaslik = dvojice
print(f'Na pozici {index} je {trpaslik}!')

# A tak dále

Kdybys to psala ručně, lze to zjednodušit – přiřadit do dvou proměnných najednou, bez pomocné proměnné dvojice:

index, trpaslik = 0, 'Prófa'    # nastavení proměnných
print(f'Na pozici {index} je {trpaslik}!')

index, trpaslik = 1, 'Stydlín'  # nastavení proměnných
print(f'Na pozici {index} je {trpaslik}!')

index, trpaslik = 2, 'Dřímal'   # nastavení proměnných
print(f'Na pozici {index} je {trpaslik}!')

# A tak dále

Cyklus for tohle ve skutečnosti umí: místo do proměnné dvojice může přiřadit rovnou do dvou proměnných index, trpaslik:

for index, trpaslik in enumerate(trpaslici):
    print(f'Na pozici {index} je {trpaslik}!')

Tohle je docela častẙ způsob práce s iterátorem n-tic – máš-li sekvenci, jejíž prvky jsou n-tice, můžeš jednotlivé součásti n-tice rozbalit přímo v hlavičce for cyklu.

Zkus si to! Zkopíruj si tento seznam:

dny = ['Po', 'Út', 'St', 'Čt', 'Pá', 'So', 'Ne']

… a zkus vypsat:

1. Po
2. Út
3. St
4. Čt
5. Pá
6. So
7. Ne

Řešení

Zip: Víc iterací najednou

Další iterátor n-tic je funkce zip, která umí projít dvě sekvence naráz.

Řekněme že máš seznam věcí a k nim příslušných barev:

veci = ['tráva', 'slunce', 'mrkev', 'řeka']
barvy = ['zelená', 'žluté', 'oranžová', 'modrá']

Když na ně zavoláš zip, dostaneš iterátor, který (podobně jako enumerate nebo range) sám od sebe nic neříká:

>>> zip(veci, barvy)
<zip object at 0x7f0db61b1f48>

Po převedení na seznam se ale ukáže seznam odpovídajících si dvojic:

  • Dvojice prvních prvků obou seznamů: (tráva, zelená)
  • Dvojice druhých prvků obou seznamů: (slunce, žluté)
  • Dvojice třetích prvků obou seznamů: (mrkev, oranžová)
  • A tak dál…
>>> list(zip(veci, barvy))
[('tráva', 'zelená'), ('slunce', 'žluté'), ('mrkev', 'oranžová'), ('řeka', 'modrá')]

Takové dvojice jsou připravené na to, že je rozbalíš v cyklu for:

for vec, barva in zip(veci, barvy):
    print(f"{vec} je {barva}")

Funguje to i pro více sekvencí. V následujícím případě vznikne iterátor čtveřic (věc, barva, místo, číslo):

veci = ['tráva', 'slunce', 'mrkev', 'řeka']
barvy = ['zelená', 'žluté', 'oranžová', 'modrá']
mista = ['na zemi', 'nahoře', 'na talíři', 'za zídkou']
cisla = range(4)

for vec, barva, misto, cislo in zip(veci, barvy, mista, cisla):
    print(f"{cislo}. {barva} {vec} je {misto}")

Zip Longest: Pro ty co chtějí všechno

Jak se zip chová, když dostane seznamy různých délek?

veci = ['tráva', 'slunce', 'mrkev', 'řeka', 'myšlenka', 'spravedlnost']
barvy = ['zelená', 'žluté', 'oranžová', 'modrá']
for vec, barva in zip(veci, barvy):
    print(f"{vec} je {barva}")

Řešení

Občas je potřeba projít všechny záznamy. Na to slouží funkce zip_longest z modulu itertools:

from itertools import zip_longest
for vec, barva in zip_longest(veci, barvy, fillvalue='(nevím)'):
    print(f"{vec} je {barva}")

Pojmenovaný argument fillvalue říká, co se doplní za chybějící hodnoty. Když ho nezadáš, doplní se None („nic“, hodnota kterou např. vrací procedury). To se často používá, když je pro chybějící hodnoty potřeba nějaká složitější logika:

from itertools import zip_longest
for vec, barva in zip_longest(veci, barvy):
    if vec == None:
        vec = 'nějaká věc'
    if barva == None:
        barva = 'bez barvy'
    print(f"{vec} je {barva}")

Toto je stránka lekce z kurzu, který probíhá nebo proběhl naživo s instruktorem. Přejít na stejnou lekci v kurzu pro samouky.