Verzamelingenleer

Efficiënte Python-code schrijven

Logan Thomas

Scientific Software Technical Trainer, Enthought

Verzamelingenleer

  • Tak van de wiskunde voor verzamelingen van objecten
    • d.w.z. sets
  • Python heeft een ingebouwd set-datatype met methoden:
    • intersection(): elementen die in beide sets zitten
    • difference(): elementen in de ene set maar niet de andere
    • symmetric_difference(): elementen in precies één set
    • union(): alle elementen die in een van beide sets zitten
  • Snelle lidmaatschapstest
    • Check of een waarde in een sequentie staat
    • Met de in-operator
Efficiënte Python-code schrijven

Objecten vergelijken met loops

list_a = ['Bulbasaur', 'Charmander', 'Squirtle']
list_b = ['Caterpie', 'Pidgey', 'Squirtle']

alt=”De Pokémon Bulbasaur, Charmander en Squirtle in een kader met titel List A en de Pokémon Caterpie, Pidgey en Squirtle in een apart kader met titel List B”

Efficiënte Python-code schrijven

Objecten vergelijken met loops

list_a = ['Bulbasaur', 'Charmander', 'Squirtle']
list_b = ['Caterpie', 'Pidgey', 'Squirtle'] 

alt=”De Pokémon Bulbasaur, Charmander en Squirtle in een kader met titel List A en de Pokémon Caterpie, Pidgey en Squirtle in een apart kader met titel List B; Squirtle is in beide kaders omcirkeld”

Efficiënte Python-code schrijven
list_a = ['Bulbasaur', 'Charmander', 'Squirtle']
list_b = ['Caterpie', 'Pidgey', 'Squirtle'] 
in_common = []

for pokemon_a in list_a:
    for pokemon_b in list_b:
        if pokemon_a == pokemon_b:
            in_common.append(pokemon_a)

print(in_common)
['Squirtle']
Efficiënte Python-code schrijven
list_a = ['Bulbasaur', 'Charmander', 'Squirtle']
list_b = ['Caterpie', 'Pidgey', 'Squirtle'] 
set_a = set(list_a)
print(set_a)
{'Bulbasaur', 'Charmander', 'Squirtle'}
set_b = set(list_b)
print(set_b)
{'Caterpie', 'Pidgey', 'Squirtle'}
set_a.intersection(set_b)
{'Squirtle'}
Efficiënte Python-code schrijven

Winst in efficiëntie met verzamelingen

%%timeit
in_common = []

for pokemon_a in list_a:
    for pokemon_b in list_b:
        if pokemon_a == pokemon_b:
            in_common.append(pokemon_a)
601 ns ± 17.1 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
%timeit in_common = set_a.intersection(set_b)
137 ns ± 3.01 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)
Efficiënte Python-code schrijven

Setmethode: difference

set_a = {'Bulbasaur', 'Charmander', 'Squirtle'}
set_b = {'Caterpie', 'Pidgey', 'Squirtle'}
set_a.difference(set_b)
{'Bulbasaur', 'Charmander'}

alt=”De Pokémon Bulbasaur, Charmander en Squirtle in een kader met titel Set A en de Pokémon Caterpie, Pidgey en Squirtle in een apart kader met titel Set B; Bulbasaur en Charmander zijn omcirkeld in Set A”

Efficiënte Python-code schrijven

Setmethode: difference

set_a = {'Bulbasaur', 'Charmander', 'Squirtle'}
set_b = {'Caterpie', 'Pidgey', 'Squirtle'}
set_b.difference(set_a)
{'Caterpie', 'Pidgey'}

alt=”De Pokémon Bulbasaur, Charmander en Squirtle in een kader met titel Set A en de Pokémon Caterpie, Pidgey en Squirtle in een apart kader met titel Set B; Caterpie en Pidgey zijn omcirkeld in Set B”

Efficiënte Python-code schrijven

Setmethode: symmetric_difference

set_a = {'Bulbasaur', 'Charmander', 'Squirtle'}
set_b = {'Caterpie', 'Pidgey', 'Squirtle'}
set_a.symmetric_difference(set_b)
{'Bulbasaur', 'Caterpie', 'Charmander', 'Pidgey'}

alt=”De Pokémon Bulbasaur, Charmander en Squirtle in een kader met titel Set A en de Pokémon Caterpie, Pidgey en Squirtle in een apart kader met titel Set B; Bulbasaur, Charmander, Caterpie en Pidgey zijn omcirkeld”

Efficiënte Python-code schrijven

Setmethode: union

set_a = {'Bulbasaur', 'Charmander', 'Squirtle'}
set_b = {'Caterpie', 'Pidgey', 'Squirtle'}
set_a.union(set_b)
{'Bulbasaur', 'Caterpie', 'Charmander', 'Pidgey', 'Squirtle'}

alt=”De Pokémon Bulbasaur, Charmander en Squirtle in een kader met titel Set A en de Pokémon Caterpie, Pidgey en Squirtle in een apart kader met titel Set B; Alle Pokémon zijn omcirkeld en Squirtle slechts één keer”

Efficiënte Python-code schrijven

Lidmaatschap testen met sets

# Dezelfde 720 totale Pokémon in elke datastructuur
names_list  = ['Abomasnow', 'Abra', 'Absol', ...]
names_tuple = ('Abomasnow', 'Abra', 'Absol', ...)
names_set   = {'Abomasnow', 'Abra', 'Absol', ...}

alt=”De Pokémon Abomasnow, Abra en Absol in drie aparte kaders met respectievelijk de titels List, Tuple en Set”

Efficiënte Python-code schrijven

Lidmaatschap testen met sets

# Dezelfde 720 totale Pokémon in elke datastructuur
names_list  = ['Abomasnow', 'Abra', 'Absol', ...]
names_tuple = ('Abomasnow', 'Abra', 'Absol', ...)
names_set   = {'Abomasnow', 'Abra', 'Absol', ...}

alt=”De Pokémon Abomasnow, Abra en Absol in drie aparte kaders met respectievelijk de titels List, Tuple en Set; de Pokémon Zubat met een lijn naar elk kader als lidmaatschapstest”

Efficiënte Python-code schrijven
names_list  = ['Abomasnow', 'Abra', 'Absol', ...]
names_tuple = ('Abomasnow', 'Abra', 'Absol', ...)
names_set   = {'Abomasnow', 'Abra', 'Absol', ...}
%timeit 'Zubat' in names_list
7.63 µs ± 211 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
%timeit 'Zubat' in names_tuple
7.6 µs ± 394 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
%timeit 'Zubat' in names_set
37.5 ns ± 1.37 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)
Efficiënte Python-code schrijven

Unieke waarden met sets

# 720 primaire Pokémon-typen, één per Pokémon
primary_types = ['Grass', 'Psychic', 'Dark', 'Bug', ...]
unique_types = []

for prim_type in primary_types:
    if prim_type not in unique_types:
        unique_types.append(prim_type)

print(unique_types)
['Grass', 'Psychic', 'Dark', 'Bug', 'Steel', 'Rock', 'Normal',
 'Water', 'Dragon', 'Electric', 'Poison', 'Fire', 'Fairy', 'Ice',
 'Ground', 'Ghost', 'Fighting', 'Flying']
Efficiënte Python-code schrijven

Unieke waarden met sets

# 720 primaire Pokémon-typen, één per Pokémon
primary_types = ['Grass', 'Psychic', 'Dark', 'Bug', ...]
unique_types_set = set(primary_types)
print(unique_types_set)
{'Grass', 'Psychic', 'Dark', 'Bug', 'Steel', 'Rock', 'Normal',
 'Water', 'Dragon', 'Electric', 'Poison', 'Fire', 'Fairy', 'Ice',
 'Ground', 'Ghost', 'Fighting', 'Flying'}
Efficiënte Python-code schrijven

Laten we verzamelingen oefenen!

Efficiënte Python-code schrijven

Preparing Video For Download...