Teoria de conjuntos

Escrevendo código Python eficiente

Logan Thomas

Scientific Software Technical Trainer, Enthought

Teoria de conjuntos

  • Ramo da Matemática aplicado a coleções de objetos
    • ou seja, sets
  • Python tem o tipo embutido set com métodos:
    • intersection(): elementos em ambos os conjuntos
    • difference(): elementos em um conjunto mas não no outro
    • symmetric_difference(): elementos em exatamente um conjunto
    • union(): elementos que estão em qualquer um dos conjuntos
  • Teste rápido de pertencimento
    • Verifique se um valor existe em uma sequência
    • Usando o operador in
Escrevendo código Python eficiente

Comparando objetos com loops

list_a = ['Bulbasaur', 'Charmander', 'Squirtle']
list_b = ['Caterpie', 'Pidgey', 'Squirtle']

alt=”Os Pokémon Bulbasaur, Charmander e Squirtle em uma caixa chamada Lista A e os Pokémon Caterpie, Pidgey e Squirtle em outra caixa chamada Lista B”

Escrevendo código Python eficiente

Comparando objetos com loops

list_a = ['Bulbasaur', 'Charmander', 'Squirtle']
list_b = ['Caterpie', 'Pidgey', 'Squirtle'] 

alt=”Os Pokémon Bulbasaur, Charmander e Squirtle em uma caixa chamada Lista A e os Pokémon Caterpie, Pidgey e Squirtle em outra caixa chamada Lista B; Squirtle está circulado em ambas as caixas”

Escrevendo código Python eficiente
list_a = ['Bulbasaur', 'Charmander', 'Squirtle']
list_b = ['Caterpie', 'Pidgey', 'Squirtle'] 
in_common = []

for pokemon_a in list_a:
    for pokemon_b in list_b:
        if pokemon_a == pokemon_b:
            in_common.append(pokemon_a)

print(in_common)
['Squirtle']
Escrevendo código Python eficiente
list_a = ['Bulbasaur', 'Charmander', 'Squirtle']
list_b = ['Caterpie', 'Pidgey', 'Squirtle'] 
set_a = set(list_a)
print(set_a)
{'Bulbasaur', 'Charmander', 'Squirtle'}
set_b = set(list_b)
print(set_b)
{'Caterpie', 'Pidgey', 'Squirtle'}
set_a.intersection(set_b)
{'Squirtle'}
Escrevendo código Python eficiente

Eficiência com teoria de conjuntos

%%timeit
in_common = []

for pokemon_a in list_a:
    for pokemon_b in list_b:
        if pokemon_a == pokemon_b:
            in_common.append(pokemon_a)
601 ns ± 17.1 ns por loop (média ± desvio padrão de 7 execuções, 1000000 loops cada)
%timeit in_common = set_a.intersection(set_b)
137 ns ± 3.01 ns por loop (média ± desvio padrão de 7 execuções, 10000000 loops cada)
Escrevendo código Python eficiente

Método de conjunto: difference

set_a = {'Bulbasaur', 'Charmander', 'Squirtle'}
set_b = {'Caterpie', 'Pidgey', 'Squirtle'}
set_a.difference(set_b)
{'Bulbasaur', 'Charmander'}

alt=”Os Pokémon Bulbasaur, Charmander e Squirtle em uma caixa chamada Conjunto A e os Pokémon Caterpie, Pidgey e Squirtle em outra caixa chamada Conjunto B; Bulbasaur e Charmander estão circulados na caixa Conjunto A”

Escrevendo código Python eficiente

Método de conjunto: difference

set_a = {'Bulbasaur', 'Charmander', 'Squirtle'}
set_b = {'Caterpie', 'Pidgey', 'Squirtle'}
set_b.difference(set_a)
{'Caterpie', 'Pidgey'}

alt=”Os Pokémon Bulbasaur, Charmander e Squirtle em uma caixa chamada Conjunto A e os Pokémon Caterpie, Pidgey e Squirtle em outra caixa chamada Conjunto B; Caterpie e Pidgey estão circulados na caixa Conjunto B”

Escrevendo código Python eficiente

Método de conjunto: symmetric_difference

set_a = {'Bulbasaur', 'Charmander', 'Squirtle'}
set_b = {'Caterpie', 'Pidgey', 'Squirtle'}
set_a.symmetric_difference(set_b)
{'Bulbasaur', 'Caterpie', 'Charmander', 'Pidgey'}

alt=”Os Pokémon Bulbasaur, Charmander e Squirtle em uma caixa chamada Conjunto A e os Pokémon Caterpie, Pidgey e Squirtle em outra caixa chamada Conjunto B; Bulbasaur, Charmander, Caterpie e Pidgey estão circulados”

Escrevendo código Python eficiente

Método de conjunto: union

set_a = {'Bulbasaur', 'Charmander', 'Squirtle'}
set_b = {'Caterpie', 'Pidgey', 'Squirtle'}
set_a.union(set_b)
{'Bulbasaur', 'Caterpie', 'Charmander', 'Pidgey', 'Squirtle'}

alt=”Os Pokémon Bulbasaur, Charmander e Squirtle em uma caixa chamada Conjunto A e os Pokémon Caterpie, Pidgey e Squirtle em outra caixa chamada Conjunto B; Todos os Pokémon estão circulados e Squirtle só uma vez”

Escrevendo código Python eficiente

Teste de pertencimento com conjuntos

# Os mesmos 720 Pokémon em cada estrutura
names_list  = ['Abomasnow', 'Abra', 'Absol', ...]
names_tuple = ('Abomasnow', 'Abra', 'Absol', ...)
names_set   = {'Abomasnow', 'Abra', 'Absol', ...}

alt=”Os Pokémon Abomasnow, Abra e Absol em três caixas separadas chamadas Lista, Tupla e Conjunto, respectivamente”

Escrevendo código Python eficiente

Teste de pertencimento com conjuntos

# Os mesmos 720 Pokémon em cada estrutura
names_list  = ['Abomasnow', 'Abra', 'Absol', ...]
names_tuple = ('Abomasnow', 'Abra', 'Absol', ...)
names_set   = {'Abomasnow', 'Abra', 'Absol', ...}

alt=”Os Pokémon Abomasnow, Abra e Absol em três caixas separadas chamadas Lista, Tupla e Conjunto; o Pokémon Zubat com uma linha para cada caixa representando um teste de pertencimento”

Escrevendo código Python eficiente
names_list  = ['Abomasnow', 'Abra', 'Absol', ...]
names_tuple = ('Abomasnow', 'Abra', 'Absol', ...)
names_set   = {'Abomasnow', 'Abra', 'Absol', ...}
%timeit 'Zubat' in names_list
7.63 µs ± 211 ns por loop (média ± desvio padrão de 7 execuções, 100000 loops cada)
%timeit 'Zubat' in names_tuple
7.6 µs ± 394 ns por loop (média ± desvio padrão de 7 execuções, 100000 loops cada)
%timeit 'Zubat' in names_set
37.5 ns ± 1.37 ns por loop (média ± desvio padrão de 7 execuções, 10000000 loops cada)
Escrevendo código Python eficiente

Únicos com conjuntos

# 720 tipos primários correspondentes a cada Pokémon
primary_types = ['Grass', 'Psychic', 'Dark', 'Bug', ...]
unique_types = []

for prim_type in primary_types:
    if prim_type not in unique_types:
        unique_types.append(prim_type)

print(unique_types)
['Grass', 'Psychic', 'Dark', 'Bug', 'Steel', 'Rock', 'Normal',
 'Water', 'Dragon', 'Electric', 'Poison', 'Fire', 'Fairy', 'Ice',
 'Ground', 'Ghost', 'Fighting', 'Flying']
Escrevendo código Python eficiente

Únicos com conjuntos

# 720 tipos primários correspondentes a cada Pokémon
primary_types = ['Grass', 'Psychic', 'Dark', 'Bug', ...]
unique_types_set = set(primary_types)
print(unique_types_set)
{'Grass', 'Psychic', 'Dark', 'Bug', 'Steel', 'Rock', 'Normal',
 'Water', 'Dragon', 'Electric', 'Poison', 'Fire', 'Fairy', 'Ice',
 'Ground', 'Ghost', 'Fighting', 'Flying'}
Escrevendo código Python eficiente

Vamos praticar teoria de conjuntos!

Escrevendo código Python eficiente

Preparing Video For Download...