Grundlagen von Big Data mit PySpark
Upendra Devisetty
Science Analyst, CyVerse
Lambda-Funktionen sind anonyme Funktionen in Python
Sehr leistungsfähig; effizient mit map() und filter()
Erzeugen aufrufbare Funktionen, ähnlich wie def
Gibt eine namenlose Funktion zurück (anonym)
Für Inline-Definitionen oder verzögerte Ausführung
lambda arguments: expression
double = lambda x: x * 2
print(double(3))
6
def cube(x):
return x ** 3
g = lambda x: x ** 3
print(g(10))
print(cube(10))
1000
1000
Kein return-Statement bei lambda
Lambda kann überall stehen
map() wendet eine Funktion auf alle Elemente der Eingabeliste an
Allgemeine Syntax von map()
map(function, list)
items = [1, 2, 3, 4]
list(map(lambda x: x + 2 , items))
[3, 4, 5, 6]
filter() nimmt eine Funktion und eine Liste und gibt eine neue Liste mit Elementen zurück, für die die Funktion True ergibt
Allgemeine Syntax von filter()
filter(function, list)
items = [1, 2, 3, 4]
list(filter(lambda x: (x%2 != 0), items))
[1, 3]
Grundlagen von Big Data mit PySpark