Von Bewertungen zu Empfehlungen

Einführung in das Data Engineering

Vincent Vankrunkelsven

Data Engineer @ DataCamp

Die Empfehlungstabelle

 

nutzer_id course_id rating
1 1 4,8
1 74 4,78
1 21 4,5
2 32 4,9

 

Die geschätzte Bewertung eines Kurses, den der Nutzer noch nicht gemacht hat.

Einführung in das Data Engineering

Empfehlungstechniken

 

  • Matrixfaktorisierung
  • Empfehlungsmaschinen mit PySpark erstellen
Einführung in das Data Engineering

Transformation auf Grundlage des gesunden Menschenverstands

Abbildung der Kurstabelle

 

Abbildung zur Bewertungstabelle

Empfehlungen

nutzer_id course_id rating
1 1 4,8
1 74 4,78
1 21 4,5
2 32 4,9
Einführung in das Data Engineering

Durchschnittliche Kursbewertungen

Durchschnittliche Kursbewertung

course_id avg_rating
1 4,8
74 4,78
21 4,5
32 4,9

 

Wir wollen Kurse empfehlen, die besonders gut bewertet sind.

Einführung in das Data Engineering

Verwende die richtige Programmiersprache

Bewertung

nutzer_id course_id programming_language rating
1 1 r 4,8
1 74 sql 4,78
1 21 sql 4,5
1 32 python 4,9

 

Empfehle SQL-Kurs für Benutzer mit ID 1

Einführung in das Data Engineering

Neue Kurse vorschlagen

Bewertung

nutzer_id course_id programming_language rating
1 1 r 4,8
1 74 sql 4,78
1 21 sql 4,5
1 32 python 4,9

 

Empfiehl nicht die Kombinationen, die schon in der Bewertungstabelle stehen.

Einführung in das Data Engineering

Transformation zu unserer Empfehlung

 

  • Nutze die Technologie, die die Nutzer am besten bewertet haben.
  • Empfiehl keine Kurse, die der Nutzer schon bewertet hat.
  • Empfiehl die drei Kurse mit den besten Bewertungen aus den restlichen Kombinationen.
Einführung in das Data Engineering

Bewertung

nutzer_id course_id programming_language rating
1 12 sql 4,78
1 52 sql 4,5
1 32 r 4,9

 

Empfiehl die drei am besten bewerteten SQL-Kurse, die nicht 12 und 52 sind.

Einführung in das Data Engineering

Lass uns üben!

Einführung in das Data Engineering

Preparing Video For Download...