Dari rating ke rekomendasi

Pengantar Data Engineering

Vincent Vankrunkelsven

Data Engineer @ DataCamp

Tabel rekomendasi

 

user_id course_id rating
1 1 4.8
1 74 4.78
1 21 4.5
2 32 4.9

 

Perkiaraan rating untuk kursus yang belum diambil pengguna.

Pengantar Data Engineering

Teknik rekomendasi

 

  • Faktorisasi matriks
  • Building Recommendation Engines with PySpark
Pengantar Data Engineering

Transformasi berbasis nalar

Diagram tabel courses

 

Diagram tabel rating

Rekomendasi

user_id course_id rating
1 1 4.8
1 74 4.78
1 21 4.5
2 32 4.9
Pengantar Data Engineering

Rata-rata rating kursus

Rata-rata rating kursus

course_id avg_rating
1 4.8
74 4.78
21 4.5
32 4.9

 

Kita ingin merekomendasikan kursus dengan rating tinggi

Pengantar Data Engineering

Gunakan bahasa pemrograman yang tepat

Rating

user_id course_id programming_language rating
1 1 r 4.8
1 74 sql 4.78
1 21 sql 4.5
1 32 python 4.9

 

Rekomendasikan kursus SQL untuk pengguna id 1

Pengantar Data Engineering

Rekomendasikan kursus baru

Rating

user_id course_id programming_language rating
1 1 r 4.8
1 74 sql 4.78
1 21 sql 4.5
1 32 python 4.9

 

Jangan rekomendasikan kombinasi yang sudah ada di tabel rating

Pengantar Data Engineering

Transformasi rekomendasi kita

 

  • Gunakan teknologi yang paling sering diberi rating oleh pengguna
  • Jangan rekomendasikan kursus yang sudah dinilai pengguna
  • Rekomendasikan tiga kursus berperingkat tertinggi dari kombinasi tersisa
Pengantar Data Engineering

Rating

user_id course_id programming_language rating
1 12 sql 4.78
1 52 sql 4.5
1 32 r 4.9

 

Rekomendasikan tiga kursus SQL berperingkat tertinggi selain 12 dan 52.

Pengantar Data Engineering

Ayo berlatih!

Pengantar Data Engineering

Preparing Video For Download...