De avaliações a recomendações

Introdução à Engenharia de Dados

Vincent Vankrunkelsven

Data Engineer @ DataCamp

A tabela de recomendações

 

user_id course_id rating
1 1 4.8
1 74 4.78
1 21 4.5
2 32 4.9

 

A nota estimada de um curso que o usuário não fez ainda.

Introdução à Engenharia de Dados

Técnicas de recomendação

 

  • Fatoração de matrizes
  • Building Recommendation Engines with PySpark
Introdução à Engenharia de Dados

Transformação de bom senso

Diagrama representando a tabela courses

 

Diagrama representando a tabela rating

Recomendações

user_id course_id rating
1 1 4.8
1 74 4.78
1 21 4.5
2 32 4.9
Introdução à Engenharia de Dados

Médias de avaliação dos cursos

Média de avaliações por curso

course_id avg_rating
1 4.8
74 4.78
21 4.5
32 4.9

 

Queremos recomendar cursos bem avaliados

Introdução à Engenharia de Dados

Use a linguagem certa

Avaliação

user_id course_id programming_language rating
1 1 r 4.8
1 74 sql 4.78
1 21 sql 4.5
1 32 python 4.9

 

Recomende curso de SQL para o usuário com id 1

Introdução à Engenharia de Dados

Recomende cursos novos

Avaliação

user_id course_id programming_language rating
1 1 r 4.8
1 74 sql 4.78
1 21 sql 4.5
1 32 python 4.9

 

Não recomende as combinações já na tabela de avaliações

Introdução à Engenharia de Dados

Nossa transformação de recomendação

 

  • Use a tecnologia mais avaliada pelo usuário
  • Não recomende cursos que o usuário já avaliou
  • Recomende os três cursos com maior nota entre as combinações restantes
Introdução à Engenharia de Dados

Avaliação

user_id course_id programming_language rating
1 12 sql 4.78
1 52 sql 4.5
1 32 r 4.9

 

Recomende três cursos de SQL mais bem avaliados que não sejam 12 e 52.

Introdução à Engenharia de Dados

Vamos praticar!

Introdução à Engenharia de Dados

Preparing Video For Download...