Pazar sepeti analizinde metrikler

R ile Pazar Sepeti Analizi

Christopher Bruffaerts

Statistician

Kural çıkarımında kullanılan metrikler

TID İşlem
1 {Bread, Butter, Cheese, Wine}
2 {Bread, Butter, Wine}
3 {Bread, Butter}
4 {Butter, Cheese, Wine}
5 {Butter, Cheese}
6 {Cheese, Wine}
7 {Butter, Wine}

Amaç: İlişki kurallarını çıkarmak

Örnekler:

  • {Bread} $\rightarrow$ {Butter}
    • Bread = "Öncegelen"
    • Butter = "Sonuç"
  • {Butter, Cheese} $\rightarrow$ {Wine}

Metrikler: Support, confidence, lift, ...

R ile Pazar Sepeti Analizi

Support ölçütü

TID İşlem
1 {Bread, Butter, Cheese, Wine}
2 {Bread, Butter, Wine}
3 {Bread, Butter}
4 {Butter, Cheese, Wine}
5 {Butter, Cheese}
6 {Cheese, Wine}
7 {Butter, Wine}

Support: "bir öğe kümesinin popülerliği"

  • supp(X) = X öğe kümesini içeren işlem oranı
  • supp(X $\cup$ Y) = Hem X hem Y içeren işlem oranı

Örnekler:

  • supp({Bread}) = 3/7 = %42
  • supp({Bread} $\cup$ {Butter}) = 3/7 = %42
R ile Pazar Sepeti Analizi

Confidence ölçütü

TID İşlem
1 {Bread, Butter, Cheese, Wine}
2 {Bread, Butter, Wine}
3 {Bread, Butter}
4 {Butter, Cheese, Wine}
5 {Butter, Cheese}
6 {Cheese, Wine}
7 {Butter, Wine}

Confidence: "kuralın ne sıklıkla doğru olduğu"

conf(X $\rightarrow$ Y) = supp(X $\cup$ Y) / supp(X)

Confidence, X ile birlikte Y'nin alınma yüzdesini gösterir.

Örnek:

X = {Bread}

Y = {Butter}

conf(X $\rightarrow$ Y) = $\frac{3/7}{3/7}$ = %100

R ile Pazar Sepeti Analizi

Lift ölçütü

TID İşlem
1 {Bread, Butter, Cheese, Wine}
2 {Bread, Butter, Wine}
3 {Bread, Butter}
4 {Butter, Cheese, Wine}
5 {Butter, Cheese}
6 {Cheese, Wine}
7 {Butter, Wine}

Lift: "ilişki ne kadar güçlü"

lift(X $\rightarrow$ Y) = $\dfrac{supp(X \cup Y)}{supp(X) \times supp(Y)}$

  • Lift > 1: Y, X ile birlikte alınma eğilimindedir
  • Lift < 1: X alındığında Y alınma eğiliminde değildir

Örnek:

X = {Bread}; Y = {Butter}

lift(X $\rightarrow$ Y) = $\frac{3/7}{(3/7)*(6/7)} = \frac{7}{6}$ ~ 1.16

R ile Pazar Sepeti Analizi

Sık öğe kümeleri için apriori fonksiyonu

library(arules)
# Frequent itemsets
supp.cw = apriori(trans, # the transactional dataset
                  # Parameter list
                  parameter=list(
                    # Minimum Support
                    supp=0.2,
                    # Minimum Confidence
                    conf=0.4,
                    # Minimum length
                    minlen=2,
                    # Target
                    target="frequent itemsets"),
                  # Appearence argument
                  appearance = list(
                    items = c("Cheese","Wine"))
                 )
R ile Pazar Sepeti Analizi

Kurallar için apriori fonksiyonu

library(arules)
# Rules
rules.b.rhs = apriori(trans, # the transactional dataset
                  # Parameter list
                  parameter=list(
                    # Minimum Support
                    supp=0.2,
                    # Minimum Confidence
                    conf=0.4,
                    # Minimum length
                    minlen=2,
                    # Target
                    target="rules"),
                  # Appearence argument
                   appearance = list(
                     rhs = "Butter",
                    default = "lhs")
                 )
R ile Pazar Sepeti Analizi

Apriori ile sık öğe kümeleri

TID İşlem
1 {Bread, Butter, Cheese, Wine}
2 {Bread, Butter, Wine}
3 {Bread, Butter}
4 {Butter, Cheese, Wine}
5 {Butter, Cheese}
6 {Cheese, Wine}
7 {Butter, Wine}

Sık öğe kümelerini çıkarın

supp.all = apriori(trans, 
           parameter=list(supp=3/7,
           target="frequent itemsets"))        
inspect(head(sort(supp.all,by="support"),3))
    items          support   count
[1] {Butter}       0.8571429 6    
[2] {Wine}         0.7142857 5    
[3] {Cheese}       0.5714286 4
R ile Pazar Sepeti Analizi

Confidence ve lift ölçülerini inceleyin

TID İşlem
1 {Bread, Butter, Cheese, Wine}
2 {Bread, Butter, Wine}
3 {Bread, Butter}
4 {Butter, Cheese, Wine}
5 {Butter, Cheese}
6 {Cheese, Wine}
7 {Butter, Wine}

Kuralları çıkarın

# rhs'de "Butter" olan kurallar
rules.b.rhs = apriori(trans, 
                 parameter=list(
                    minlen=2,
                    target="rules"), 
                 appearance = list(
                     rhs="Butter",
                    default = "lhs")
           )
inspect(head(sort(rules.b.rhs,by="lift")), 5)
R ile Pazar Sepeti Analizi

Confidence ve lift ölçülerini inceleyin

TID İşlem
1 {Bread, Butter, Cheese, Wine}
2 {Bread, Butter, Wine}
3 {Bread, Butter}
4 {Butter, Cheese, Wine}
5 {Butter, Cheese}
6 {Cheese, Wine}
7 {Butter, Wine}

Kuralları çıkarın

    lhs                    rhs      support  confidence lift  count
[1] {Bread}             => {Butter} 0.42      1.0        1.16     3    
[2] {Bread,Cheese}      => {Butter} 0.14      1.0        1.16     1    
[3] {Bread,Wine}        => {Butter} 0.28      1.0        1.16     2    
[4] {Bread,Cheese,Wine} => {Butter} 0.14      1.0        1.16     1    
[5] {Wine}              => {Butter} 0.57      0.8        0.93     4
R ile Pazar Sepeti Analizi

Hadi pratik yapalım!

R ile Pazar Sepeti Analizi

Preparing Video For Download...