Associatie en dissociatie

Market Basket Analysis in Python

Isaiah Hull

Visiting Associate Professor of Finance, BI Norwegian Business School

E-books koppelen met dissociatie

Een miniatuur van de boekomslag van The Hobbit.

Een miniatuur van de boekomslag van The Great Gatsby.

Een miniatuur van de boekomslag van Pride and Prejudice.

Een miniatuur van de boekomslag van The Catcher in the Rye.

1 Afbeeldingen afkomstig van goodreads.com.
Market Basket Analysis in Python

Introductie van Zhangs maatstaf

  1. Geïntroduceerd door Zhang (2000)
    • Waarden tussen -1 en +1
    • +1 = perfecte associatie
    • -1 = perfecte dissociatie
  2. Volledig en goed te interpreteren
  3. Gebaseerd op support
1 Zhang, T. (2000). Association Rules. Proceedings of the 4th Pacific-Asia conference, PADKK, pp.245-256. Kyoto, Japan.
Market Basket Analysis in Python

Zhangs maatstaf definiëren

  $$Zhang(A \rightarrow B) = $$ $$\frac{Confidence(A \rightarrow B) - Confidence(\bar{A} \rightarrow B)}{Max[Confidence(A \rightarrow B), Confidence(\bar{A} \rightarrow B)]}$$   $$Confidence = \frac{Support(A \& B)}{Support(A)}$$

Market Basket Analysis in Python

Zhangs maatstaf op basis van support

  $$Zhang(A \rightarrow B) = $$ $$\frac{Support(A \& B) - Support(A) Support(B)}{ Max[Support(AB) (1-Support(A)), Support(A)(Support(B)-Support(AB))]}$$

Market Basket Analysis in Python

Zhangs maatstaf berekenen

# Compute the support of each book
supportH = hobbit.mean()
supportP = pride.mean()
# Compute the support of both books
supportHP = np.logical_and(hobbit, pride).mean()
Market Basket Analysis in Python

Zhangs maatstaf berekenen

# Compute the numerator
num = supportHP - supportH*supportP
# Compute the denominator
denom = max(supportHP*(1-supportH), supportH*(supportP-supportHP))
# Compute Zhang's metric
zhang = num / denom
print(zhang)
0.08903
Market Basket Analysis in Python

Laten we oefenen!

Market Basket Analysis in Python

Preparing Video For Download...