Inferentie op basis van sociale netwerken

Fraudedetectie in R

Tim Verdonck

Professor Data Science at KU Leuven

Inferentie op basis van sociale netwerken

Doel

Voorspel het gedrag van een knoop op basis van het gedrag van andere knopen

ontbrekende_knopen_in_netwerk.png

Fraudedetectie in R

Inferentie op basis van sociale netwerken

Uitdagingen

  • Data zijn niet onafhankelijk
    • Gedrag van één knoop kan andere knopen beïnvloeden
    • Gecorreleerd gedrag tussen knopen
  • Collectieve inferentie: inferenties over knopen beïnvloeden elkaar

ontbrekende_knopen_in_netwerk.png

Fraudedetectie in R

Niet-relationeel vs relationeel

Niet-relationeel model

  • Gebruikt alleen lokale info
  • Logistische regressie, beslisbomen, ...

logistische_regressie.png

Relationeel model

  • Benut links in het netwerk
  • Relationele neighbor-classifier

eenvoudig_netwerk.png

Fraudedetectie in R

Relationele neighbor-classifier

Aannames

  • Homofilie: verbonden knopen hebben de neiging tot dezelfde klasse te horen ("schuld door associatie")
  • Sommige klasselabels zijn bekend

ontbrekende_knoop.png

Fraudedetectie in R

Relationele neighbor-classifier

Fraudekans

$$P(F | ?) = \frac{1 + 1}{1 + 1 + 1 + 1 + 1}=\frac{2}{5}= 40\%$$

ontbrekende_knoop.png

Fraudedetectie in R

Relationele neighbor-classifier met gewichten

Fraudekans

$$P(F | ?) = \frac{1 + 2}{3 + 1 + 1 + 2 + 1}=\frac{3}{8}=37.5\%$$

ontbrekende_knoop_gewogen.png

Fraudedetectie in R

Relationele neighbor-classifier

vertex_attr(network) ## Knopen gelabeld als 1 (fraude), 0 (geen fraude) of NA (onbekend)
$name
"?" "B" "C" "D" "E" "A"
$isFraud
NA  1  0  1  0  0
edge_attr(network) ## De randen hebben een gewicht

$weight
2 3 1 1 1
Fraudedetectie in R

Relationele neighbor-classifier

## subgraph(): maak subgraaf met knoop "?" en alle frauduleuze knopen
subnetwork <- subgraph(network, v = c("?", "B", "D"))

## strength(): som van randgewichten van aangrenzende randen voor knoop "?" prob_fraud <- strength(subnetwork, v = "?") / strength(network, v = "?")
prob_fraud
0.375
Fraudedetectie in R

Laten we oefenen!

Fraudedetectie in R

Preparing Video For Download...