Rilevamento delle frodi in R
Tim Verdonck
Professor Data Science at KU Leuven
Obiettivo
Predire il comportamento di un nodo dal comportamento degli altri nodi

Sfide

Modello non relazionale

Modello relazionale

Assunzioni

Probabilità di frode
$$P(F | ?) = \frac{1 + 1}{1 + 1 + 1 + 1 + 1}=\frac{2}{5}= 40\%$$

Probabilità di frode
$$P(F | ?) = \frac{1 + 2}{3 + 1 + 1 + 2 + 1}=\frac{3}{8}=37{,}5\%$$

vertex_attr(network) ## I nodi sono etichettati come 1 (frode), 0 (non frode) o NA (sconosciuto)
$name
"?" "B" "C" "D" "E" "A"
$isFraud
NA 1 0 1 0 0
edge_attr(network) ## Gli archi hanno un peso$weight
2 3 1 1 1
## subgraph(): crea un sottografo con il nodo "?" e tutti i nodi fraudolenti subnetwork <- subgraph(network, v = c("?", "B", "D"))## strength(): somma i pesi degli archi adiacenti per il nodo "?" prob_fraud <- strength(subnetwork, v = "?") / strength(network, v = "?")prob_fraud
0.375
Rilevamento delle frodi in R