Objectherkenningsmodellen evalueren

Deep Learning voor afbeeldingen met PyTorch

Michal Oleszak

Machine Learning Engineer

Classificatie en lokalisatie

objectlokalisatie

Output 1: Classificatie (bijv. kat)

Classificatie en lokalisatie

objectlokalisatie

Output 1: Classificatie (bijv. kat)
Output 2: Bounding box-regressie [x1, y1, x2, y2]

Intersection over Union (IoU)

Object of interest: het object dat we willen detecteren (bijv. hond)
Ground truth box: de juiste bounding box rond het object
Intersection over Union: maat voor overlap tussen twee vakken

jaccard

IoU = Oppervlakte intersectie / oppervlakte unie
- IoU = 0 geen overlap, IoU = 1 perfecte overlap
- IoU >0,5 is een goede voorspelling

IoU in PyTorch

bbox1 = [50, 50, 150, 150]
bbox2 = [100, 100, 200, 200]


bbox1 = torch.tensor(bbox1).unsqueeze(0)
bbox2 = torch.tensor(bbox2).unsqueeze(0)

from torchvision.ops import box_iou

iou = box_iou(bbox1, bbox2)
print(iou)

tensor([[0.1429]])

Twee sets boxes (x1, y1, x2, y2)

set van 2 boxen

Zet vectors om naar 2D-tensors
Bereken IoU

Voorspellen van bounding boxes

model.eval()
with torch.no_grad():

    output = model(input_image)

print(output)

[{'boxes': tensor([[ 42.8553, 271.9481, 180.6003, 346.7082],
                  [191.6016,  80.4759, 247.8009, 387.5475], ....),
'scores': tensor([1.0000, 1.0000, 0.9998, ... ]),
'labels': tensor([18,  1, 20, 18, 18, 18 ...])
}]

boxes = output[0]["boxes"]

scores = output[0]["scores"]

Non-max suppression (NMS)

meerdere vakken

Non-max suppression (NMS)

meerdere vakken

Non-max suppression: een veelgebruikte techniek om de meest relevante bounding boxes te kiezen

Non-max: vakken met lage confidence-score weggooien
Suppression: vakken met lage IoU weggooien

Non-max suppression in PyTorch

from torchvision.ops import nms


box_indices = nms(
    boxes=boxes,
    scores=scores,
    iou_threshold=0.5,
)
print(box_indices)

tensor([ 0,   1,   2,   8])

filtered_boxes = boxes[box_indices]

Boxes: tensors met bounding box-coördinaten, vorm [N, 4]
Scores: tensor met confidence-score per box, vorm [N]
iou_threshold: drempel tussen 0.0 en 1.0
Output: indexen van gefilterde bounding boxes

Laten we oefenen!

Deep Learning voor afbeeldingen met PyTorch