Deep Learning voor afbeeldingen met PyTorch
Michal Oleszak
Machine Learning Engineer



bbox1 = [50, 50, 150, 150] bbox2 = [100, 100, 200, 200]bbox1 = torch.tensor(bbox1).unsqueeze(0) bbox2 = torch.tensor(bbox2).unsqueeze(0)
from torchvision.ops import box_iou
iou = box_iou(bbox1, bbox2)
print(iou)
tensor([[0.1429]])

model.eval() with torch.no_grad():output = model(input_image)print(output)
[{'boxes': tensor([[ 42.8553, 271.9481, 180.6003, 346.7082],
[191.6016, 80.4759, 247.8009, 387.5475], ....),
'scores': tensor([1.0000, 1.0000, 0.9998, ... ]),
'labels': tensor([18, 1, 20, 18, 18, 18 ...])
}]
boxes = output[0]["boxes"]scores = output[0]["scores"]


Non-max suppression: een veelgebruikte techniek om de meest relevante bounding boxes te kiezen
Non-max: vakken met lage confidence-score weggooien
Suppression: vakken met lage IoU weggooien
from torchvision.ops import nmsbox_indices = nms( boxes=boxes, scores=scores, iou_threshold=0.5, ) print(box_indices)
tensor([ 0, 1, 2, 8])
filtered_boxes = boxes[box_indices]
Boxes: tensors met bounding box-coördinaten, vorm [N, 4]
Scores: tensor met confidence-score per box, vorm [N]
iou_threshold: drempel tussen 0.0 en 1.0
Output: indexen van gefilterde bounding boxes
Deep Learning voor afbeeldingen met PyTorch