PyTorch ile Görüntüler için Deep Learning
Michal Oleszak
Machine Learning Engineer



bbox1 = [50, 50, 150, 150] bbox2 = [100, 100, 200, 200]bbox1 = torch.tensor(bbox1).unsqueeze(0) bbox2 = torch.tensor(bbox2).unsqueeze(0)
from torchvision.ops import box_iou
iou = box_iou(bbox1, bbox2)
print(iou)
tensor([[0.1429]])

model.eval() with torch.no_grad():output = model(input_image)print(output)
[{'boxes': tensor([[ 42.8553, 271.9481, 180.6003, 346.7082],
[191.6016, 80.4759, 247.8009, 387.5475], ....),
'scores': tensor([1.0000, 1.0000, 0.9998, ... ]),
'labels': tensor([18, 1, 20, 18, 18, 18 ...])
}]
boxes = output[0]["boxes"]scores = output[0]["scores"]


Non-max suppression: en ilgili sınırlayıcı kutuları seçmek için yaygın bir teknik
Non-max: nesne içerme güveni düşük kutuları elemek
Suppression: IoU'su düşük kutuları elemek
from torchvision.ops import nmsbox_indices = nms( boxes=boxes, scores=scores, iou_threshold=0.5, ) print(box_indices)
tensor([ 0, 1, 2, 8])
filtered_boxes = boxes[box_indices]
Boxes: şekli [N, 4] olan sınırlayıcı kutu koordinat tensörleri
Scores: her kutu için güven puanı, şekli [N] olan tensör
iou_threshold: 0.0 ile 1.0 arasında eşik
Çıktı: filtrelenen kutuların indisleri
PyTorch ile Görüntüler için Deep Learning