Instance-segmentatie met Mask R-CNN

Deep Learning voor afbeeldingen met PyTorch

Michal Oleszak

Machine Learning Engineer

Faster R-CNN

Faster R-CNN-architectuurdiagram

Deep Learning voor afbeeldingen met PyTorch

Mask R-CNN

Mask R-CNN-architectuurdiagram

Deep Learning voor afbeeldingen met PyTorch

Voorgetrainde Mask R-CNN in PyTorch

from torchvision.models.detection import \
maskrcnn_resnet50_fpn


model = maskrcnn_resnet50_fpn(pretrained=True) model.eval()
image = Image.open("cat_and_laptop.jpg") transform = transforms.Compose([ transforms.ToTensor() ]) image_tensor = transform(image).unsqueeze(0)
with torch.no_grad(): prediction = model(image_tensor)
  • Importeer het Mask R-CNN-model
  • Laad het voorgetrainde model
  • Laad testafbeelding en zet om naar tensor

foto van een kat naast een laptop

  • Geef de afbeeldingstensor aan het model door
Deep Learning voor afbeeldingen met PyTorch

Modeluitvoer

  • Labels

    prediction[0]["labels"]
    
    tensor([
        17, 73, 76, 73, 67, 42, 63, 84,73, 65, 
        17, 73, 73, 73, 84, 72, 76, 76,17, 15
    ])
    
  • Klassenamen

    print(class_names[17], class_names[73])
    
    cat laptop
    
  • Klassekansen

    prediction[0]["scores"]
    
    tensor([
        0.9981, 0.9672, 0.9061, 0.6893, 0.3729, 
        ..., 
        0.0745, 0.0705, 0.0623, 0.0610, 0.0508
    ])
    
  • Maskers

    prediction[0]["masks"]
    
    tensor([[[[0., 0., 0.,  ..., 0., 0., 0.],
              ...]]]])
    
Deep Learning voor afbeeldingen met PyTorch

Zachte maskers

  • Unieke mask-waarden

    prediction[0]["masks"].unique()
    
    tensor([0.0000e+00, 5.9713e-08, ..., 
            9.9989e-01, 9.9990e-01])
    
  • Mask R-CNN-maskers:

    • Waarden tussen 0 en 1
    • Geven de zekerheid van het model per pixel dat die tot het object hoort
    • Informatiever dan binaire maskers
    • Indien nodig te binariseren met een drempel
Deep Learning voor afbeeldingen met PyTorch

Zachte maskers weergeven

masks = prediction[0]["masks"]
labels = prediction[0]["labels"]


for i in range(2): plt.imshow(image)
plt.imshow( masks[i, 0], cmap="jet", alpha=0.5, )
plt.title( f"Object: {class_names[labels[i]]}" ) plt.show()
  • Haal masks en labels uit prediction
  • Loop over de top 2 objecten en plot de originele afbeelding
  • Plot per object het semi-transparante masker
  • Voeg titel toe en toon
Deep Learning voor afbeeldingen met PyTorch

Zachte maskers weergeven

Instance-segmentatiemaskers over de afbeeldingen

Deep Learning voor afbeeldingen met PyTorch

Laten we oefenen!

Deep Learning voor afbeeldingen met PyTorch

Preparing Video For Download...