Aprendizaje profundo intermedio con PyTorch
Michal Oleszak
Machine Learning Engineer

![]()
Cada píxel contiene información sobre el color.
Imágenes en escala de grises: número entero entre 0 y 255.


Estructura de directorios deseada:
clouds_train- cumulus- 75cbf18.jpg - ...- cumulonimbus - ...clouds_test- cumulus - cumulonimbus - ...
clouds_train y clouds_testfrom torchvision.datasets import ImageFolder from torchvision import transformstrain_transforms = transforms.Compose([ transforms.ToTensor(), transforms.Resize((128, 128)), ])dataset_train = ImageFolder( "data/clouds_train", transform=train_transforms, )
Define las transformaciones:
Crear paso de conjunto de datos:
dataloader_train = DataLoader(
dataset_train,
shuffle=True,
batch_size=1,
)
image, label = next(iter(dataloader_train))
print(image.shape)
torch.Size([1, 3, 128, 128])
image = image.squeeze().permute(1, 2, 0)
print(image.shape)
torch.Size([128, 128, 3])
import matplotlib.pyplot as plt
plt.imshow(image)
plt.show()

train_transforms = transforms.Compose([transforms.RandomHorizontalFlip(), transforms.RandomRotation(45),transforms.ToTensor(), transforms.Resize((128, 128)), ])dataset_train = ImageFolder( "data/clouds/train", transform=train_transforms, )
Aumento de datos Generación de más datos mediante la aplicación de transformaciones aleatorias a imágenes originales.

Aprendizaje profundo intermedio con PyTorch