简述:torchvision

张开发
2026/4/18 1:25:16 15 分钟阅读

分享文章

简述:torchvision
简述torchvision一、Torchvision 是什么Torchvision 是 PyTorch 官方配套的计算机视觉专用库专门处理图像任务。作用提供常用数据集、图像预处理、经典模型、可视化工具核心内容内置数据集MNIST、CIFAR、ImageNet、COCO 等经典模型ResNet、VGG、U-Net、FasterRCNN 等直接用预训练权重图像变换裁剪、归一化、翻转、增强工具图像读取、显示、保存二、3 个简单实用例子例子 1图像预处理最常用fromtorchvisionimporttransformsfromPILimportImage# 定义一套图像预处理流程transformtransforms.Compose([transforms.Resize((224,224)),# 改尺寸transforms.ToTensor(),# 转张量transforms.Normalize(mean[0.5],std[0.5])# 归一化])# 加载并处理图片imgImage.open(test.jpg)img_tensortransform(img)print(img_tensor.shape)# 输出: torch.Size([3, 224, 224])例子 2直接用预训练模型 ResNetfromtorchvisionimportmodels# 加载训练好的ResNet18modelmodels.resnet18(pretrainedTrue)model.eval()# 设为推理模式# 输入一张图importtorch xtorch.randn(1,3,224,224)# 1张图3通道outmodel(x)print(out.shape)# 输出分类结果例子 3加载官方数据集CIFAR10fromtorchvisionimportdatasets,transformsfromtorch.utils.dataimportDataLoader transformtransforms.ToTensor()# 自动下载加载CIFAR10datasetdatasets.CIFAR10(root./data,trainTrue,downloadTrue,transformtransform)# 批量加载loaderDataLoader(dataset,batch_size32,shuffleTrue)# 取一批数据images,labelsnext(iter(loader))print(images.shape)# torch.Size([32, 3, 32, 32])三、一句话总结Torchvision 是 PyTorch 视觉必备工具包负责图像预处理、模型、数据集让图像分类 / 检测 / 分割开箱即用非常适合做变化检测、影像识别等任务。本blog地址https://blog.csdn.net/hsg77

更多文章