PyTorch 1.13下复现Deeplabv3：搞定Cityscapes数据集下载与预处理（附百度云链接）

张开发

• 2026/4/18 15:15:14 • 15 分钟阅读

分享文章

PyTorch 1.13下复现Deeplabv3：搞定Cityscapes数据集下载与预处理（附百度云链接）

PyTorch 1.13实战从零构建Deeplabv3语义分割模型含Cityscapes数据集优化方案当你在PyTorch 1.13环境下打开那个经典的Deeplabv3实现仓库时是否也遇到了满屏的版本警告Cityscapes数据集下载进度条卡在1%的绝望感或是预处理脚本里那些看似简单却让人抓狂的路径配置问题这篇文章将带你完整走通这个技术闭环——从数据集获取到最终训练出第一个可用的语义分割模型。1. 环境配置与版本适配策略PyTorch 1.13带来的新特性让许多老代码需要微调才能完美运行。我们先解决最棘手的版本兼容问题# 验证PyTorch版本 import torch print(fPyTorch版本: {torch.__version__}) # 应显示1.13.x关键依赖版本矩阵组件推荐版本最低要求备注PyTorch1.13.1≥1.10需CUDA 11.6torchvision0.14.1≥0.11匹配PyTorch主版本OpenCV4.6.0≥4.5图像预处理必需Pillow9.3.0≥8.0图像加载依赖注意避免混用conda和pip安装建议统一使用pip安装所有Python包常见的版本冲突通常出现在这两个地方torch.nn.functional.upsample已被torch.nn.functional.interpolate取代torchvision.models.resnet的预训练权重加载方式变更修正方案# 旧代码替换示例 # from torch.nn.functional import upsample from torch.nn.functional import interpolate as upsample # 权重加载方式更新 model.load_state_dict(torch.load(weights_path), strictFalse)2. Cityscapes数据集高效获取方案官方下载需要注册且速度极慢约50GB数据。这里提供三种可靠获取方式方案对比表获取方式速度完整性适用场景官方渠道极慢完整长期研究者百度云镜像快完整国内开发者精简版数据集极快80%样本快速验证推荐使用预处理好的百度云资源提取码hhk0已包含leftImg8bit_trainvaltest.zip和gtFine_trainvaltest.zip文件结构预先整理好解压即可用数据集目录结构应该是cityscapes/ ├── leftImg8bit │ ├── train │ ├── val │ └── test └── gtFine ├── train ├── val └── test重要解压后运行tree -d cityscapes -L 3确认目录层级3. 预处理脚本深度改造指南原版preprocess_data.py需要多处调整才能适配现代PyTorch环境主要修改点路径配置逻辑重构图像处理流程优化并行处理加速关键修改示例# 新路径配置方式支持环境变量 data_root os.getenv(CITYSCAPES_DIR, ./cityscapes) img_dir os.path.join(data_root, leftImg8bit) label_dir os.path.join(data_root, gtFine) # 替换过时的图像处理代码 def process_image(img_path): img cv2.imread(img_path) img cv2.cvtColor(img, cv2.COLOR_BGR2RGB) # 统一色彩空间 return torch.from_numpy(img).permute(2,0,1).float() / 255.0运行预处理# 添加环境变量可选 export CITYSCAPES_DIR./cityscapes # 执行预处理 python utils/preprocess_data.py --num-workers 84. 模型架构的现代化改造Deeplabv3的核心是ResNet骨干网络ASPP模块需要针对PyTorch 1.13做这些调整关键修改文件model/deeplabv3.pyASPP模块更新model/resnet.py适配新版本预训练权重train.py训练循环优化ResNet加载方式改造# 旧版方式已废弃 # from torchvision.models.resnet import resnet50 # 新版推荐 from torchvision.models import resnet50, ResNet50_Weights model resnet50(weightsResNet50_Weights.IMAGENET1K_V2)ASPP模块的现代实现class ASPP(nn.Module): def __init__(self, in_channels, out_channels256): super().__init__() self.conv1 nn.Conv2d(in_channels, out_channels, 1) self.conv2 nn.Conv2d(in_channels, out_channels, 3, padding6, dilation6) # 其他分支... def forward(self, x): return torch.cat([ F.relu(self.conv1(x)), F.relu(self.conv2(x)), # 其他分支输出... ], dim1)5. 训练流程的工业级优化针对Cityscapes数据特点我们需要调整标准训练配置超参数设置建议初始学习率0.01使用线性warmupBatch Size811GB显存优化器SGD with momentum0.9学习率策略多项式衰减训练启动命令python train.py \ --dataset-dir ./cityscapes \ --batch-size 8 \ --epochs 50 \ --lr 0.01 \ --weight-decay 1e-4训练监控技巧使用TensorBoard记录指标每5个epoch保存一次检查点验证集mIoU作为早停依据# 在train.py中添加监控 from torch.utils.tensorboard import SummaryWriter writer SummaryWriter() for epoch in range(epochs): # ...训练代码... writer.add_scalar(Loss/train, loss.item(), epoch) writer.add_scalar(mIoU/val, miou, epoch)6. 可视化与性能评估实战训练完成后使用改进版的visualization工具验证效果创建测试目录结构mkdir -p test_images/{input,output,overlay}修改后的run_on_seq.py核心逻辑def visualize_results(img_path): img load_image(img_path) pred model.predict(img) # 生成带透明度的叠加图 overlay blend_segmentation(img, pred, alpha0.5) # 保存三种输出 cv2.imwrite(ftest_images/input/{os.path.basename(img_path)}, img) cv2.imwrite(ftest_images/output/{os.path.basename(img_path)}, pred) cv2.imwrite(ftest_images/overlay/{os.path.basename(img_path)}, overlay)典型问题排查如果遇到CUDA内存不足torch.cuda.empty_cache()标签映射错误时检查print(np.unique(label.numpy())) # 应该只包含Cityscapes的19类ID在RTX 3060上训练50个epoch约需18小时最终mIoU应达到65%左右。第一个epoch完成后立即验证可以避免浪费计算资源——这是我在多次失败后总结出的宝贵经验。

更多文章

前端开发 2026/4/18 15:13:49

Elasticsearch可视化管理终极指南：es-client让复杂查询变得简单

Elasticsearch可视化管理终极指南：es-client让复杂查询变得简单【免费下载链接】es-client elasticsearch客户端，issue请前往码云：https://gitee.com/qiaoshengda/es-client 项目地址: https://gitcode.com/gh_mirrors/es/es-client …

张开发

前端开发 2026/4/18 15:12:49

机器人建模实战：用DH参数搞定SCARA机械臂正运动学（附完整参数表）

机器人建模实战：用DH参数搞定SCARA机械臂正运动学（附完整参数表） 在工业自动化领域，SCARA机械臂凭借其高速、高精度的平面运动特性，成为装配、分拣等场景的主力机型。但要让这台精密设备按照预期轨迹运动，工…

张开发

前端开发 2026/4/18 15:12:37

5分钟搞定FanControl中文设置：免费风扇控制软件本地化终极指南

5分钟搞定FanControl中文设置：免费风扇控制软件本地化终极指南【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Tre…

张开发

前端开发 2026/4/18 15:12:37

【芯片前端实战】跨时钟域数据抓取——可配置同步单元的设计与验证

1. 跨时钟域同步的挑战与需求在芯片前端设计中，跨时钟域数据同步是个老生常谈却又极其重要的话题。想象一下，你正在设计一个需要同时处理多个时钟域的芯片，就像在指挥一个交响乐团，每个乐器组（时钟域）都有…

张开发

前端开发 2026/4/18 15:11:42

Audio Pixel Studio实战案例：播客团队协作式语音脚本编辑+合成版本管理

Audio Pixel Studio实战案例：播客团队协作式语音脚本编辑合成版本管理 1. 项目背景与核心价值在播客内容创作领域，团队协作一直面临着诸多挑战。传统工作流程中，脚本修改、语音录制和后期处理往往需要反复沟通和多次返工，效率低…

张开发

前端开发 2026/4/18 15:00:47

TradingAgents中文版实战：5个技巧优化A股数据分析效果

TradingAgents中文版实战：5个技巧优化A股数据分析效果最近在调试TradingAgents-CN时，发现原版针对美股设计的架构直接套用A股会出现不少"水土不服"的情况。经过两个月的实盘测试和代码调整，总结出这套适配国内市场的优化方案。不同…

张开发

前端开发 2026/4/18 15:00:10

告别环境冲突：Anaconda虚拟环境内一站式部署PyTorch GPU开发栈

1. 为什么你需要Anaconda虚拟环境刚开始接触深度学习时，我也曾经直接在系统环境中安装PyTorch和各种依赖库。结果不到一个月，系统环境就被各种版本冲突搞得一团糟。每次运行不同的项目，都要花大量时间解决兼容性问题。直到后来学会了使用Ana…

张开发

前端开发 2026/4/18 14:57:39

Yolov5 + Deepsort 实战：从零构建自定义多目标追踪系统（避坑指南）

1. 环境配置与版本选择避坑指南第一次接触Yolov5Deepsort组合时，我最头疼的就是环境版本冲突问题。记得去年用conda安装时，torch和torchvision版本不匹配导致CUDA报错，整整折腾了两天。这里分享我的终极解决方案： 基础环境&#…

张开发

前端开发 2026/4/18 14:46:50

HarmonyOS6 ArkTS CheckboxGroup

文章目录组件1. 组件定义2. 核心特性完整代码核心API与属性1. 构造参数2. 核心样式属性（官方标准属性）3. 形状枚举 CheckBoxShape4. 状态监听 onChange返回值 CheckboxGroupResult群组状态 SelectStatus核心功能1. 群组绑定规则2. 全选/部分选中/取消全选…

张开发

前端开发 2026/4/18 14:44:37

科研图表制作的革命：如何用3000+矢量图标库彻底改变你的学术可视化体验

科研图表制作的革命：如何用3000矢量图标库彻底改变你的学术可视化体验【免费下载链接】bioicons A library of free open source icons for science illustrations in biology and chemistry 项目地址: https://gitcode.com/gh_mirrors/bi/bioicons 如果你曾…

张开发

前端开发 2026/4/18 14:44:18

从Copilot到CodeWhisperer，智能生成代码的依赖熵增问题全解析，Google/微软内部治理白皮书首度公开

第一章：智能代码生成代码依赖管理 2026奇点智能技术大会(https://ml-summit.org) 现代智能代码生成系统（如Copilot、CodeWhisperer、Tabnine）在输出代码片段时，往往隐式引入第三方依赖，但不显式声明其版本约束、兼容…

张开发

前端开发 2026/4/18 14:43:24

KS-Downloader：专业级快手无水印视频下载解决方案

KS-Downloader：专业级快手无水印视频下载解决方案【免费下载链接】KS-Downloader 快手（KuaiShou）视频/图片下载工具；数据采集工具项目地址: https://gitcode.com/gh_mirrors/ks/KS-Downloader 还在为无法保存喜欢的快手视…

张开发

PyTorch 1.13下复现Deeplabv3：搞定Cityscapes数据集下载与预处理（附百度云链接）

最新文章

在Windows 7 64位系统上从零部署YOLOv3 CPU推理环境：Cygwin配置与Darknet编译实战

Qwen3.5-9B-AWQ-4bit Claude风格对话体验：部署你的私有化智能对话助手

用Cursor+Vue.js 30分钟搞定个人项目管理工具（附完整代码）

【STM32】实战2—用STM32与ULN2003实现28BYJ-48步进电机的精准调速与方向控制

告别复杂配置！在Ubuntu 20.04/22.04上快速部署Astra Pro摄像头（含PCL点云实时显示）

VMDE深度解析：3大核心检测技术与5分钟实战指南

推荐文章

手把手教你用NUCLEO-H743ZI2连接Arduino模块：从硬件选型到I2C通信实战

从‘能用’到‘好用’：我用这5个步骤，为我的智能小车电机选到了最合适的栅极驱动芯片

11.os模块、编解码、文件操作、try-except语句详解

公路车桥耦合振动程序（考虑路面不平整度）——两套模型介绍及操作指南

Umi-OCR完全指南：如何利用开源OCR工具实现高效文字识别

从理论到实践：基于MATLAB comm.RayTracingChannel的室内多径信道仿真全解析

相关文章

2025 AI写作革命：自定义API打造专属小说生成器

用GDAL和PyTorch搞定多光谱.tif图像训练Faster R-CNN（避坑全记录）

HC-SR501人体红外传感器：从参数解析到树莓派实战应用

2026年三维扫描仪选购指南：专业厂家如何选，这几点是关键

微信小程序项目目录结构优化指南：从tabBar报错看最佳实践

探索Feishin：打造个人专属的自托管音乐播放解决方案

分享文章

更多文章

Elasticsearch可视化管理终极指南：es-client让复杂查询变得简单

机器人建模实战：用DH参数搞定SCARA机械臂正运动学（附完整参数表）

5分钟搞定FanControl中文设置：免费风扇控制软件本地化终极指南

【芯片前端实战】跨时钟域数据抓取——可配置同步单元的设计与验证

Audio Pixel Studio实战案例：播客团队协作式语音脚本编辑+合成版本管理

TradingAgents中文版实战：5个技巧优化A股数据分析效果

告别环境冲突：Anaconda虚拟环境内一站式部署PyTorch GPU开发栈

Yolov5 + Deepsort 实战：从零构建自定义多目标追踪系统（避坑指南）

HarmonyOS6 ArkTS CheckboxGroup

科研图表制作的革命：如何用3000+矢量图标库彻底改变你的学术可视化体验

从Copilot到CodeWhisperer，智能生成代码的依赖熵增问题全解析，Google/微软内部治理白皮书首度公开

KS-Downloader：专业级快手无水印视频下载解决方案