基于飞桨框架2.1实现U-Net与PSPNet图像分割算法对路面分割

更新时间：2026-02-15 11:29:59

爱情和生活模拟rpg手机版

类型：体育竞技
大小：87.5mb
语言：简体中文
评分：

查看详情

基于飞桨框架2.1实现U-Net与PSPNet图像分割算法对路面分割

本文基于飞桨框架使用RTK数据集（包含地物）实现U-Net与PSPNet路面分割。介绍了数据集的准备、训练/测试集的定义以及构建了包括编码器解码器在内的U-Net及具有backbone等特征的PSPNet模型。在经过训练后的预测中，U-Net的准确率为，IOU值为，表现出色，优于PSPNet，并通过可视化展示了结果对比。

基于飞桨框架2.1实现U-Net与PSPNet图像分割算法对路面分割

使用数据集介绍不依赖于营教程提供的特定资源，我们当前使用的数据集是Road Traversing Knowledge (RTK) Dataset。以下是该数据集的详细信息：特点：该数据集包含了由低成本相机（HP Webcam HD-拍摄的图像，包括各种路面类型：沥青变化、未铺装路面、不同路面类型的混合以及道路损坏情况如坑洞。标签对应表：类别序号背景青路面装路面铺装路面路标线速带眼渠丁坑洞缝如，样本图像示例如下：图背景（图沥青路面（图铺装路面（图未铺装路面（图道路标线（图减速带（图猫眼（图沟渠（图补丁（图水坑（图坑洞（图裂缝（

在训练中使用围内的掩膜图像为标签。右图仅用于展示目的；此数据集包含地物类型，不包括背景。

一、数据集准备

In []

# 解压文件到数据集的文件夹!mkdir work/dataset !unzip -q data/data71331/RTK_Segmentation.zip -d work/dataset/ !unzip -q data/data71331/tests.zip -d work/dataset/登录后复制 In []

# 新建验证集的文件夹!mkdir work/dataset/val_frames !mkdir work/dataset/val_colors !mkdir work/dataset/val_masks登录后复制 In []

# 将数据随机抽50张移动到作为验证集import osimport shutilimport redef moveImgDir(color_dir, newcolor_dir, mask_dir, newmask_dir, frames_dir, newframes_dir): filenames = os.listdir(color_dir) filenames.sort() for index, filename in enumerate(filenames): src = os.path.join(color_dir,filename) dst = os.path.join(newcolor_dir,filename) shutil.move(src, dst) # colors 文件夹中的文件名多了GT，所以要去掉 new_filename = re.sub('GT', '', filename) src = os.path.join(mask_dir, new_filename) dst = os.path.join(newmask_dir, new_filename) shutil.move(src, dst) src = os.path.join(frames_dir, new_filename) dst = os.path.join(newframes_dir, new_filename) shutil.move(src, dst) if index == 50: breakmoveImgDir(r"work/dataset/colors", r"work/dataset/val_colors",r"work/dataset/masks", r"work/dataset/val_masks",r"work/dataset/frames", r"work/dataset/val_frames")登录后复制 In []

# 查看mask图像和color图像之间的标签映射, 并保存成json文件import osimport cv2import numpy as npimport reimport json labels = ['Background', 'Asphalt', 'Paved', 'Unpaved', 'Markings', 'Speed-Bump', 'Cats-Eye', 'Storm-Drain', 'Patch', 'Water-Puddle', 'Pothole', 'Cracks'] label_color_dict = {} mask_dir = r"work/dataset/masks"color_dir = r"work/dataset/colors"mask_names = [f for f in os.listdir(mask_dir) if f.endswith('png')] color_names = [f for f in os.listdir(color_dir) if f.endswith('png')]for index, label in enumerate(labels): if index>=8: index += 1 for color_name in color_names: color = cv2.imread(os.path.join(color_dir, color_name), -1) color = cv2.cvtColor(color, cv2.COLOR_BGR2RGB) mask_name = re.sub('GT', '', color_name) mask = cv2.imread(os.path.join(mask_dir, mask_name), -1) mask_color = color[np.where(mask == index)] if len(mask_color)!= 0: label_color_dict[label] = list(mask_color[0].astype(float)) breakwith open(r"work/dataset/mask2color.json", "w", encoding='utf-8') as f: # json.dump(dict_, f) # 写为一行 json.dump(label_color_dict, f, indent=2, sort_keys=True, ensure_ascii=False) # 写为多行登录后复制

二、数据集类定义（训练集、测试集）

1.数据转换

本节旨在展示如何对图像数据进行预处理，以增强训练过程中的泛化能力。我们将专注于数据变换部分，这是为了便于读取并准备训练数据时的调整。通过旋转、填充、中心裁剪以及标准化等操作，可以有效地增加数据多样性，并进一步提高模型在分割任务上的表现。实现代码将位于文件`work/Classdata_transform.py`中，提供了一系列实用的方法来处理图像数据。这些方法包括但不限于： - 数据变换：如旋转图像以避免过拟合。 - 填充空白边缘以确保数据的一致性。 - 中心裁剪技术用于获取更精确的特征提取。 - 标准化处理，即将像素值缩放到间的范围。通过这些步骤，我们不仅能够有效训练模型，还能显著提升其在实际应用中的表现。

2.训练集类与测试集类定义

在读取图像数据时进行转换操作时，对于训练集类的操作频率较高，而测试集类则需要额外的缩放和标准化处理。训练集类负责读取并返回经过转换的数据及其标签，数据和标签后缀均为.png格式；相比之下，测试集类除了提供数据和标签外，还包含相应的路径信息，便于后续进行可视化展示。

# 数据集类定义前置工作import osimport numpy as npimport cv2import paddlefrom paddle.io import Dataset, DataLoaderfrom work.Class3.data_transform import Compose, Normalize, RandomSacle, RandomFlip,ConvertDataType,Resize IMG_EXTENSIONS = ['.jpg', '.JPG', '.jpeg', '.JPEG', '.png', '.PNG', '.ppm', '.PPM', '.bmp', '.BMP']def is_image_file(filename): return any(filename.endswith(extension) for extension in IMG_EXTENSIONS)def get_paths_from_images(path): """get image path list from image folder""" assert os.path.isdir(path), '{:s} is not a valid directory'.format(path) images = [] for dirpath, _, fnames in sorted(os.walk(path)): for fname in sorted(fnames): if is_image_file(fname): img_path = os.path.join(dirpath, fname) images.append(img_path) assert images, '{:s} has no valid image file'.format(path) return images登录后复制 In [3]

训练集类：BasicDataset，读取.png格式图像及其标签，并进行预处理。

# 测试集类定义class Basic_ValDataset(Dataset): ''' 需要读取数据并返回转换过的数据、标签以及图像数据的路径 ''' def __init__(self, image_folder, label_folder, size): super(Basic_ValDataset, self).__init__() self.image_folder = image_folder self.label_folder = label_folder self.path_Img = get_paths_from_images(image_folder) if label_folder is not None: self.path_Label = get_paths_from_images(label_folder) self.size = size self.transform = Compose( [Resize(size), ConvertDataType(), Normalize(0,1) ] ) def preprocess(self, data, label): h,w,c=data.shape h_gt, w_gt=label.shape assert h==h_gt, "error" assert w==w_gt, "error" data, label=self.transform(data, label) label=label[:,:,np.newaxis] return data, label def __getitem__(self,index): Img_path, Label_path = None, None Img_path = self.path_Img[index] Label_path = self.path_Label[index] data = cv2.imread(Img_path , cv2.IMREAD_COLOR) data = cv2.cvtColor(data, cv2.COLOR_BGR2RGB) label = cv2.imread(Label_path, cv2.IMREAD_GRAYSCALE) data,label = self.preprocess(data, label) return {'Image': data, 'Label': label, 'Path':Img_path} def __len__(self): return len(self.path_Img)登录后复制 In [8]

# 数据集类的测试，看是否能正常工作%matplotlib inlineimport matplotlib.pyplot as plt paddle.device.set_device("cpu")with paddle.no_grad(): dataset = BasicDataset("work/dataset/frames", "work/dataset/masks", 256) dataloader = DataLoader(dataset, batch_size = 1, shuffle = True, num_workers = 0) for index, traindata in enumerate(dataloader): image = traindata["Image"] image = np.asarray(image)[0] label = traindata["Label"] label = np.asarray(label)[0] print(image.shape, label.shape) plt.subplot(1,2,1), plt.title('frames') plt.imshow(image), plt.axis('off') plt.subplot(1,2,2), plt.title('label') plt.imshow(label.squeeze()), plt.axis('off') plt.show() print(50*'*') if index == 5: break登录后复制

(256, 256, 3) (256, 256, 1)登录后复制