【飞桨常规赛】GAMMA中央凹检测 11月第2名方案
更新时间:2025-11-01 09:08:25
【飞桨常规赛】GAMMA中央凹检测 11月第2名方案
本文聚焦于GAMMA挑战赛中的黄斑中央凹定位任务。我们利用中山大学提供的眼底彩照样本(用于训练、用于测试)。采用了Unet与热力图相结合的方法,通过交叉验证训练了模型,并取平均预测结果。在训练过程中,引入了损失函数中的方差奖励机制,以提升算法的收敛速度和准确度。最终,最高得分达到了
常规赛:黄斑中央凹定位(GAMMA挑战赛任务二)
赛题介绍
一、赛题背景
除了视盘,眼底的重要结构还包括黄斑。位于视盘颞侧m处并略下方,位于人眼光学中心区。其核心是一个略微凹陷的区域,称为中央凹,是视力最敏锐的地方。因此,精确定位中央凹对于眼底疾病的自动化诊断至关重要。
二、比赛链接
https://aistudio.baidu.com/aistudio/competition/detail/120/0/introduction
三、赛题任务
根据给定眼底图像彩照,预测中央凹在图像中的坐标值(十字中心坐标)。下图为模型预测结果。
四、数据说明
本常规赛数据集由广州中山大学中山眼科中心提供,涵盖眼底彩照样本,分为训练集和测试集。
常规赛训练集包含样本,分别编号为每个样本对应一张眼底彩色照片数据,其文件名为jpg等。黄斑中央凹定位的金标准信息则存放在Excel表格中,第一列标记着图像名称,第二列为x坐标位置,第三列为y坐标位置。
五、评价指标
评价指标Evaluation Metrics
平均欧式距离(AED):衡量黄斑中央凹定位精度的新指标平均欧式距离(Average Euclidean Distance, AED)是评估黄斑中央凹定位结果的重要指标。它通过计算每个测试样本预测的坐标与金标准之间的欧式距离,并将这些距离的平均值来表示定位的准确性。最后,任务得分即为平均欧式距离的倒数,这是一个简明且直观的评价方法,帮助我们量化和改进黄斑中央凹定位技术的效果。
六、比赛思路
通过对所有图片进行翻转并调整尺寸为在中央凹的位置进行坐标统计分析发现位置集中在(范围内。为了更精确地定位,本项目采用了Unet结合heatmap的方式来进行精确定位。在训练过程中,由于使用resnet接fc层直接回归位置缺乏空间泛化能力,本项目决定采用上述方法以提高模型的准确性和泛化能力。可以参考链接:https://zhuanlan.zhihu.com/p/了进一步验证模型效果并确保每个训练样本对最终预测结果的贡献,采用了交叉验证分别训练模型,并取这模型的平均作为最终的预测结果。为提高热力图的最大值(,加快了模型的收敛速度。在损失函数中添加方差奖励项,使模型输出集中在特定区域内,进一步提升模型性能。
模型效果展示
左侧为模型预测热力图,右侧为原图与十字中心对比。观察发现,热力图主要分布在中央凹区域。
获取数据集,解压数据,获取预训练模型,代码包
In []
获取数据集,请下载 https://dataset-bj.cdn.bcebos.com/%E%BB%EEAF%EB/taskFovea_localization.zip 并解压至/data文件夹。导入所需模块并创建模型存储目录,使用 !unzip命令下载炼好的模型,并将其解压到 ./model 目录。
代码部分
一、导入基本模块
In [1]
#导入相关包,函数from work.my_func.data_process import transfer_img_location,get_gauss_map,dark_kernel_processfrom work.my_func.data_info import train_lr,train_size,test_lr,test_size,get_img_pathfrom work.my_func.model import Unetimport paddleimport paddle.nn as nnimport paddle.nn.functional as Ffrom paddle.io import Dataset,DataLoaderfrom paddle.nn import Linear,Dropout,BatchNorm1Dimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport randomimport warningsfrom PIL import Image# 忽略警告输出warnings.filterwarnings("ignore") paddle.set_device('gpu') paddle.disable_static()登录后复制
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib/__init__.py:107: DeprecationWarning: Using or importing the ABCs from 'collections' instead of from 'collections.abc' is deprecated, and in 3.8 it will stop working from collections import MutableMapping /opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib/rcsetup.py:20: DeprecationWarning: Using or importing the ABCs from 'collections' instead of from 'collections.abc' is deprecated, and in 3.8 it will stop working from collections import Iterable, Mapping /opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib/colors.py:53: DeprecationWarning: Using or importing the ABCs from 'collections' instead of from 'collections.abc' is deprecated, and in 3.8 it will stop working from collections import Sized登录后复制
二、数据分析
In [5]
在训练数据上,根据给定的位置进行转换得到的x坐标和y坐标波动范围分别是中央凹处的分布情况如下。
x的波动范围:487.3958480000001 y的波动范围:282.36016400000017 x的中值:1139.385184 y的中值:1038.351979 中央凹分布如下登录后复制
<Figure size 432x288 with 1 Axes>登录后复制
三、构建训练数据集
In [2]
#列表乱序,随机切分数据集random.seed(1024) all_data = [i for i in range(100)] random.shuffle(all_data)class TrainData(Dataset): def __init__(self,fold_num): #传入折数,1,2,3,4,5其中一个 super(TrainData,self).__init__() self.num_samples = 80 self.fold_num = fold_num self.sample_list = list(set(all_data) - set(all_data[(self.fold_num-1)*20:(self.fold_num-1)*20+20])) #获取训练数据样本id def __getitem__(self, index): #读取图片和标签 index = self.sample_list[index] img,location = transfer_img_location(index,lr=train_lr[index],size=train_size[index],mode='train') #加载图片,位置 #以中央凹为中心,对图片做随即平移,防止网络只输出一个常量 #由于在训练时,每次看到的图片都不一样(平移量不一样),所以训练的epoch要多一点100或200轮 x,y = location x,y = int(x),int(y) move_x = random.randint(-240,240) move_y = random.randint(-180,180) x = x + move_x y = y + move_y img = img[:,x-304:x+304,y-200:y+200] #转换输出类型为np.array,'float32' features = np.array(img).astype('float32') labels = np.array(get_gauss_map((304-move_x,200-move_y),sigma=1,r=80)).astype('float32') #标签是热力图的形式 return features,labels def __len__(self): return self.num_samples登录后复制
四、定义模型评估方法
In [3]
#epoch:训练轮次,方便模型命名#train_size:计算归一化欧式距离#model:评估的模型#fold_num:与训练数据集相对应,使用剩下的20个样本进行评估#visual_avalible:是否可视化模型输出与输入图片,默认为Falsedef evaluation(epoch,train_size,model,fold_num,visual_avalible=False): model.eval() ED = 0 #归一化欧氏距离 valid_sample = all_data[(fold_num-1)*20:(fold_num-1)*20+20] for index in valid_sample: #加载数据,标签 img,location = transfer_img_location(index,lr=train_lr[index],size=train_size[index],mode='train') img = img[:,836:1444,840:1240] features = np.array(img).astype('float32') labels = np.array(get_gauss_map(location)).astype('float32') #模型预测 features = paddle.to_tensor([features]) pre = model(features)[0].numpy() #由于模型极少情况下预测的热力图是空白,因此分类讨论输出 if np.sum(pre) < 1000: pre_x,pre_y = 304+80,200+40 else: pre_x,pre_y = dark_kernel_process(pre[0]) #效果最好 #计算ED x,y = np.array(location) - np.array([836,840]) if train_size[index] == 1: ED = ED + (((pre_x - x)/2992)**2 + ((pre_y - y)/2000)**2)**(1/2) else: ED = ED + (((pre_x - x)/1956)**2 + ((pre_y - y)/1934)**2)**(1/2) #可视化模型输出与输入图片 if visual_avalible: print('第{}张图片'.format(index+1)) plt.subplot(121) plt.imshow(pre[0].transpose(1,0)) plt.subplot(122) plt.imshow(img.transpose(2,1,0)) plt.show() ED = ED / 20 print('epoch:{},ED:{}'.format(epoch,ED)) #对效果较好的模型进行保存 if ED < 0.009: paddle.save(model.state_dict(), 'model/model{}_ED{}.pdparams'.format(fold_num,ED)) #保存模型参数 model.train()登录后复制
五、定义动态图训练过程
In [4]
#传入三个参数model,opt,fold_num#建议使用GPU32G环境运送此项目def train(model,opt,fold_num,EPOCH_NUM=200,visual_avalible=False): #加载预训练模型再训练时,可将此处设置为100 use_gpu = True paddle.set_device('gpu:0') if use_gpu else paddle.set_device('cpu') model.train() for epoch_id in range(EPOCH_NUM): for batch_id,data in enumerate(train_loader()): #读取数据 features,labels = data features = paddle.to_tensor(features) labels = paddle.to_tensor(labels) #前向传播 predicts = model(features) #使用均方误差,同时增加了对模型方差的控制,希望模型的预测热力图能集中在一个区域,因此需要增加方差,在代价函数中采用-0.0005的系数 loss = F.square_error_cost(predicts,labels) - 0.0005 * paddle.var(predicts) #反向传播 avg_loss = paddle.mean(loss) avg_loss.backward() #更新参数 opt.step() #变量梯度清0 opt.clear_grad() #打印损失 if batch_id % 3 == 0: print('epoch_id:{},loss:{}'.format(epoch_id,avg_loss.numpy())) evaluation(epoch_id,train_size,model,fold_num,visual_avalible=visual_avalible) #需要可视化时,添加visual_avalible=True登录后复制
六、训练模型并保存
In []
由于训练每个模型需要以上显存,因此训练好一个模型之后,请重启内核再训练下一个模型。为防止显存溢出,请确保显存充足或使用更高效的计算工具。#加载模型model = Unet#加载预训练模型,预训练模型是在样本上进行的训练layer_state_dict = paddle.load("model/model_epochbatchloss[.pdparams")model.set_state_dict(layer_state_dict)#定义优化器opt = paddle.optimizer.Adam(learning_rate=-parameters=model.parameters,weight_decay=paddle.regularizer.Lecay(coeff=)#定义fold_num,从训练五个模型fold_num = train_data = TrainData(fold_num) train_loader = DataLoader(train_data,batch_size=shuffle=True,drop_last=False) #batch_size不要过大#模型训练train(model,opt,fold_num,EPOCH_NUM=visual_avalible=False)登录后复制
七、加载全部模型进行预测并提交结果
In [2]
通过加载预训练模型并将其状态字典从文件中加载到内存,我们成功地创建了五个用于图像处理任务的UNet实例。这些模型经过优化和评估阶段以确保它们能正确执行预测任务。在接下来的部分中,我们将载入一系列测试数据,并使用不同热力图特征对每个模型进行预测。通过比较原始坐标和黑核搜索得到的结果,我们可以评估每个热力图的准确性。最终结果将被记录下来并存储为CSV文件,用于分析图像处理性能指标。
W1208 23:56:22.475440 6042 device_context.cc:447] Please NOTE: device: 0, GPU Compute Capability: 7.0, Driver API Version: 10.1, Runtime API Version: 10.1 W1208 23:56:22.481185 6042 device_context.cc:465] device: 0, cuDNN Version: 7.6.登录后复制
解算开始... 图片:101,预测结果:[1508.0, 1040.6] 图片:102,预测结果:[1476.0, 1045.4] 图片:103,预测结果:[1467.2, 1061.8] 图片:104,预测结果:[1470.8, 1019.0] 图片:105,预测结果:[1690.8, 1078.2] 图片:106,预测结果:[1693.2, 1083.4] 图片:107,预测结果:[726.4000000000001, 1015.5999999999999] 图片:108,预测结果:[1494.8, 1057.0] 图片:109,预测结果:[1687.2, 1095.4] 图片:110,预测结果:[1446.0, 1080.2] 图片:111,预测结果:[1674.0, 1085.8] 图片:112,预测结果:[1472.0, 1037.0] 图片:113,预测结果:[1442.8, 1097.4] 图片:114,预测结果:[1451.6, 1011.4000000000001] 图片:115,预测结果:[1468.0, 1033.4] 图片:116,预测结果:[1246.4, 1103.8] 图片:117,预测结果:[680.4000000000001, 999.2] 图片:118,预测结果:[1489.2, 1035.0] 图片:119,预测结果:[1692.8, 1090.2] 图片:120,预测结果:[1683.6, 1102.6] 图片:121,预测结果:[1463.2, 1051.4] 图片:122,预测结果:[1260.4, 1100.6] 图片:123,预测结果:[1488.8, 1033.0] 图片:124,预测结果:[1467.2, 1038.2] 图片:125,预测结果:[1690.8, 1063.4] 图片:126,预测结果:[1257.2, 1121.4] 图片:127,预测结果:[1288.4, 1205.8] 图片:128,预测结果:[1389.2, 1034.2] 图片:129,预测结果:[1532.0, 1056.6] 图片:130,预测结果:[1476.0, 1052.2] 图片:131,预测结果:[1496.0, 1008.2] 图片:132,预测结果:[1466.4, 1072.6] 图片:133,预测结果:[1483.2, 1056.2] 图片:134,预测结果:[1546.8, 1030.6] 图片:135,预测结果:[1266.0, 1101.8] 图片:136,预测结果:[1513.6, 1032.2] 图片:137,预测结果:[750.8, 1011.5999999999999] 图片:138,预测结果:[1506.0, 1021.8] 图片:139,预测结果:[1446.0, 1067.0] 图片:140,预测结果:[1550.4, 1056.6] 图片:141,预测结果:[1303.2, 1085.0] 图片:142,预测结果:[1239.2, 1093.8] 图片:143,预测结果:[1458.4, 1055.4] 图片:144,预测结果:[1481.6, 1059.4] 图片:145,预测结果:[1480.4, 1047.0] 图片:146,预测结果:[1486.0, 1042.6] 图片:147,预测结果:[1678.4, 1094.6] 图片:148,预测结果:[1514.0, 1043.8] 图片:149,预测结果:[1496.0, 1041.4] 图片:150,预测结果:[1452.4, 1015.0] 图片:151,预测结果:[1688.8, 1097.4] 图片:152,预测结果:[1244.8, 1093.0] 图片:153,预测结果:[1441.6, 1033.0] 图片:154,预测结果:[1239.6, 1087.4] 图片:155,预测结果:[1509.2, 1025.8] 图片:156,预测结果:[1466.4, 1053.0] 图片:157,预测结果:[1468.0, 1029.8] 图片:158,预测结果:[1252.8, 1126.6] 图片:159,预测结果:[1554.8, 1035.8] 图片:160,预测结果:[661.5999999999999, 997.5999999999999] 图片:161,预测结果:[1276.4, 1093.8] 图片:162,预测结果:[1478.0, 1049.0] 图片:163,预测结果:[1258.4, 1100.6] 图片:164,预测结果:[1488.8, 1042.2] 图片:165,预测结果:[1680.4, 1104.2] 图片:166,预测结果:[1669.2, 1085.0] 图片:167,预测结果:[1252.4, 1111.0] 图片:168,预测结果:[1255.2, 1095.8] 图片:169,预测结果:[1436.0, 1034.6] 图片:170,预测结果:[1456.8, 1043.4] 图片:171,预测结果:[1824.0, 999.8] 图片:172,预测结果:[1468.4, 1067.0] 图片:173,预测结果:[1690.4, 1099.4] 图片:174,预测结果:[1442.8, 1023.4000000000001] 图片:175,预测结果:[1296.0, 1097.4] 图片:176,预测结果:[1708.8, 1112.6] 图片:177,预测结果:[666.0, 1018.0] 图片:178,预测结果:[1694.4, 1078.6] 图片:179,预测结果:[1348.0, 1107.8] 图片:180,预测结果:[1429.6, 1029.0] 图片:181,预测结果:[1268.4, 1100.2] 图片:182,预测结果:[1474.8, 1030.6] 图片:183,预测结果:[714.8, 1008.0] 图片:184,预测结果:[1502.4, 1043.0] 图片:185,预测结果:[1418.0, 1007.4000000000001] 图片:186,预测结果:[1317.6, 1044.6] 图片:187,预测结果:[1444.4, 1008.2] 图片:188,预测结果:[1272.0, 1108.2] 图片:189,预测结果:[1246.0, 1103.8] 图片:190,预测结果:[1510.4, 1045.8] 图片:191,预测结果:[1457.6, 1042.2] 图片:192,预测结果:[1691.2, 1095.0] 图片:193,预测结果:[714.0, 1002.4000000000001] 图片:194,预测结果:[1458.0, 1073.0] 图片:195,预测结果:[1469.6, 1041.4] 图片:196,预测结果:[1498.8, 1032.2] 图片:197,预测结果:[1318.4, 1109.0] 图片:198,预测结果:[1606.8, 1042.6] 图片:199,预测结果:[1468.8, 1043.8] 图片:200,预测结果:[1472.8, 1059.4] 解算完毕...登录后复制
以上就是【飞桨常规赛】GAMMA中央凹检测 11月第2名方案的详细内容,更多请关注其它相关文章!

