无人机航拍建筑物识别航拍建筑物分割数据集 AI模型

发布时间：2026/6/24 10:10:06

无人机航拍数据集建筑物分割项目基本信息项目名称Buildings_Recognition建筑物识别项目性质基于深度学习的建筑物分割系统使用PyTorch框架和U-Net架构实现。主要功能从航拍或卫星图像中精确分割出建筑物区域。项目来源源于【AI入门系列】地球观察员建筑物识别学习赛。核心特点使用EfficientNet-B4作为编码器的U-Net模型兼顾精度和效率。实现RLE游程编码格式的编解码优化存储和传输效率。包含完整的数据增强流水线提升模型泛化能力。采用Dice系数作为评估指标更适合分割任务。实现早停机制防止过拟合并节省训练时间。数据集相关数据集内容经过data.ipynb处理train/训练集图像JPG格式。train.csv训练集标签包含图像文件名和RLE编码的建筑物mask。test/测试集图像。test.csv测试集标签。数据格式要求图像尺寸建议为512x512像素。标签使用RLE编码存储空字符串表示无建筑物。文件路径使用制表符分隔。数据集下载提供原始数据Buildings_Recognition-origin和处理后数据Buildings_Recognition-processed的下载链接。文件夹结构Building ├── data.ipynb # 数据预处理和分析文件 ├── data\ # 数据文件夹 ├── README-data.md # 数据集说明文档 ├── data1\ # 原始数据文件夹 ├── images\ # README-data图像文件夹 ├── test.csv # 测试集CSV文件 ├── test\ # 测试集图像文件夹 ├── 006TE20QA8.jpg # 测试图像文件 ... ├── test_a\ # 测试集A文件夹 ├── train.csv # 训练集CSV文件 ├── train\ # 训练集图像文件夹 └── train_mask.csv # 原始训练集mask的RLE编码文件 ├── log\ # 训练日志文件夹 ├── output\ # 输出文件夹 ├── model\ # 模型文件 └── pic\ # 结果图片 ├── predict.py ├── requirements.txt ├── train.py └── README.md功能实现逻辑数据预处理BuildingDataset类自动处理文件名大小写问题、自动添加文件扩展名、处理缺失文件情况创建空白图像、将RLE解码转换为二值mask。数据增强随机水平/垂直翻转、随机旋转90度、随机亮度/对比度调整、标准化处理使用ImageNet均值方差。模型架构U-Net with EfficientNet-B4编码器部分使用预训练的EfficientNet-B4解码器部分实现标准的U-Net结构输出单通道logits。训练流程损失函数Dice Loss直接从logits计算。优化器Adamlr0.001。早停机制验证集Dice系数连续5个epoch不提升则停止。模型保存保存验证集表现最好的模型。评估指标Dice系数衡量预测mask与真实mask的重叠程度、可视化展示原图、真实mask和预测mask的对比。快速开始安装依赖pip install -r requirements.txt。训练模型python train.py。配置参数在train.py中修改BATCH_SIZE批次大小默认8。LR学习率默认0.001。EPOCHS最大训练轮数默认50。PATIENCE早停耐心值默认5。结果展示项目使用Kaggle平台提供的GPU P100进行训练包含最优模型结果、训练损失记录以及随机选取样本的预测测试结果以图片形式展示。其他信息编程语言占比Jupyter Notebook占95.0%Python占5.0%。版本发布未发布任何版本。软件包未发布任何软件包。

相关新闻