Skip to content

Barak123748596/CVDL_course_project

Repository files navigation

CVDL_course_project

A CVPR PKU course project

内容:遥感图像分割

任务说明

  • 任务是遥感图像的分割。
  • 目前所用模型是U-Net (arXiv:1505.04597, 2015)和 Hourglass (arXiv:1603.06937, 2016)。
  • 数据集地址在这里,训练集和测试集分别包含了五个城市的卫星照片。
  • 初始阶段只区分每个像素是否属于建筑物,属于二分类问题。
  • 希望后续能够挑战更复杂的数据集,终极目标是使深度学习技术服务于农业用地的监测。

目标计划

  • 在INRIA的数据集上达到不错的结果。
  • 找到国土规划局的土地规划方案,利用模型将其与中国目前的遥感卫星图片做对比,试图找出违反了规划要求的地方,标出地理位置和挪用土地面积。
  • 写报告、做ppt…

已成工作

  • 样本大小由400x400改为320x320。(已做)
  • 做一下正负样本均衡,或者采用更简单的方法——修改loss函数。(已做)
  • 模型loss的可视化做得不是特别好,cuda还存在因为memory不够而导致程序崩溃的问题,修改。(已做)
  • 尝试多个U-Net堆叠,观察训练结果的变化。(先用两个做实验)(已做)
  • 目前已经训练了几个模型,效果还有待提高(一层模型欠拟合,两层堆叠会产生过拟合)
  • 设计算法可以由网络预测结果得到的概率图得到方框的算法,可以在未来grabcut中使用(但是grabcut所需要时间过多,可能效果不好)
  • 通过CRF算法对网络模型预测结果进行修正,可以将部分误判结果修正掉,效果还挺好看的,大致如图:CRF
  • 目前找到了北京市等地的农田规划图,同时可以通过水经注万能地图下载器下载谷歌地图得到0.3米/像素的地图图片。北京农田规划

现存问题

  • 估计简单用U-Net分割效果不会特别好,之后很可能还要改进。
  • 关于国土规划分布的工作还没有开展。目前要求不高,不需要上来就全国,从某个地方区县开始就可以。主要是希望证明“能做”。

阶段任务

  • 需要设计算法将北京市得农田规划转换为是否应该有建筑的二维矩阵
  • 完成小组报告大纲
  • 做PPT等演讲必备
  • 图片后处理
  • 相关国内地图下载
  • 在有一定的准确率后,我们打算借鉴一下DeepLab,用空洞卷积来搭建网络,然后借助Graphcut算法进行后处理。(未做)

下阶段任务

  • 想办法处理诸如“船只”、“大汽车”等经典误判。
  • 找到别的数据集,想办法多分类(最多5即可)。

最后任务

  • 找到办法,针对每一个切割成320*320的小图片,其面积大于一定大小(针对误判情况设置)时,设定其位置存在房屋。对这张图片进行标记找到对应的规划图矩阵进行比对,然后输出“不合格”的情况。
  • 具体例子可以用之前的数据集(例如Austin),自己手动设置一个区域不能有房子做实验。查看效果如何。
  • 改报告。

About

A CVPR PKU course project

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published